Implementasi Sequence Alignment Pada Lingkungan Spark - Hadoop Berbasis Single Node

Bernadheta Ayu Putri Mardika, Setyorini Setyorini, Siti Amatullah Karimah

Abstract

Abstrak
BLAST (Basic Local Alignment Search Tool) adalah algoritma yang paling umum dipakai untuk
pencocokan sekuensi rantai DNA dari specimen organik, NCBI merupakan salah satu badan yang
menangani penyimpanan dataset dan mempergunakan algoritma tersbut, akan tetapi pada umumnya
pencacahan akan memakan energi dan waktu komputasi yang cukup besar jika diaplikasikan dalam
dataset dengan jumlah besar. melakukan optimasi algoritma yang bersifat universal dapat mengubah
standarisasi dalam bioinformatika, oleh karena itu optimasi dilakukan di ranah perangkat keras,
pemrosesan dan manajemen database. Pada penelitian ini dikaji penggunaan NCBI BLAST yang
dijalankan di platform Apache Spark dengan manajemen pemrosesan dataset Apache Hadoop sebagai
langkah optimasi pemrosesan pencacahan pencarian sekuensi data protein nukleutida dari specimen
organic dari query. Dari hasil kajian ini menunjukkan waktu pemrosesan yang tidak terpengaruh dari
banyaknya karakter pencarian, kemudian data sekuens yang acak dan rusak masih tetap dapat dicocokkan
dengan baik.
Kata Kunci: BLAST, Apache spark,Hadoop
Abstract
BLAST (Basic Local Alignment Search Tool) is the most commonly used algorithm for matching DNA chain
sequences of organic specimens, NCBI is one of the institution that handle dataset storage and use the
algorithm, but in general the enumeration will take a considerable amount of energy and computational
time if applied in a large number of datasets. doing algorithm optimization that is universal can change the
standardization in bio informatics, therefore optimization is carried out in hardware, processing and
database management. In this study, NCBI BLAST was reviewed by Apache Spark platform with Apache
Hadoop dataset processing management as an optimization step to optimize the processing of nucleutide
protein data sequential search from organic specimens from queries. From the results of this study shows
the unaffected processing time of the number of search characters, then the random and damaged sequence
data can still be matched well.
Keyword: BLAST, Apache spark,Hadoop

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0