Implementasi Sequence Alignment Pada Lingkungan Spark - Hadoop Berbasis Single Node

Authors

  • Bernadheta Ayu Putri Mardika Telkom University
  • Setyorini Setyorini Telkom University
  • Siti Amatullah Karimah Telkom University

Abstract

Abstrak BLAST (Basic Local Alignment Search Tool) adalah algoritma yang paling umum dipakai untuk pencocokan sekuensi rantai DNA dari specimen organik, NCBI merupakan salah satu badan yang menangani penyimpanan dataset dan mempergunakan algoritma tersbut, akan tetapi pada umumnya pencacahan akan memakan energi dan waktu komputasi yang cukup besar jika diaplikasikan dalam dataset dengan jumlah besar. melakukan optimasi algoritma yang bersifat universal dapat mengubah standarisasi dalam bioinformatika, oleh karena itu optimasi dilakukan di ranah perangkat keras, pemrosesan dan manajemen database. Pada penelitian ini dikaji penggunaan NCBI BLAST yang dijalankan di platform Apache Spark dengan manajemen pemrosesan dataset Apache Hadoop sebagai langkah optimasi pemrosesan pencacahan pencarian sekuensi data protein nukleutida dari specimen organic dari query. Dari hasil kajian ini menunjukkan waktu pemrosesan yang tidak terpengaruh dari banyaknya karakter pencarian, kemudian data sekuens yang acak dan rusak masih tetap dapat dicocokkan dengan baik. Kata Kunci: BLAST, Apache spark,Hadoop Abstract BLAST (Basic Local Alignment Search Tool) is the most commonly used algorithm for matching DNA chain sequences of organic specimens, NCBI is one of the institution that handle dataset storage and use the algorithm, but in general the enumeration will take a considerable amount of energy and computational time if applied in a large number of datasets. doing algorithm optimization that is universal can change the standardization in bio informatics, therefore optimization is carried out in hardware, processing and database management. In this study, NCBI BLAST was reviewed by Apache Spark platform with Apache Hadoop dataset processing management as an optimization step to optimize the processing of nucleutide protein data sequential search from organic specimens from queries. From the results of this study shows the unaffected processing time of the number of search characters, then the random and damaged sequence data can still be matched well. Keyword: BLAST, Apache spark,Hadoop

Downloads

Published

2021-02-01

Issue

Section

Program Studi S1 Informatika