Model Komputasi Blast Pada Lingkungan Hadoop

Devina Adinda Hartono, Setyorini Setyorini, Siti Amatullah Karimah

Abstract

Abstrak
Mencari kemiripan pada sequence DNA, RNA atau protein dalam disiplin ilmu Bioinformatika bermanfaat
untuk menemukan hubungan struktur, fungsi dan evolusi antar organisme. BLAST merupakan perangkat
analisa kemiripan sequence biologi yang membandingkan satu sequence terhadap kumpulan sequence
dalam suatu basis data dengan komputasi dilakukan secara berpasangan untuk semua sequence.
Peningkatan koleksi sequence dalam basis data dapat memperpanjang proses pencarian similaritasnya.
Hadoop Mapreduce digunakan sebagai framework komputasi yang dapat meningkatkan performa
komputasi BLAST karena pada prinsipnya operasi perbandingan berpasangan adalah saling independen
sehingga bisa diparalelkan. Tugas Akhir ini mengukur tingkat efisiensi komputasi BLAST dengan
memanfaatkan framework hadoop. Hasil penelitian menunjukan Basic Local Alignment Search Tool
(BLAST) yang dibangun pada Hadoop berturut-turut terjadi percepatan dan cluster hadoop dengan 3 node
33x lebih cepat dibanding tanpa menggunakan Hadoop.
Kata kunci: Bioinformatika, BLAST, Sequence Alignment, Hadoop, Mapreduce
Abstract
Finds the region of similarity in DNA, RNA or protein sequence on Bioinformaticsis used to find structural,
functional and evolutionary relationships between organisms. BLAST is a biological sequence similarity
analysis tool that compares one sequence to a collection of sequences in the database with computations are
performed in pairs for all sequences. Sequence collection enhancement in the database can extend the
similarity search process. Hadoop Mapreduce is used as a computational framework that can improve
BLAST computing performance because in principle the pairwise comparison operation is independent so
that can be paralleled. This final project measure the potential for BLAST computational efficiency by
utilizing the hadoop framework. The results showed that the Basic Local Alignment Search Tool (BLAST)
built on was speedup and the Hadoop cluster with 3 nodes was 33 times faster than without using Hadoop.
Keywords: Bioinformatics, BLAST, Sequence Alignment, Hadoop, Mapreduce

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0