Model Komputasi Blast Pada Lingkungan Hadoop

Authors

  • Devina Adinda Hartono Telkom University
  • Setyorini Setyorini Telkom University
  • Siti Amatullah Karimah Divisi Digital Service PT Telekomunikasi Indonesia

Abstract

Abstrak Mencari kemiripan pada sequence DNA, RNA atau protein dalam disiplin ilmu Bioinformatika bermanfaat untuk menemukan hubungan struktur, fungsi dan evolusi antar organisme. BLAST merupakan perangkat analisa kemiripan sequence biologi yang membandingkan satu sequence terhadap kumpulan sequence dalam suatu basis data dengan komputasi dilakukan secara berpasangan untuk semua sequence. Peningkatan koleksi sequence dalam basis data dapat memperpanjang proses pencarian similaritasnya. Hadoop Mapreduce digunakan sebagai framework komputasi yang dapat meningkatkan performa komputasi BLAST karena pada prinsipnya operasi perbandingan berpasangan adalah saling independen sehingga bisa diparalelkan. Tugas Akhir ini mengukur tingkat efisiensi komputasi BLAST dengan memanfaatkan framework hadoop. Hasil penelitian menunjukan Basic Local Alignment Search Tool (BLAST) yang dibangun pada Hadoop berturut-turut terjadi percepatan dan cluster hadoop dengan 3 node 33x lebih cepat dibanding tanpa menggunakan Hadoop. Kata kunci: Bioinformatika, BLAST, Sequence Alignment, Hadoop, Mapreduce Abstract Finds the region of similarity in DNA, RNA or protein sequence on Bioinformaticsis used to find structural, functional and evolutionary relationships between organisms. BLAST is a biological sequence similarity analysis tool that compares one sequence to a collection of sequences in the database with computations are performed in pairs for all sequences. Sequence collection enhancement in the database can extend the similarity search process. Hadoop Mapreduce is used as a computational framework that can improve BLAST computing performance because in principle the pairwise comparison operation is independent so that can be paralleled. This final project measure the potential for BLAST computational efficiency by utilizing the hadoop framework. The results showed that the Basic Local Alignment Search Tool (BLAST) built on was speedup and the Hadoop cluster with 3 nodes was 33 times faster than without using Hadoop. Keywords: Bioinformatics, BLAST, Sequence Alignment, Hadoop, Mapreduce

Downloads

Published

2021-02-01

Issue

Section

Program Studi S1 Rekayasa Perangkat Lunak