Paralelisasi Klasifikasi Data Ekspresi Gen Kanker Dengan Algoritma Deep Neural Network Menggunakan Stacked Sparse Autoencoder

Authors

  • Aswindo Putra Telkom University
  • Jondri Jondri Telkom University
  • Fitriyani Fitriyani Telkom University

Abstract

Penelitian bidang bioinformatika menjadi populer saat ini sebagai solusi bagi dunia medis. Salah satunya klasifikasi penyakit kanker menggunakan data gene expression. Deep learning telah menjadi penelitian yang menarik pada bidang bioinformatika. Banyak penelitian tentang klasifikasi kanker yang diangkat menggunakan deep learning. Klasifikasi menggunakan data gene expression berguna di dunia medis. Karena dapat mengklasifikasikan penyakit hanya menggunakan gen. Penelitian ini mengangkat klasifikasi gene kanker menggunakan metode deep neural network dengan stacked spare autoencoder dan autoencoder sebagai metode extraksinya. Selain itu digunakan juga sparse autoencoder sebagai representasi dari pembelajaran neural network. Ini digunakan untuk mengurangi masalah saat pembelajaran. Fine-tune digunakan sebagai optimasi bobot dan bias untuk jaringan neural network dengan metode gradient descent. Pengklasifikasian hasil dari pembelajaran menggunakan softmax classifier. Data yang digunakan bersumber dari portal of National Center for Biotechnology Information. Jumlah dataset yang digunakan sebanyak 1065 sampel dari 8 kategori kelas untuk beberapa penyakit kanker dan non kanker. Dengan ini diperoleh hasil akurasi tertinggi 97,3 % untuk training dan 92,6 % untuk testing. Paralelisasi dari algoritma ini dapat bekerja dengan baik, dimana efesiensi terhadap waktu komputasi lebih cepat dengan speed up sekitar 13,03 terhadap komputasi sekuensial. Tentunya ini menjadi momentum untuk mengembangkan algoritma neural network lainnya dengan teknik paralelisasi.
Kata Kunci : Deep Learning, SSAE, Parallel Computing, High Performance Computing, Cancer Classification, gene expression

Nowadays, research in bioinformatics can be one of the popular researches for the medical professional researcher. One of them is the classification using data gene expression. Deep learning has become an interesting research in bioinformatics fields. Many kinds of research about cancer classification are appointed using deep learning. Classification using gene expression dataset is useful in the medical profession. Because it can classify diseases using gene only. This research raised the classification gene expression cancer using deep neural network with stacked sparse autoencoder and autoencoder as an extraction method. In addition, sparse autoencoder is also used as a represented of neural network learning. Fine tuning is used as weight and bias optimization for neural network with gradient descent method. Classification of the learning result using the softmax classifier. This research, the data is sourced from the portal of National Center for Biotechnology Information. With this obtained, the highest accuracy of 97.3% for training and 92,6 % for testing. Parallelization for this algorithm work quite well, this shows to the efficiency of the computation time is faster with speed up 000% for sequential computation. Of course, this research becomes the best moment for other neural network algorithm development with parallelism technique.

Keyword: Deep Learning, SSAE, Parallel Computing, High Performance Computing, Cancer Classification, gene expression

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Ilmu Komputasi