Implementasi Partial Least Square dan K-Nearest Neighbor - Support Vector Machines Untuk Klasifikasi Data Microarray

Penulis

  • A Rakha Ahmad Taufiq Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Annisa Aditsania Telkom University

Abstrak

Abstrak Kanker menjadi salah satu penyebab kematian paling banyak di dunia. Diperkirakan setiap tahun jumlahnya akan terus bertambah. Salah satu pendeteksiannya adalah menggunakan ekspresi gen. Microarray dapat mengoleksi kumpulan besar ekspresi gen dalam satu waktu, sehingga DNA microarray mempunyai karakteristik data tersendiri, yaitu mempunyai dimensi data yang sangat besar dibanding dengan jumlah datanya. Oleh karena itu, dibutuhkannya sistem untuk menyelesaikan masalah tersebut. Pada penelitian ini, dibangun sistem yang mengimplementasikan ekstraksi fitur Partial Least Square (PLS) dan metode klasifikasi K-Nearest Neighbor - Support Vector Machines (KNN-SVM). Ekstraksi fitur berguna untuk mengurangi dimensi microarray yang sangat besar dengan membentuk data baru yang merupakan representasi data asli. Performansi sistem diukur menggunakan akurasi. PLS berhasil menaikkan akurasi dari classifier KNN-SVM. Nilai akurasi tertinggi yang didapatkan oleh PLS KNN-SVM adalah sebesar 96.17% Kata kunci: k-nearest neighbor, support vector machines, partial least square, microarray. Abstract Cancer is one of the most common causes of death in the world. Estimated every year the number will continue to grow. One of the detection is using gene expression. Microarray can collect a large number of gene expression at the same time, DNA Microarray have their own data characteristic, which have a very large data dimension compared with the amount of data. Therefore, a system needed to solve the problem. In this research, we built a system that implements Partial Least Square (PLS) feature extraction and KNearest Neighbor - Support Vector Machines (KNN-SVM) for the classification. Feature extraction is useful for reducing very large dimension of microarray by forming new data. System performance is measured using accuracy. PLS managed to increase the accuracy of the KNN-SVM classifier. The highest accuracy obtained by PLS KNN-SVM is 96.17%. Keywords: k-nearest neighbor, support vector machines, partial least square, microarray

##submission.downloads##

Diterbitkan

2018-12-01

Terbitan

Bagian

Program Studi S1 Informatika