Analisis Perbandingan Reduksi Dimensi Principal Component Analysis (pca) Dan Partial Least Square (pls) Untuk Deteksi Kanker Menggunakan Data Microarray
Abstract
Abstrak
Menurut data WHO (World Health Organization) pada tahun 2015, 8.8 juta kematian diakibatkan oleh
kanker dimana angka kematian tersebut meningkat dan berkakibat fatal setiap tahunnya bila diagnosa
tidak dilakukan lebih dini. Oleh karena itu , tidak heran penelitian dalam bidang kanker menjadi topik
utama dalam penelitian di bidang medis dan bioinformatika dan terus berkembang hingga saat ini, termasuk
teknologi DNA microarray. Banyak cara untuk mendeteksi kanker, salah satunya adalah teknik
microarray. Microarray adalah teknologi yang mampu menyimpan ribuan ekspresi gen yang diambil dari
beberapa jaringan manusia sekaligus. Dikarenakan oleh record data microarray yang banyak, komputasi
yang dibutuhkan cukup berat. Untuk mengatasi masalah tersebut, dibutuhkan reduksi dimensi. Pada penelitian
ini, sistem menggunakan dua ï¬tur ekstrasi: Principal Component Analysis (PCA) dan Partial Least
Square (PLS) dengan Support Vector Machine (SVM) sebagai classiï¬er. Hal ini berguna untuk mengurangi
attribute yang terlalu banyak. Sistem yang dibangun mampu mengklasiï¬kasi kanker dan memperoleh nilai
rata-rata 82% dengan PCA-SVM dan 55.17% untuk PLS-SVM.
Kata kunci : kanker, microarray, principal component analysis, partial least square, support vector machine.
Abstract
According to WHO data in 2015 (World Health Organization), 8.8 million deaths were caused by cancer
where the mortality rate increased and was fatal every year if the diagnosis was not made earlier. Therefore,
it is not surprising that research in the ï¬eld of cancer has become a major topic in research in the medical
and bioinformatics ï¬elds and continues to grow to date, including DNA microarray technology. There are
many ways to detect cancer, one of which is the microarray technique. Microarray is a technology that
can store thousands of gene expressions taken from several human tissues at once. Due to a large number
of microarray data records, the computing required is quite heavy. To overcome this problem, dimension
reduction is needed. In this study, the system uses two extraction features: Principal Component Analysis
(PCA) and Partial Least Square (PLS) with Support Vector Machine (SVM) as a classiï¬er. This is useful
to reduce the large amount of attributes. The accuracy generated from this system averaged 82% with
PCA-SVM and 55.17% for PLS-SVM.
Keywords: cancer, microarray, principal component analysis, partial least square, support vector machine.