Analisis Pengaruh Metode Reduksi Dimensi Minimum Redundancy Maximum Relevance Pada Klasifikasi Kanker Berdasarkan Data Microarray Menggunakan Classifier Support Vector Machine
Abstrak
Kanker adalah salah satu penyebab utama kematian di seluruh dunia dengan total 8,8 juta orang meninggal akibat kanker di tahun 2015 [1]. Teknologi DNA microarray yang dikembangkan oleh Patrick O. Brown, Joseph DeRisi, dan David Botstein memungkinkan untuk mengamati beribu-ribu ekspresi gen dalam waktu bersamaan. Namun, permasalahan yang dihadapi terhadap penggunaan teknologi microarray ini adalah karakteristik data microarray yang memiliki dimensi yang besar. Dimensi yang besar ini akan berpengaruh terhadap performansi klasifikasi. Untuk menyelesaikan masalah tersebut, penelitian ini mengusulkan penggunaan Minimum Redundancy Maximum Relevance (MRMR) sebagai metode reduksi dimensi dan Support Vector Machine (SVM) sebagai classifier. Principal Component Analysis (PCA) juga digunakan sebagai perbandingan. MRMR adalah metode reduksi dimensi yang menyeleksi fitur berdasarkan nilai relevansi yang tinggi dan nilai redundansi yang rendah. Sedangkan PCA adalah metode yang mengektraksi fitur berdasarkan principal component yang diperoleh dari perhitungan nilai eigen dan vektor eigen. Data yang digunakan pada penelitian ini adalah data kanker usus besar, data kanker paru-paru, data kanker ovarium, dan data kanker leukemia. Hasil pengujian pada data kanker paru-paru membuktikan bahwa sistem yang diusulkan dapat memberikan F1-score sebesar 1 dari penggunaan metode reduksi dimensi MRMR dan classifier SVM dengan fungsi kernel linear dan kernel polynomia, dengan jumlah fitur yang digunakan untuk klasifikasi adalah sebesar 10% dari jumlah fitur asli. Hal ini berarti akurasi dari klasifikasi adalah 100% dan performansi sistem yang dibangun sangatlah bagus.