Implementasi Minimum Redundancy Maximum Relevance Sebagai Teknik Reduksi Dimensi Pada Klasifikasi Kanker Usus Besar Menggunakan Random Forest

Authors

  • I.G.N.P.Vasu Geramona Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Widi Astuti Telkom University

Abstract

Abstrak Kanker merupakan penyakit yang mematikan. Mengutip informasi dari kementrian kesehatan Republik Indonesia pada tahun 2017 sembilan juta orang meninggal akibat kanker. Oleh sebab itu diperlukan sebuah metode untuk mendeteksi kanker salah satunya dengan gen expression. Microarray adalah salah satu teknik dari gen expression. Microarray sendiri memiliki feature yang banyak, feature yang banyak ini tidaklah selalu berkaitan dengan masalah yang sedang dihadapi. Sehingga dibutuhkan teknik reduksi dimensi untuk menyeleksi feature yang bersesuaian dengan masalah yang sedang dihadapi. Pada tugas akhir ini digunakan teknik reduksi dimensi menggunakan Minimum Redundancy Maximum Relevance yang selanjutnya akan disingkat dengan MRMR. Adapun Classifier yang digunakan adalah Random Forest, dimana teknik ini membuat beberapa tree untuk mengklasifikasi data lalu dilakukan voting untuk hasil terbanyak. Persamaan MRMR yang digunakan adalah FCD dan FCQ karena data yang digunakan bernilai kontinu. Setelah semua proses telah dilakukan, diperoleh hasil akurasi dari klasifikasi data microarray dengan menggunakan FCQ sebesar 83,87% dan dengan FCD 61,29%. Kata kunci : microarray, gen expression, random forest, MRMR Abstract Cancer is a deadly disease. Quoting information from the Ministry of Health of the Republic of Indonesia in 2017 nine million people died from cancer. Therefore we need a method to detect cancer, one of which is by gene expression. Microarray is a technique of gene expression. Microarray itself has many features, many of these features are not always related to the problem being faced. So we need a dimension reduction technique to select features that correspond to the problem being faced. In this final project a dimension reduction technique will be used using the Minimum Redundancy Maximum Relevance which will then be abbreviated as MRMR. The Classifier that will be used is Random Forest, where this technique creates several trees to classify data and then will vote for the most results. The MRMR equation used is FCD and FCQ because the data used is continuous. After the process done, the result from classify microarray data using FCQ is 83.87% and with FCD 61.29% Keywords: microarray, gen expression, random forest, MRMR

Downloads

Published

2020-04-01

Issue

Section

Program Studi S1 Informatika