Analisis Ekstraksi Fitur Principle Component Analysis Pada Klasifikasi Microarray Data Menggunakan Classification And Regression Trees
Abstract
Abstrak Di era yang sudah maju seperti saat ini pendeteksian kanker bisa dilakukan dengan beberapa cara, salah satunya dengan bioinformatika, yaitu dengan menggunakan teknologi microarray. Teknologi tersebut berupa DNA yang berbentuk microchip dengan ukuran dimensi yang sangat besar. Ukuran dimensi yang besar menyebabkan lamanya perhitungan komputasinya. Untuk mengurangi masalah komputasi maka dilakukan reduksi dimensi terlebih dahulu sebelum diklasifikasi menggunakan (Classification and Regression Trees) CART. Reduksi dimensi adalah pendekatan dengan memilih komponen, komponen ini dipilih karena tidak semua atribut pada data microarray dipilih, mengingat data pada microarray sangat banyak. Komponen yang paling memiliki ciri yang dipilih agar perhitungan bisa lebih menghasilkan hasil yang optimum. Reduksi dimensi yang digunakan pada penelitian ini adalah ekstraksi fitur dengan menggunakan algoritma principle component analysis (PCA). Ekstraksi fitur biasanya digunakan untuk data kontinu dengan cara mengekstrak atributnya sehingga tersisa atribut yang dapat mengoptimalkan hasilnya. Data kanker yang digunakan ada tiga yaitu, kanker usus besar, leukimia, dan kanker paru-paru. Akurasi yang dihasilkan dari penelitian ini rata-rata diatas 70% dengan algoritma PCA untuk reduksi dimensi dan CART sebagai klasifikasinya.
Kata kunci: kanker, microarray, reduksi dimensi, CART
Abstract In an advanced era such as the current detection of cancer can be done in several ways, one of which is bioinformatics by using microarray technology. The technology consists of DNA that forms microchips with very large dimensions. Large size dimensions cause computational calculations. To reduce computational problems, the reduction is done before being classified using (Tree Classification and Regression) CART. Dimension reduction by selecting components, this component is selected because not all attributes in the microarray data are selected, considering that the data on the microarray is very large. Components that have the most characteristics are chosen so that calculations can produce optimal results. Dimension reduction used in this study is feature extraction using the principal component analysis (PCA) principle. Feature extraction is usually used for continuous data by extracting attributes so that they can produce attributes. There are three cancer data used, namely, colon cancer, leukemia, and lung cancer. The accuracy generated from this study averages over 70% with the PCA algorithm for reducing dimensions and CART as its classification.
Key word: cancer, microarray, dimention reduction, CART