Imputasi Misssing Data Menggunakan Metode K-nearest Neighbour Dengan Optimasi Algoritma Memetika Missing Value Imputation Using K-nearest Neighbour Method Optimized With Memetic Algorithm
Abstrak
Dalam suatu penelitian, data adalah hal yang sangat penting. Kualitas hasil dari penelitian akan berbanding lurus dengan kualitas data yang akan dipakai dalam penelitian yang bersangkutan. Salah satu permasalahan yang ada pada data set adalah ketiadaan nilai pada data untuk atribut tertentu atau yang lebih dikenal dengan istilah missing data. Salah satu metode yang sering digunakan oleh para peneliti adalah k-Nearst Neighbour (KNN). Namun, metode ini memiliki beberapa kelemahan, salah satunya adalah pemilihan nilai k yang tidak tepat dapat menurunkan kinerja klasifikasi. Penelitian bertujuan menangani missing data dengan teknik imputasi menggunakan gabungan algoritma KNN dengan algoritma memetika. Algoritma memetika digunakan untuk mengoptimasi nilai k pada KNN sehingga dapat menghasilkan nilai estimasi yang baik dengan mean square error (MSE) sekecil mungkin. Pengujian performansi dilakukan dengan membandingkan nilai MSE hasil imputasi missing data pada saat missing data ada sebanyak, 5%, 10%, 15%, 20% dan 25% dengan menggunakan metode KNN dan KNN yang dioptimasi dengan algoritma memetika. Hasil dari penelitian menunjukkan bahwa k yang didapat dari hasil optimasi algoritma memetika tidak selalu menunjukkan k optimal dengan hasil pengukuran akurasi terbaik yang diuji, namun sangat mendekati hasil terbaik dari pengukuran akurasi yang diuji.
Kata Kunci : missing data, KNN, algoritma memetika, optimasi