Implementasi SMOTE Untuk Mengatasi Imbalance Class Pada Berita Online Menggunakan Metode K-Nearest Neighbor (KNN)
Abstract
Berdasarkan survei Asosiasi Penyelenggara Jasa
Internet Indonesia (APJII), jumlah pengguna internet di
Indonesia mencapai 215,63 juta orang pada periode 2022-2023,
meningkat sebesar 2,67% dibandingkan periode sebelumnya.
Peningkatan ini menyebabkan lonjakan jumlah berita online
yang memerlukan pengelolaan data yang lebih baik, terutama
dalam menangani ketidakseimbangan kelas data set pada
klasifikasi data. Penelitian ini bertujuan untuk mengatasi
masalah tersebut dengan menerapkan teknik SMOTE, yang
menghasilkan sampel baru untuk kelas data set minoritas guna
meningkatkan representasi data. Selain itu, algoritma KNN
digunakan untuk mengevaluasi pengaruh kombinasi SMOTE
dan KNN terhadap performa model klasifikasi. Evaluasi
dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-
Score. Hasil penelitian menunjukkan bahwa penerapan
SMOTE berhasil meningkatkan performa model klasifikasi.
Kombinasi terbaik diperoleh pada nilai parameter k=1, dengan
akurasi sebesar 62,50%, presisi 58,39%, recall 86,96%, dan F1-
Score 69,87%. Dibandingkan dengan model sebelum penerapan
SMOTE, terjadi peningkatan performa akurasi dari 58,33%,
presisi dari 49,56%, dan F1-Score dari 63,28%, sambil
mempertahankan recall 87,50%. Penelitian ini membuktikan
bahwa SMOTE efektif dalam menangani ketidakseimbangan
kelas data set, menghasilkan prediksi model yang lebih akurat
dan seimbang. Hasil penelitian memberikan kontribusi dalam
pengelolaan data berita online untuk mendukung kualitas
klasifikasi yang lebih baik.
Kata kunci— AI, KNN, SMOTE, Berita Online