Klasifikasi Soal Berdasarkan Kategori Topik Menggunakan Metode Algoritma Naïve Bayes Dan Algoritma C4.5
Abstract
Abstrak-Klasifikasi dilakukan untuk mengelompokkan sekumpulan data ke dalam kelas-kelas yang telah ditentukan terlebih dahulu berdasarkan kesamaan karakteristik yang dimiliki. Klasifikasi soal berdasarkan topik membantu para siswa dan pengajar dalam mengambil keputusan untuk menentukan soal berdasarkan kategori topiknya. Pada penelitian ini, peneliti bermaksud untuk membuat suatu model klasifikasi soal Biologi kelas 11 SMA yang dikelompokkan menjadi sembilan kategori topik yaitu Sel, Jaringan Tumbuhan dan Hewan, Sistem Gerak Manusia, Sistem Peredaran Darah, Sistem Pencernaan, Sistem Pernapasan, Sistem Ekskresi, Sistem Koordinasi, dan Sistem Reproduksi Manusia. Soal-soal dan topik didapatkan dari buku bank soal yang berjudul “Siap Pintar Belajar Mandiri”. Penelitian ini membandingkan nilai akurasi dan evaluasi performansi dari dua algoritma klasifikasi yaitu, Naive Bayes dan C4.5. Untuk evaluasi performansi peneliti menggunakan cross validation dan mencari nilai precision, recall, dan f1-score menggunakan confusion matrix. Dari hasil klasifikasi, diperoleh hasil akurasi algoritma Naive Bayes sebesar 72.72%, dan nilai akurasi evaluasi performansi menggunakan cross validation sebesar 73.09% dan nilai precision sebesar 73%, recall sebesar 73%, dan F1-Score sebesar 70%. Sedangkan algoritma C4.5 mendapat nilai akurasi sebesar 54.54%, dan nilai akurasi evaluasi performansi menggunakan cross validation sebesar 54.09% dan nilai precision sebesar 58%, recall sebesar 56%, dan F1-Score sebesar 55%.
Kata kunci— klasifikasi soal, biologi, naive bayes, C4.5, cross validation
References
N. S. Hanum, “Keefetifan e-learning sebagai media pembelajaran (studi evaluasi model pembelajaran e-learning SMK Telkom Sandhy Putra Purwokerto),” J. Pendidik. Vokasi, vol. 3, no. 1, pp. 90–102, 2013.
P. Winarni, H. H. Pranoto, and L. D. Afriani, “Hubungan antara Pengetahuan Tentang Gizi Seimbang dengan Perilaku Pemenuhan Gizi Seimbang pada SiswaKelas XI SMA Negeri 1 Ungaran,” J. Gizi Dan Kesehat., vol. 7, no. 15, pp. 1–8, 2015.
N. A. Yulistiawati, “Pentingnya Motivasi Peserta Didik terhadap Hasil Belajar Biologi,” Semin. Nasioal Biol. VI, pp. 1–4, 2019.
A. Z. Kamalia, A. A. Zaroni, and M. Wangsadanureja, “Analisis Sentimen Pada Ulasan Aplikasi Bibit Di Play Store Dengan Metode Naive Bayes, Support Vector Machine, C4.5 Dan K-Nearest Neighbor,” vol. 13, no. 1, pp. 9–25, 2019.
R. Sari, “Komparasi Algoritma Support Vector Machine, Naïve Bayes Dan C4.5 untuk Klasifikasi SMS,” IJCIT(Indonesia J. Comput. Infomation Technol., vol. 2, no. 2, pp. 7–13, 2017.
Maryamah, F. Asikin, D. Kurniawaty, S. K. Sari, and I. Cholissodin, “Implementasi Metode Naïve Bayes Classifier Untuk Seleksi Asisten Praktikum Pada Simulasi Hadoop Multinode Cluster,” J. Teknol. Inf. dan Ilmu Komput., vol. 3, no. 4, pp. 273–278, 2016.
D. H. Kamagi and S. Hansun, “Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa,” J. Ultim., vol. 6, no. 1, pp. 15–20, 2014.
T. Jo, Text Mining Concepts, Implementation, and Big Data Challenge. Seoul, 2021.
R. Feldman and J. Sanger, The Text Mining Handbook- Advanced Approaches in Analyzing Unstructured Data. New york, 2007.
K. L. Kohsasih and Z. Situmorang, “Analisis Perbandingan Algoritma C4.5 dan Naïve Bayes Dalam Memprediksi Penyakit Cerebrovascular,” J. Inform., vol. 9, no. 1, pp. 13–17, 2022.
F. S. Jumeilah, “Penerapan Support Vector Machine (SVM) untuk Pengkategorian Penelitian,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 1, no. 1, pp. 19–25, 2017.
Y. I. Kurniawan, “Perbandingan Algoritma Naive Bayes dan C.45 dalam Klasifikasi Data Mining,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 4, p. 455, 2018.
M. Listiana, Sudjalwo, and D. Guanawan, “Perbandingan Algoritma Decision Tree (C4.5) Dan Naive Bayes Pada Data Mining Untuk Identifikasi Tumbuh Kembang Anak Balita (Studi Kasus Puskesmas Kartasura),” Syria Stud., vol. 7, no. 1, pp. 37–72, 2015.
D. Normawati and S. A. Prayogi, “Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter,” J. Sains Komput. Inform., vol. 5, no. 2, pp. 697–711, 2021.
D. Prajarini, “Perbandingan Algoritma Klasifikasi Data Mining Untuk Prediksi Penyakit Kulit,” Informatics J., vol. 1, no. 3, p. 137, 2016.
A. H. Yunial, “Analisa Perbandingan Klasifikasi Support Vector Machine, Decession Tree dan Naive Bayes,” vol. 5, pp. 169–185, 2020.
Purushottam, K. Saxena, and R. Sharma, “Efficient heart disease prediction system using decision tree,” Int. Conf. Comput. Commun. Autom., 2015.
S. Bahri, D. M. Midyanti, and R. Hidayati, “Perbandingan Algoritma Naive Bayes dan C4.5 Untuk Klasifikasi Penyakit Anak,” Semin. Nas. Apl. Teknol. Inf., pp. 24–31, 2018.
D. T. Larose and C. D. Larose, Discovering Knowledge in Data. 2014.
F. Handayani and F. S. Pribadi, “Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110,” J. Tek. Elektro, vol. 7, no. 1, pp. 19–24, 2015.