Klasifikasi Soal Sejarah Indonesia Tingkat Sma Berdasarkan Level Kognitif Revised Bloom’s Taxonomy Menggunakan Naïve Bayes
Abstract
Abstrak— Pendidikan adalah proses pengubahan sikap dan tata laku seseorang. Evaluasi yang digunakan oleh guru dinegara kita berupa tes seperti ulangan atau ujian. Penelitian ini mengungkap bagaimana membuat machine learning untuk mengklasifikasikan soal sejarah Indonesia tingkat SMA level kognitif Revised bloom's taxonomy ditingkat kesulitan C1 sampai C3 dengan algoritma Naive bayes. Dalam melakukan pelabelan dilakukan dengan cara manual untuk menentukan soal berdasarkan level kognitif RBT. Untuk mendapatkan hasil akurasi sebuah machine learning pada penelitian ini ada beberapa tahapan yaitu tahapan preprocessing dimana dataset akan disaring menggunakan case folding, tokenizing, filtering, dan stemming selanjutnya dataset akan dilakukan pembobotan dengan TF-IDF. Peneliti menggunakan metode SMOTE over-sampling untuk mengatasi imbalance data kemudian dilakukan pengujian menggunakan K-fold dengan jumlah fold sebanyak 10 dan terakhir model dilakukan evaluasi performansi dengan menggunakan confusion matrix. Hasil klasifikasi diperoleh skor rata-rata K-fold dataset mengalami kenakikan 16% (60% - 76%) setelah dilakukan SMOTE kemudian hasil akurasi evaluasi performansi juga mengalami kenaikan sebanyak 21% (61% - 82%) ketika dilakukan SMOTE. Hasil penelitian yang diperoleh dari implementasi K-Fold Cross Validation dan confusion matrix menunjukan bahwa penggunaan algoritma Naïve bayes menunjukan skor akurasi yang baik, serta penggunaan metode oversampling sangat membantu dalam penelitian ini guna mengatasi imbalance data.
Kata kunci— klasifikasi soal pertanyaan, naïve bayes, sejarah indonesia, SMOTE, RBT, oversampling, soal SMA
References
Raharjo, S. B. (2013). Evaluasi Trend Kualitas Pendidikan Di Indonesia. Jurnal Penelitian Dan Evaluasi Pendidikan, 16(2), 511–532.
Magdalena, I., Fajriyati Islami, N., Rasid, E. A., & Diasty, N. T. (2020). Tiga Ranah. EDISI : Jurnal Edukasi Dan Sains, 2(1), 132–139.
Toriqul Arif, M. (2019). Penelitian Evaluasi Pendidikan. Addabana: Jurnal Pendidikan Agama Islam, 2(2), 66–75.
Kurniawan, Y. I. (2018). Perbandingan Algoritma Naive Bayes dan C.45 dalam Klasifikasi Data Mining. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(4), 455.
Putra, A. I., & Santika, R. R. (2020). Implementasi Machine Learning dalam Penentuan Rekomendasi Musik dengan Metode Content-Based Filtering. Edumatic: Jurnal Pendidikan Informatika, 4(1), 121–130.
Aninditya, A., Hasibuan, M. A., & Sutoyo, E. (2019). Text mining approach using TF-IDF and naive bayes for classification of exam questions based on cognitive level of bloom’s taxonomy. Proceedings - 2019 IEEE International Conference on Internet of Things and Intelligence System, IoTaIS 2019, c, 112–117.
Widya Astuti, L., Saluza, I., & Fadhiel Alie, M. (2020). Optimalisasi Klasifikasi Kanker Payudara Menggunakan Forward Selection pada Naive Bayes. Jurnal Ilmiah Informatika Global, 11(2), 63–67.
Pantiwati, Y., & Permana, F. H. (2017). Analisis butir soal oleh mahasiswa S1 pendidikan biologi universitas muhammadiyah malang (UMM) berdasarkan PISA dan taksonomi bloom revisi. Publikasi Ilmiah UMS, 707–716.
Suryatmojo, D. L. (2018). Penggunaan Taksonomi Bloom Dalam Pembelajaran Keterampilan Menyimak Bermuatan Pendidikan Karakter Profetik Untuk Mengukur Keberhasilan Hasil Belajar Mahasiswa. Proceeding Seminar Nasional Pertemuan Ilmiah Bahasa Dan Sastra Indonesia 40, 601, 601–620.
Rochmad. (2012). Revisi Taksonomi Bloom (A Revision Of Bloom’s Taxonomy).
Metzler, D., & Croft, W. B. (2005). A Markov random field model for term dependencies. SIGIR 2005 - Proceedings of the 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 472–479.
Tagger, B. B. (2019). Pelabelan kelas kata teks berbahasa indonesia berbasis brill tagger.
Adhe, D., Rachman, C., Goejantoro, R., & Tisna, D. (2020). Implementation Of Text Mining For Grouping Thesis Documents Using K-Means Clustering. Jurnal EKSPONENSIAL, 11(2), 167–174.
Kartikasari, T. S., Setiawan, H., & Lucky Tirma Irawan, P. (2020). Implementasi Text Mining Untuk Analisis Opini Publik Terhadap Calon Presiden. Jurnal Simantec, 7(1), 39–47.
Pallas, F. A., Setyawan, G. E., & Prasetio, B. H. (2018). Sistem Kendali Navigasi Quadcopter Menggunakan Suara Melalui Smartphone dan Arduino dengan Metode Text Processing. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 2(2), 732–738.
Damanik, J. (2016). Jurnal Teknologi Informasi Dan komunikasi. Jurnal Internasional Ti2, 5(1), i–viii.
Adiswara, Y. L. (2018). Klasifikasi pertanyaan pada sistem tanya jawab berbahasa indonesia menggunakan. 85–86.
Devita, R. N., Herwanto, H. W., & Wibawa, A. P. (2018). Perbandingan Kinerja Metode Naive Bayes dan K-Nearest Neighbor untuk Klasifikasi Artikel Berbahasa indonesia. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(4), 427.
Naf’an, M. Z., Burhanuddin, A., & Riyani, A. (2019). Penerapan Cosine Similarity dan Pembobotan TF-IDF untuk Mendeteksi Kemiripan Dokumen. Jurnal Linguistik Komputasional, 2(1), 23–27.
Siregar, R. R. A., Sinaga, F. A., & Arianto, R. (2017). Aplikasi Penentuan Dosen Penguji Skripsi Menggunakan Metode TF-IDF dan Vector Space Model. Computatio: Journal of Computer Science and Information Systems, 1(2), 171.
Normawati, D., & Prayogi, S. A. (2021). Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter. Jurnal Sains Komputer & Informatika (J-Sakti), 5(2), 697–711.
Pratiwi, B. P., Handayani, A. S., & Sarjana, S. (2021). Pengukuran Kinerja Sistem Kualitas Udara Dengan Teknologi Wsn Menggunakan Confusion Matrix. Jurnal Informatika Upgris, 6(2), 66–75.
Santosa, S., & Yuliantara, R. (2017). Model Prediksi Pola Loyalitas Pelanggan Telekomunikasi Menggunakan Naive Bayes Dengan Optimasi Particle Swarm Optimization. Jurnal Teknologi Informasi, 13, 154–169.
HULU, S. S. U. (2020). Analisis Kinerja Metode Cross Validation Dan K-Nearest Neighbor Dalam Klasifikasi Data. Universitas Sumatera Utara, 4–16.
SUPARTINI, I. A. M., SUKARSA, I. K. G., & SRINADI, I. G. A. M. (2017). Analisis Diskriminan Pada Klasifikasi Desa Di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation. E-Jurnal Matematika, 6(2), 106.
Azis, H., Tangguh Admojo, F., & Susanti, E. (2020). Analisis Perbandingan Performa Metode Klasifikasi pada Dataset Multiclass Citra Busur Panah. Techno.Com, 19(3), 286–294.
Siringoringo, R. (2018). Klasifikasi Data Tidak Seimbang Menggunakan Algoritma SMOTE dan k-Nearest Neighbor. Jurnal ISD, 3(1), 44–49.
Sutoyo, E., & Fadlurrahman, M. A. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. JEPIN (Jurnal Edukasi Dan Penelitian Informatika), 6(3), 379–385.
Putri, S. A. (2017). Integrasi Teknik Smote Bagging Dengan Information. Jurnal Ilmu Pengetahuan Dan Teknologi Komputer, 2(2), 22–31.
Sabrani, A., Wedashwara W., I. G. W., & Bimantoro, F. (2020). Multinomial Naïve Bayes untuk Klasifikasi Artikel Online tentang Gempa di Indonesia. Jurnal Teknologi Informasi, Komputer, Dan Aplikasinya (JTIKA ), 2(1), 89–100.
Novendri, R., Andreswari, R., & ... (2021). Implementasi Data Mining Untuk Memprediksi Customer Churn Menggunakan Algoritma Naive Bayes. EProceedings …, 8(2), 2762–2773.