Klasifikasi Multi-Label Pada Soal Berdasarkan Kategori Topik Menggunakan Metode Support Vector Machine

Authors

  • Alvin Renaldy Novanza Telkom University
  • Oktariani Nurul Pratiwi Telkom University
  • Faqih Hamami Telkom University

Abstract

Abstrak — Pendidikan, sebagai bagian penting dalam
kehidupan manusia, senantiasa mengalami perkembangan
seiring dengan adanya kemajuan ilmu pengetahuan dan
teknologi (IPTEK). Salah satu inovasi penting dalam pendidikan
adalah e-learning, yang memungkinkan siswa belajar tanpa
terikat ruang kelas. Namun, dengan semakin banyaknya soal
kuis yang beragam topiknya, terutama dalam mata pelajaran
IPA yang mencakup berbagai konsep ilmiah, pengelolaan soal
secara manual menjadi tidak efisien. Oleh karena itu,
diperlukan sistem klasifikasi yang dapat mengorganisasi dan
mengelompokkan soal secara otomatis dan efisien, sehingga bisa
meningkatkan pemahaman siswa, khususnya pada mata
pelajaran IPA. Penelitian ini memiliki tujuan untuk
mengimplementasikan algoritma Support Vector Machine
dalam proses klasifikasi soal multi-label pada mata pelajaran
IPA tingkat SMP. Proses klasifikasi mencakup pembersihan
data, case folding, tokenisasi, stopword removal, stemming, dan
pembobotan atau ekstraksi fitur teks menggunakan TF-IDF.
Pemodelan menggunakan pendekatan problem transformation
dengan metode label powerset untuk mengubah soal dengan
multi-label menjadi bentuk multi-class sehingga bisa dilakukan
klasifikasi biner oleh SVM. Evaluasi model dilakukan
menggunakan confusion matrix untuk menganalisis performa
klasifikasi dan K-Fold Cross Validation untuk memastikan
keakuratan dan generalisasi model. Hasil penelitian
menunjukkan bahwa SVM dapat diterapkan untuk klasifikasi
soal multi-label dengan akurasi 67%, serta presisi, recall, dan
F1-score masing-masing sebesar 75%. Analisis confusion matrix
mengungkapkan bahwa model memiliki beberapa kesalahan
klasifikasi, mengindikasikan ruang untuk perbaikan lebih
lanjut. Meskipun demikian, model SVM menunjukkan potensi
yang baik. Penelitian ini juga mengidentifikasi beberapa area
untuk perbaikan, termasuk peningkatan kualitas data dan
pemilihan parameter model yang lebih optimal. Oleh karena itu,
metode SVM layak dipertimbangkan dalam sistem pendidikan
untuk pengembangan bank soal dan sistem evaluasi berbasis
teknologi, meskipun diperlukan perbaikan lebih lanjut pada model dan data.

Kata kunci— bank soal, confusion matrix e-learning, klasifikasi multi-label, K-Fold Cross Validation, Support Vector
Machine.

References

'[1] Yayan Alpian, Sri Wulan Anggraeni, Unika Wiharti, and Nizmah Maratos Soleha,

PENDIDIKAN BAGI MANUSIA,= JURNAL

BUANA PENGABDIAN, vol. 1, no. 1, pp. 66–72, Aug. 2019, doi: 10.36805/jurnalbuanapengabdian.v1i1.581.

'[2] S. Dan and A. B. L. Mailangkay,

MENGAJAR DALAM DUNIA PENDIDIKAN,= Jurnal Ilmiah Widya, vol. 3, 2016.

'[3] N. A. Yulistiawati, Pentingnya Motivasi Peserta

Didik terhadap Hasil Belajar Biologi.,= Seminar

Nasioal Biologi VI, 2019, pp. 1–4.

'[4] K. E. Widiastuti, N. I., Rainarli, E., & Dewi, Peringkasan dan support vector machine pada

klasifikasi dokumen,= Jurnal Infotel, vol. 9(4), pp. 416–421, 2017, doi:

https://doi.org/10.20895/infotel.v9i4.312.

'[5] R. Ariandi, O. N. Pratiwi, and R. Y. Fa9rifah, Klasifikasi Soal Sejarah Tingkat SMA Berdasarkan

Level Kognitif Revised Bloom9s Taxonomy

Menggunakan Algoritma K-Nearest Neighbour Manhattan,= 2023.

' [6] L. A. Muhaimin, O. N. Pratiwi, and R. Y. Fa9rifah, Klasifikasi Soal Berdasarkan Kategori Topik

Menggunakan Metode Algoritma Naïve Bayes Dan

Algoritma C4.5,= e-Proceeding of Engineering, vol. Vol.10, No.2, pp. 1535–1541, 2023.

' [7] A. Y. Taha and S. Tiun,

method classifier of multi-label classification for

arabic text,= J Theor Appl Inf Technol, vol. 84, no. 3, 2016.

' [8] A. P. Wibawa, M. G. A. Purnama, M. F. Akbar, and F. A. Dwiyanto, Metode-metode Klasifikasi,=

Prosiding Seminar Ilmu Komputer dan Teknologi

Informasi, vol. 3, pp. 134–138, 2018.

Published

2025-04-10

Issue

Section

Program Studi S1 Sistem Informasi