Klasifikasi Multilabel pada Topik ayat Al-Qur’an Menggunakan Random Forest dan Naïve Bayes

Authors

  • Imran Zulkarnaen Telkom University
  • Kemas Muslim Lhaksmana Telkom University

Abstract

Al-Qur'an, sebagai kitab suci umat Islam, menyimpan makna yang mendalam, mencakup aspek akidah, ibadah, dan etika sosial. Namun, kerumitan bahasa dalam Al-Qur'an menimbulkan tantangan dalam pengelompokan ayat-ayatnya ke dalam kategori tematik tertentu, terutama dengan pendekatan tradisional yang sering kali tidak dapat menggali hubungan semantik antar kata secara mendalam. Untuk mengatasi tantangan ini, penelitian ini mengembangkan sistem klasifikasi multilabel yang berbasis graph mining, dengan memanfaatkan pengukuran centrality. Sistem tersebut melibatkan pembuatan graf kata untuk merepresentasikan hubungan antar kata, serta penerapan algoritma random forest dan naïve bayes dalam mengklasifikasikan ayat-ayat Al-Qur'an ke dalam delapan kategori tematik. Proses pengolahan data mencakup penghapusan kata henti (stopwords), tokenisasi, dan ekstraksi fitur berdasarkan centrality, seperti closeness, betweenness, dan eigenvector. Hasil penelitian menunjukkan bahwa penggunaan betweenness centrality dengan penggunaan kata henti memberikan performa terbaik, dengan nilai Hamming loss sebesar 0.1631 pada random forest. Temuan ini menekankan keunggulan pendekatan berbasis graf dalam memahami hubungan kompleks antar kata dalam teks Al-Qur'an serta berkontribusi pada pengembangan metode klasifikasi tematik berbasis teknologi yang lebih efisien.

Kata kunci— klasifikasi Multilabel, Tematik, Al-Qur’an, Graf, Sentralitas, Graph Mining, Hamming Loss

References

A. Rofiqul Muslikh, I. Akbar, D. Rosal Ignatius Moses Setiadi, and H. Md Mehedul Islam, “Multi-label Classification of Indonesian Al-Quran Translation based CNN, BiLSTM, and FastText.” [Online]. Available: https://quran.kemenag.go.id.

F. Akbar Nugroho Ilmu Komputer, “PENGGUNAAN TEXT MINING DALAM ANALISIS BIG DATA: TREN TERBARU,” 2024.

A. Saputra et al., “Big Data,” 2022.

F. Hakim, A. Fadlillah, M. Nafiur Rofiq, and U. Al Falah Assunniyah Kencong Jember, “Artificial Intellegence (AI) dan Dampaknya Dalam Distorsi Pendidikan Islam,” vol. 13, no. 1, 2024, doi: 10.54437/juw.

K. Gufran Mursyid and M. Awaliyah, “MAKKIYAH DAN MADANIYAH DALAM AL-QUR’AN,” 2021.

“L. N. Hakim, Visualisasi Tematik Al-Qur’an Berbasis Knowledge Graph, Skripsi, Department of Informatics Engineering, Universitas Islam Riau, Pekanbaru, Indonesia, 2019.”.

B. Yusuf et al., “Analisa Topik Pendidikan Dalam Al-Quran dengan Pendekatan Text Mining,” Serambi Engineering, vol. VI, no. 1, 2021, [Online]. Available: https://quran.kemenag.go.id/.

S. Delimasari and K. Kusrini, “Komparasi Algoritma Machine Learning Untuk Menganalisis Sentimen Ulasan Pada Aplikasi Digital Korlantas Polri,” G-Tech: Jurnal Teknologi Terapan, vol. 8, no. 4, pp. 2411–2419, Oct. 2024, doi: 10.70609/gtech.v8i4.5089.

R. Diki Nugraha, “Call for papers dan Seminar Nasional Sains dan Teknologi Ke-2 2023 Fakultas Teknik, Universitas Pelita Bangsa,” vol. 2, no. 1, 2023.

E. Supriyati and M. Iqbal, “PENGUKURAN SIMILARITY TEMA PADA JUZ 30 AL QUR’AN MENGGUNAKAN TEKS KLASIFIKASI,” Jurnal SIMETRIS, vol. 9, no. 1, 2018, [Online]. Available: https://translate.google.co.id/

F. R. Muflihah, K. M. Lhaksmana, and M. A. Bijaksana, "Centrality-Based Multilabel Neural Networks Classification of Qur’an Verse Topics," 2024 International Conference on Data Science and Its Applications (ICoDSA), pp. 469–474, 2024, doi: 10.1109/ICODSA.2024

F. Yulianto, K. M. Lhaksmana, and D. T. Murdiansyah, “Classifying Quranic Verse Topics using Word Centrality Measure,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 3, pp. 594–601, Jun. 2021, doi: 10.29207/resti.v5i3.3171.

M. I. Rahman, N. A. Samsudin, A. Mustapha, and A. Abdullahi, “Comparative analysis for topic classification in Juz Al-Baqarah,” Indonesian Journal of Electrical Engineering and Computer Science, vol. 12, no. 1, pp. 406–411, Oct. 2018, doi: 10.11591/ijeecs.v12.i1.pp406-411.

Achmad Salim Aiman, Kemas Muslim Lhaksmana, and Jondri, “Topic Classification of Quranic Verses in English Translation Using Word Centrality Measurement,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 6, no. 5, pp. 803–809, Oct. 2022, doi: 10.29207/resti.v6i5.4358.

“Quranic Arabic Corpus - Data Download.” Accessed: Dec. 06, 2024. [Online]. Available: https://corpus.quran.com/download/

Y. Dwi and P. Ariyanti, “Analisis Centrality Aktor pada Penyebaran Informasi Kuliner di Media Sosial dengan menggunakan Social Network Analysis.” [Online]. Available: http://e-journal.ivet.ac.id/index.php/jsitee

H. Tuhuteru and A. Iriani, “Analisis Kolaborasi Penelitian Ilmiah Dosen Fakultas X dengan Social Network Analysis (SNA),” Jurnal Teknik Informatika dan Sistem Informasi, vol. 4, no. 1, Apr. 2018, doi: 10.28932/jutisi.v4i1.758.

L. Efrizoni, S. Defit, M. Tajuddin, and A. Anggrawan, “Komparasi Ekstraksi Fitur dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning,” MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 21, no. 3, pp. 653–666, Jul. 2022, doi: 10.30812/matrik.v21i3.1851.

M. Nurjannah, I. Fitri Astuti, and D. Program Studi, “PENERAPAN ALGORITMA TERM FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF) UNTUK TEXT MINING Mahasiswa S1 Program Studi Ilmu Komputer FMIPA Universitas Mulawarman 2,3),” 2013.

P. Diseminasi and F. Genap, “Akurasi dan Presisi Pengklasifikasian Abstrak Paper Informatika Menggunakan TF-IDF dan Multiclass Support Vector Machine (SVM).”

K. I. Gunawan and J. Santoso, “Multilabel Text Classification Menggunakan SVM dan Doc2Vec Classification Pada Dokumen Berita Bahasa Indonesia,” Journal of Information System,Graphics, Hospitality and Technology, vol. 3, no. 01, pp. 29–38, Apr. 2021, doi: 10.37823/insight.v3i01.126.

Published

2025-04-30

Issue

Section

Prodi S1 Informatika