Klasifikasi Topik Ayat Al-qur’an Terjemahan Berbahasa Inggris Menggunakan Metode Support Vector Machine Berbasis Vector Space Model Dan Word2vec

Authors

  • Anisa Salama Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Said Al Faraby Telkom University

Abstract

Abstrak
Tujuan diturunkannya Al-Qur’an adalah sebagai petunjuk hidup bagi umat manusia. Al-Qu’an memiliki
kandungan makna dan hikmah disetiap ayatnya. Didalam Al-Qur’an terdapat ayat-ayat yang memiliki
makna yang tersirat. Al-Qur’an mengandung beberapa topik yang antar surat Al-Qur’an dapat memiliki
kemiripan topik dengan surat Al-Qur’an yang lainnya. Pada penelitian ini, dilakukan implementasi metode
Support Vector Machine dan Word2vec pada terjemahan ayat Al-Qur’an berbahasa Inggris yang digunakan
untuk pengklasifikasian berdasarkan topik. Kategori topik Al-Qur’an yang digunakan pada penelitian ini
dibagi menjadi tiga yaitu perintah, larangan, dan lainnya. Dokumen tersebut diubah kedalam bentuk
vektor dengan tf-idf weighting dan Word2vec. Vektor-vektor kata tersebut dipemetakan berdasarkan nilai
kedekatan vektor antar kata pada dokumen. Selanjutnya metode Support Vector Machine digunakan untuk
mengklasifikasikan topik Al-Qur’an dengan memberikan hyperplane pada tiap kategori. Hasil pengujian
dari penelitian ini menunjukkan bahwa penerapan Word2vec dan Support Vector Machine mendapatkan
nilai akurasi tertinggi sebesar 0.64 dengan jumlah data training sebesar 70% dari keseluruhan dataset.


Kata kunci : Topik Al-Qur’an, Klasifikasi, Support Vector Machine, Word2vec

Abstract
The purpose of the Qur'an is as a guide for human’s life. Al-Qu’an has meaning and wisdom in every verse.
In the Qur'an there are verses that have implied meaning. Al-Qur’an contains several topics which among
the Surahs of the Qur'an can have a similarity to the topic of other Al-Qur’an's surah. In this research, the
implementation of the Support Vector Machine and Word2vec method is used to classify based on topics in
the English translation of Al-Qur’an verses. The used topic categories in this study are divided into three
namely commands, prohibitions, and others. The document is converted into vector with tf-idf weighting
and Word2vec. Then the word vectors are mapped based on the value of the proximity of the vectors between
words in the document. Then Support Vector Machine method is used to classify the topic of the Qur'an by
giving hyperplane in each category. The test results of this study showed that the implementation of
Word2vec and Support Vector Machine has the highest accuracy results of 0.64 with the amount of training
data is 70% of the entire dataset.

Keywords: Topics of Al-Qur’an, Classification, Support Vector Machine, Word2vec

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika