Klasifikasi Multi-label Pada Hadis Bukhari Dalam Terjemahan Bahasa Indonesia Menggunakan Mutual Information Dan Backpropagation Neural Network

Authors

  • Hendro Prasetyo Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Widi Astuti Telkom University

Abstract

Abstrak
Hadis adalah segala sesuatu yang disandarkan pada Nabi Muhammad SAW baik perkataan, perbuatan,
taqrir (sikap diam setuju) dan yang lainnya. Hadis merupakan sumber hukum tersendiri bagi umat muslim
yang tidak dijelaskan dalam Al Qur’an. Ada banyak hadis yang telah diriwayatkan oleh para ahli hadis,
salah satunya adalah hadis shahih Bukhari. Penelitian ini membuat sebuah sistem yang dapat melakukan
klasifikasi hadis Bukhari Muslim Terjemahan berbahasa Indonesia. Metode klasifikasi Backpropagation
Neural Network digunakan karena dapat melakukan klasifikasi data dengan jumlah fitur yang banyak dan
beragam, didukung dengan Mutual Information sebagai metode seleksi fitur dalam memilih fitur-fitur yang
berpengaruh pada setiap label kelas multi-label. Pada penelitian ini dilakukan beberapa skenario
pengujian dengan memodifikasi tahapan preprocessing, seleksi fitur, dan parameter Backpropagation
Neural Network. Pengujian tersebut menunjukan bahwa nilai hamming loss terbaik adalah sebesar 0,0892
dan waktu komputasi 5284,8 s dengan melibatkan tiga poin pengujian yaitu: stemming, Mutual Information
dan nilai learning rate terbaik.

Kata kunci : klasifikasi teks, hadis, backpropagation neural network, mutual information, multi-label

Abstract
Hadith is everything that is based on Prophet Muhammad SAW involve words, deeds, taqrir (silence agree)
and others. Hadith is a separate source of law for Muslims which is not explained in the Qur'an. There are
many traditions which have been narrated by the experts of hadith, one of which is the hadith of sahih
Bukhari. This research makes a system that can classify the Bukhari Muslim Translation of hadith in
Indonesian. The classification method of Backpropagation Neural Network is used because it can classify
data with a large number of diverse features, supported by Mutual Information as a feature selection
method in selecting features that affect each multi-label class label. In this study several test scenarios were
carried out by modifying the preprocessing stages, feature selection, and Backpropagation Neural Network
parameters. The test shows that the best hamming loss value is 0.0892 and a computation time of 5284.8 s
by involving three test points, namely: stemming, Mutual Information and the best learning rate value.

Keywords: text classification, hadith, backpropagation neural network, mutual information, multi-label

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika