Klasifikasi Multi-Label Pada Topik Berita Berbahasa Indonesia Menggunakan Multinomial Naïve Bayes

Authors

  • I Made Riartha Prawira Telkom Univesity
  • Adiwijaya Adiwijaya Telkom University
  • Mohammad Syahrul Mubarok Telkom University

Abstract

Abstrak Berita merupakan informasi yang dialirkan dari berbagai sumber mengenai kejadian factual yang dapat mempengaruhi lingkungan sekitar. Klasifikasi label topik biasanya dilakukan dalam pengelompokan artikel berita berdasarkan topiknya. Variabel ciri artikel merupakan penentu dalam klasifikasi label. Namun apabila suatu ciri yang menjadi ciri dari satu label artikel merupakan ciri dari label artikel lainnya maka artikel tersebut memiliki lebih dari satu topik atau disebut topik multi-label. Penelitian ini melakukan pembangunan pemodelan suatu klasifikasi teks berita dengan menggunakan metode multinomial naïve bayes untuk melakukan klasifikasi multi-label dengan metode hamming loss sebagai pengukuran performa model klasifikasi tersebut. Hasil hamming loss yang dihasilkan dari penelitian ini sebesar 0,18. Berdasarkan hasil penelitian, metode multinomial naïve bayes ini mampu untuk menyelesaikan permasalahan klasifikasi teks pada kasus multi-label. Kata kunci : Berita, Klasifikasi, Multi-Label, MNB, Hamming Loss Abstract News is a distributed information from any resources contains factual events that affect the environment. Label topic classification generally used for specifying label topic of news article and gather it according to the same topic. Article feature variable is a definite factor in label classification. However, when a feature from one article feature label become another article feature label then that article may contain more than one topic or generally called multi-label topic. This research is about build a text classification model with multinomial naïve bayes method for classifying a multi-label classification problem with hamming loss method as a performance classification model measurement. Result of hamming loss that we obtain from this research is 0,18. Based on result from this research, this multinomial naïve bayes method can solve text classification problem on multi-label case. Keywords : News, Classification, Multi-Label, MNB, Hamming Loss

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Informatika