Klasifikasi Topik Berita Menggunakan Mutual Information Dan Bayesian Network
Abstract
Seiring dengan meningkatnya perkembangan internet, maka pertumbuhan informasi tekstual di internet terus mengalami peningkatan. Dengan peningkatan informasi tersebut, maka kebutuhan pengklasifikasian berita secara otomatis sangat dibutuhkan untuk menemukan informasi atau berita yang diinginkan. Salah satu cara untuk mengelopokan suatu berita ke dalam kategori tertentu berdasarkan informasi yang terdapat dalam berita tersebut adalah text classification. Salah satu metode dalam text classification adalah Bayesian Network. Bayesian Network merupakan salah satu metode reasoning yang memodelkan hubungan antar variabel dalam Probabilistic Graphical Model (PGM). Keuntungan Bayesian Network dibandingkan dengan metode yang lain yaitu, cocok untuk dataset yang kecil dan tidak lengkap, dapat menangani ketidakpastian dan pengambilan keputusan, dan komputasi yang cepat. Selain itu, dilakukan seleksi fitur dengan menggunakan metode Mutual Information untuk mengurangi jumlah dimensi dan untuk meningkatkan performa klasifikasi. Hasil dari klasifikasi ini dinyatakan dalam F1-measure micro-average dengan nilai performansi sebesar 75,34%.