Sentiment Analysis Berbahasa Indonesia Menggunakan Improved Multinomial Naive Bayes
Abstract
ABSTRAKSI
Penggunaan Multinomial Naïve Bayes sebagai classifier dalam kasus sentiment analysis sudah jamak dilakukan, namun penggunaan TF-IDF sebagai feature weighting dalam kasus tersebut dirasa kurang sesuai karena pada kasus sentiment analysis, karena sifat dari TF-IDF itu sendiri yang lebih mementingkan frequency kemunculan kata. Oleh karena itu, digunakanlah algoritma Improved Multinomial Naïve Bayes yang menggunakan Improved Gini Index (TF- iGini) dalam pembobotan yang dianggap lebih tepat sehingga dapat menghasilkan performansi yang lebih baik. Pada tugas akhir ini dilakukan perbandingan performansi dari Multinomial Naïve Bayes + TF-IDF dan Multinomial Naïve Bayes + TF-iGini. Hasil percobaan menunjukkan bahwa iGini mampu memberikan hasil yang cukup baik jika dibandingankan dengan IDF pada Multinomial Naïve Bayes, namun tidak cukup baik untuk menggantikan fungsi IDF dalam kasus klasifikasi sentiment. Kata kunci: sentiment analysis, feature weighting, IDF, improved gini, Multinomial Naïve Bayes, Bahasa Indonesia.