Analisis Sentimen Review Film Menggunakan Naive Bayes Classifier Dengan Fitur TF-IDF
Abstract
Abstrak-Penilaian mengenai isi dari review film dapat disebut dengan sentiment analysis. Sentiment analysis pada review film terbagi menjadi 2 yaitu berupa review positif dan review negatif. Salah satu algoritma data mining yang paling sering digunakan dalam penelitian adalah Naïve Bayes karena bekerja dengan cepat dan efisien sebagai metode pengklasifikasian teks tetapi memiliki kekurangan yang sangat sensitif dalam pemilihan fitur. Pada umumnya, data review film memuat isi yang sangat panjang sehingga diperlukan feature selection atau pemangkasan fitur yang berguna untuk mengurangi dimensi pada saat proses klasifikasi. Pada penelitian ini menggunakan fitur Tf-Idf sebagai salah satu solusi untuk mempermudah dan mempercepat pencarian informasi yang sesuai adalah dengan meringkas konten tersebut. Tf-Idf (Term Frequency Inverse Document Frequency) merupakan metode pembobotan dalam bentuk integrasi antar term frequency dengan inverse document frequency. Metode Tf-Idf digunakan pada penelitian ini untuk memilih fitur sebagai hasil ringkasan, dengan penerapannya pada seleksi fitur bobot kata. Sebelum proses klasifikasi, dilakukan tahapan preprocessing yang meliputi data cleaning dan case folding, stop words removal, stemming, dan tokenization. Pada penelitian ini menghasilkan nilai akurasi mencapai 86.48%. Sehingga Naïve Bayes dengan fitur Tf-Idf pada masalah analisis klasifikasi sentimen review film terbukti memberikan akurasi yang akurat
Kata kunci- sentiment analysis, film, Naïve Bayes, TF-IDF
References
Hussein, D.M., 2016. A Survey on Sentiment Analysis Challenges, Cairo: Journal of King Saud University
Khan, M.T., Durrani, M., Ali, A., Inayat, I., Khalid, S., Khan, H., 2016. Sentiment analysis and the complex natural language, Pakista: Complex adaptive system modeling.
Dehkharghani R Mercan H Javeed A and Saygin Y, 2014 Expert Systems with Applications Sentimental causal rule discovery from Twitter Expert Syst. Appl. 41, 10 p. 4950–4958.
Ahmad E Sazzad M A U Islam M T Azad M Islam S and Ali M H, 2017 Challenges, Comparative Analysis and a Proposed Methodology to Predict Sentiment from Movie Reviews using Machine Learning Big Data Analytics and Computational Intelligence (ICBDAC), 86-91.
Baid, Palak & Gupta, Apoorva & Chaplot, Neelam. (2017). Sentiment Analysis of Movie Reviews Using Machine Learning Techniques. International Journal of Computer Applications. 179. 45-49. 10.5120/ijca2017916005.
Brar, G.S., Sharma, A., 2018 Sentiment Analysis of Movie Review Using Supervised Machine Learning Techniques
Potti, M.P., Kmar, M.D., Ram, N.S., Sandeep, P.V.R., Prasad, P.R.K., 2018. Sentiment Analysis On Movie Reviews Using NAÏVE BAYES Classifier
Purnomoputra, R., Adiwijaya, A., & Novia Wisesty, U. (2019, November 15). Sentiment Analysis of Movie Review using Naïve Bayes Method with Gini Index Feature Selection.
Amrullah, Ahmad & Anas, Andi & Adrian, Muh & Hidayat, Muh. Adrian Juniarta. (2020). Analisis Sentimen Movie Review Menggunakan Naive Bayes Classifier Dengan Seleksi Fitur Chi Square. 2. 40-44.
Novendri, R., Callista, A. S. ., Pratama, D. N., & Puspita, C. E. . (2020). Sentiment Analysis of YouTube Movie Trailer Comments Using Naïve Bayes. Bulletin of Computer Science and Electrical Engineering, 1(1), 26–32.
Zulfa, I., & Winarko, E. (2017, July). Sentimen Analisis Tweet Berbahasa Indonesia dengan. IJCCS, 11, 2.
Rozi, I. F., Pramono, S. H., & Dahlan, E. A. (2013). Implementasi opinion mining (analisis sentimen) untuk ekstraksi data opini publik pada perguruan tinggi. Jurnal EECCIS, 6(1), 37-43.
[6] R. S. P. M. A. F. A. R. T. Lestari, “Analisis Sentimen Tentang Opini Pilkada Dki 2017 Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Näive Bayes dan Pembobotan Emoji,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 1, no. 12, pp. 1718-1724, 2017
McCallum, A., & Nigam, K. 1998. A Comparison of Event Models for Naïve Bayes Text Classification.
Pittsburgh: Carnegie Mellon University
Rahman, A., Wiranto, & Doewes, A. 2017. “Online News Classification Using Multinomial Naive Bayes”.
ITSMART Vol. 6 No.1. Universitas Sebelas Maret
Pendit, Putu Laxman., 2008. Perpustakaan Digital Dari A Sampai Z. Jakarta: Cita Karya Karsa Mandiri.
N. Zainuddin dan A. Selamat, “Sentiment Analysis Using Support Vector Machine,” International Conference on Computer, Communication, and Control Technology , pp. 333-337, 2014