Analisis Sentimen Masyarakat Terhadap Kinerja Presiden Indonesia Dalam Aspek Ekonomi, Kesehatan, Dan Pembangunan Berdasarkan Opini Dari Twitter
Abstract
Abstrak
Menjelang pilpres tahun 2019, opini – opini atau tweet yang berkaitan dengan Presiden dan Calon Presiden
adalah yang paling banyak diutarakan oleh pengguna twitter di Indonesia saat ini. Opini – opini masyarakat
sangat penting untuk mengetahui keadaan keberpihakan masyarakat pada pemilihan presiden yang akan
datang. Selain itu dengan melihat opini – opini yang terpampang secara bebas di twitter, kita dapat
mengetahui secara umum keadaan beberapa aspek ekonomi, aspek kesehatan, dan aspek pembangunan
dengan memanfaatkan opini – opini di twitter. Pada Tugas Akhir ini dibangun sistem untuk analisis
sentimen dalam tiga aspek yaitu ekonomi, kesehatan, dan pembangunan yang berupa sentimen positif atau
sentimen negatif. Metode yang digunakan adalah Naïve Bayes dengan menggunakan ekstraksi fitur Lexicon
SentiWordnet dan penggabungan TF-IDF dengan Lexicon SentiWordnet. Masukan dari sistem ini berupa
dataset tweet dari Twitter sebanyak 1357, kemudian dataset tersebut dilabeli secara manual. Keluaran dari
penelitian ini berupa evaluasi dengan menggunakan 10 fold cross validation, kemudian pengukuran akurasi
diukur dengan confusion matrix. Berdasarkan hasil penelitian yang telah dilakukan, penggunaan Naïve
Bayes dengan ekstraksi fitur Lexicon SentiWordnet dalam pembuatan sistem Sentiment Analysis terbukti
lebih baik dengan akurasi 84,75% dibandingkan dengan Naïve Bayes dengan menggunakan ekstraksi fitur
TF-IDF ataupun TF-IDF yang digabungkan dengan Lexicon SentiWordnet.
Kata kunci : Naïve Bayes, Lexicon SentiWordnet, Twitter , confusion matrix, analisis sentimen, TF-IDF
Abstract
Towards the 2019 presidential election, opinions or tweets related to the President and Presidential
Candidates are the most widely expressed by twitter users in Indonesia today. Public opinion is very
important to understand the state of community alignments in the upcoming Presidential election. In
addition, by looking at opinions posted on Twitter, we can discuss several aspects of the economy, health
aspects, and aspects of infrastructure by using opinions on Twitter. In this Final Project a system for
sentiment analysis is built in three aspects, namely economic, health, and development which contain
positive sentiments or negative sentiments. The method that used is Naïve Bayes by using the Lexicon
SentiWordnet for the feature extraction and the integration of TF-IDF with Lexicon SentiWordnet. Issued
from this system consists of tweet datasets from Twitter totaling 1357, then the dataset is labeled manually.
The output of this study consisted of evaluations using a 10-fold cross validation, then the evaluation was
completed with a confusion matrix. Based on the results of research that has been done, the use of Naïve
Bayes with the extraction of the Lexicon SentiWordnet feature in making Sentiment Analysis systems
proved to be better with 84.75% consultation compared to Naïve Bayes by using the TF- IDF or TF-IDF
feature extraction combined with the Lexicon SentiWordnet.
Keywords: Naïve Bayes, Lexicon SentiWordnet, Twitter, confusion matrix, sentiment analysis, TF-IDF