Analisis Sentimen Pada Media Sosial Twitter Berbahasa Indonesia Dengan Metode Glove
Abstract
Abstrak Seiring dengan perkembangan media sosial, warganet Indonesia ramai menggunakan media sosial untuk berbagi informasi. Salah satunya menggunakan fitur cuitan pada media sosial Twitter, untuk membahas suatu topik tertentu. Bencana merupakan salah satu topik yang ramai dibahas, mulai dari kenapa terjadinya bencana dan bagaimana penanganannya oleh pihak berwenang. Analisa sentimen dapat dilakukan untuk menganalisa cuitan dengan topik bencana ini, agar dapat digunakan sebagai tolak ukur bagaimana penangan bencana dan kenapa bencana itu terjadi menurut pendapat warganet. Pada penelitian ini dibuat analisa sentimen menggunakan word embedding Global Vector (GloVe) yang bertujuan untuk meningkat performa analisa sentimen. Model Global Vector dibentuk dari korpus Wikipedia Indonesia, dengan dataset cuitan dengan topik bencana yang berjumlah 1500 data cuitan. Klasifikasi sentimen yang digunakan adalah metode deep learning model Long Short-Term Memory (LSTM). Yang mana model Global Vector diembedd ke dalam layernya. Dalam penelitian ini akan dilakukan dua scenario pengujian dengan data cuitan dengan label data sentimen seimbang dan pengujian dengan label data sentimen tidak seimbang. Dari hasil pengujian dengan data seimbang didapatkan akurasi sebesar 73% dan pada data dengan label tidak seimbang didapatkan presisi 74,5% dan recall 74,5% dengan akurasi 75%. Kata kunci : analisa sentimen, GloVe, LSTM, Twitter, word embedding Abstract Along with the development of social media, Indonesian citizens are often using social media to share information. One of them uses twitter's social media tweeting feature, to discuss a particular topic. Disasters are one of the topics that are discussed, ranging from why disasters occur and how they are handled by the authorities. Sentiment analysis can be done to analyze tweets on the topic of this disaster, so that it can be used as a benchmark for how disaster management and why disasters occur in the opinion of citizens. In this study, sentiment analysis was made using the word embedding Global Vector (GloVe) which aims to improve the performance of sentiment analysis. The Global Vector model was formed from the Corpus Wikipedia Indonesia, with a dataset of tweets with disaster topics totaling 1500 tweet data. The sentiment classification used is the deep learning method of the Long Short-Term Memory (LSTM) model. Which is where the Global Vector model is dimbedded into its layers. In this study, two test scenarios were conducted with tweet data with balanced sentiment data labels and tests with disproportionate sentiment data labels. From the test results with balanced data obtained 73% accuracy and in data with unbalanced labels obtained 74.5% precision and 74.5% recall with 75% accuracy. Keywords: GloVe, LSTM, sentiment analysis, word embeddingDownloads
Published
2020-12-01
Issue
Section
Program Studi S1 Informatika