Analisis Sentimen Pada Media Sosial Twitter Berbahasa Indonesia Dengan Metode Glove
Abstract
Abstrak
Seiring dengan perkembangan media sosial, warganet Indonesia ramai menggunakan media sosial untuk
berbagi informasi. Salah satunya menggunakan fitur cuitan pada media sosial Twitter, untuk membahas
suatu topik tertentu. Bencana merupakan salah satu topik yang ramai dibahas, mulai dari kenapa
terjadinya bencana dan bagaimana penanganannya oleh pihak berwenang. Analisa sentimen dapat
dilakukan untuk menganalisa cuitan dengan topik bencana ini, agar dapat digunakan sebagai tolak ukur
bagaimana penangan bencana dan kenapa bencana itu terjadi menurut pendapat warganet. Pada
penelitian ini dibuat analisa sentimen menggunakan word embedding Global Vector (GloVe) yang bertujuan
untuk meningkat performa analisa sentimen. Model Global Vector dibentuk dari korpus Wikipedia
Indonesia, dengan dataset cuitan dengan topik bencana yang berjumlah 1500 data cuitan. Klasifikasi
sentimen yang digunakan adalah metode deep learning model Long Short-Term Memory (LSTM). Yang
mana model Global Vector diembedd ke dalam layernya. Dalam penelitian ini akan dilakukan dua scenario
pengujian dengan data cuitan dengan label data sentimen seimbang dan pengujian dengan label data
sentimen tidak seimbang. Dari hasil pengujian dengan data seimbang didapatkan akurasi sebesar 73% dan
pada data dengan label tidak seimbang didapatkan presisi 74,5% dan recall 74,5% dengan akurasi 75%.
Kata kunci : analisa sentimen, GloVe, LSTM, Twitter, word embedding
Abstract
Along with the development of social media, Indonesian citizens are often using social media to share
information. One of them uses twitter's social media tweeting feature, to discuss a particular topic. Disasters
are one of the topics that are discussed, ranging from why disasters occur and how they are handled by the
authorities. Sentiment analysis can be done to analyze tweets on the topic of this disaster, so that it can be
used as a benchmark for how disaster management and why disasters occur in the opinion of citizens. In
this study, sentiment analysis was made using the word embedding Global Vector (GloVe) which aims to
improve the performance of sentiment analysis. The Global Vector model was formed from the Corpus
Wikipedia Indonesia, with a dataset of tweets with disaster topics totaling 1500 tweet data. The sentiment
classification used is the deep learning method of the Long Short-Term Memory (LSTM) model. Which is
where the Global Vector model is dimbedded into its layers. In this study, two test scenarios were conducted
with tweet data with balanced sentiment data labels and tests with disproportionate sentiment data labels.
From the test results with balanced data obtained 73% accuracy and in data with unbalanced labels
obtained 74.5% precision and 74.5% recall with 75% accuracy.
Keywords: GloVe, LSTM, sentiment analysis, word embedding
Seiring dengan perkembangan media sosial, warganet Indonesia ramai menggunakan media sosial untuk
berbagi informasi. Salah satunya menggunakan fitur cuitan pada media sosial Twitter, untuk membahas
suatu topik tertentu. Bencana merupakan salah satu topik yang ramai dibahas, mulai dari kenapa
terjadinya bencana dan bagaimana penanganannya oleh pihak berwenang. Analisa sentimen dapat
dilakukan untuk menganalisa cuitan dengan topik bencana ini, agar dapat digunakan sebagai tolak ukur
bagaimana penangan bencana dan kenapa bencana itu terjadi menurut pendapat warganet. Pada
penelitian ini dibuat analisa sentimen menggunakan word embedding Global Vector (GloVe) yang bertujuan
untuk meningkat performa analisa sentimen. Model Global Vector dibentuk dari korpus Wikipedia
Indonesia, dengan dataset cuitan dengan topik bencana yang berjumlah 1500 data cuitan. Klasifikasi
sentimen yang digunakan adalah metode deep learning model Long Short-Term Memory (LSTM). Yang
mana model Global Vector diembedd ke dalam layernya. Dalam penelitian ini akan dilakukan dua scenario
pengujian dengan data cuitan dengan label data sentimen seimbang dan pengujian dengan label data
sentimen tidak seimbang. Dari hasil pengujian dengan data seimbang didapatkan akurasi sebesar 73% dan
pada data dengan label tidak seimbang didapatkan presisi 74,5% dan recall 74,5% dengan akurasi 75%.
Kata kunci : analisa sentimen, GloVe, LSTM, Twitter, word embedding
Abstract
Along with the development of social media, Indonesian citizens are often using social media to share
information. One of them uses twitter's social media tweeting feature, to discuss a particular topic. Disasters
are one of the topics that are discussed, ranging from why disasters occur and how they are handled by the
authorities. Sentiment analysis can be done to analyze tweets on the topic of this disaster, so that it can be
used as a benchmark for how disaster management and why disasters occur in the opinion of citizens. In
this study, sentiment analysis was made using the word embedding Global Vector (GloVe) which aims to
improve the performance of sentiment analysis. The Global Vector model was formed from the Corpus
Wikipedia Indonesia, with a dataset of tweets with disaster topics totaling 1500 tweet data. The sentiment
classification used is the deep learning method of the Long Short-Term Memory (LSTM) model. Which is
where the Global Vector model is dimbedded into its layers. In this study, two test scenarios were conducted
with tweet data with balanced sentiment data labels and tests with disproportionate sentiment data labels.
From the test results with balanced data obtained 73% accuracy and in data with unbalanced labels
obtained 74.5% precision and 74.5% recall with 75% accuracy.
Keywords: GloVe, LSTM, sentiment analysis, word embedding
Full Text:
PDFRefbacks
- There are currently no refbacks.