Identifikasi Karakter Presiden Melalui Analisis Sentimen Pada Twitter Menggunakan Naïve Bayes Classifier Dan Pos Tagging

Authors

  • Bastomy Bastomy Telkom University
  • Anisa Herdiani Telkom University
  • Indra Lukmana Sardi Telkom University

Abstract

Abstrak
Media sosial merupakan salah satu media untuk menyampaikan opini tentang politik, salah satunya
tentang presiden. Opini atau pandangan masyarakat dapat berupa opini positif dan negatif. Menurut
KBBI karakter merupakan kata sifat, dengan demikian opini yang menjadi fokus utama adalah opini
yang memiliki jenis kata sifat. Kita dapat meneliti sentimen yang terdapat pada Twitter berupa tweet
yang menandai presiden untuk mendapatkan karakter. Inti dari penelitian ini menggunakan metode
Naïve Bayes Classifier (NBC) untuk mengklasifikasikan tweet dan POS tagging untuk mengetahui jenis
kata dari setiap tweet positif. Dari pengujian yang telah dilakukan menghasilkan pre-processing seperti
casefolding, tokenizing, penghapusan kata yang tidak memiliki makna, simbol atau tanda baca. Untuk
meningkatkan akurasi NBC digunakan metode N-gram yang bertujuan menggabungkan kata negasi dan
kata selanjutnya untuk menghindari perubahan makna dari kata tersebut. Hasil pengujian klasifikasi
dengan menggunakan metode cross-validation menghasilkan rata-rata akurasi sebesar 80,29% dan POS
tagging menghasilkan akurasi sebesar 73,3% dalam menentukan karakter presiden. pengujian di atas
menunjukkan bahwa identifikasi karakter melalui analisis sentimen menggunakan NBC dan POS tagging
dapat digunakan untuk mendapatkan karakter presiden. Hasil akhir penelitian ini berupa daftar kata
berjenis kata sifat yang telah diurutkan berdasarkan polaritas kemunculannya yang telah divalidasi oleh
ahli Bahasa.

Kata kunci : Analisis sentimen, Naïve Bayes Classifier, N-gram, POS tagging, Preprocessing, Twitter

Abstract
Social media is one of the media to express opinions about politics, one of which is about the president.
Public opinion or opinion can take the form of positive and negative opinions. According to KBBI
characters are adjectives, thus opinions that are the main focus are opinions that have the type of
adjectives. We can consider the sentiments on Twitter in the form of tweets needed by the president to get
the character. The core of this research uses the Naïve Bayes Classifier (NBC) method to classify tweets
and POS markings to understand the type of words of each positive tweet. From the testing that has been
done, it produces pre-processing such as casefolding, tokenizing, deletion of words that do not have
meaning, symbols or punctuation. To improve the accuracy of NBC the N-gram method is used which
replaces the negation words and subsequent words to avoid changing the meaning of the word. Test
results using the cross-validation method produce an average accuracy of 80.29% and POS marking
produces an accuracy of 73.3% in determining the character of the president. Learn above How to
examine characters through sentiment analysis using NBC and POS marking can be used to get the
president's character. The final results of this study contain a list of adjective type words that have been
sorted based on the polarity of their appearance which has been validated by language experts.

Keywords: Naïve Bayes Classifier, N-gram, POS tagging, Preprocessing, Sentiment analysis, Twitter

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika