Klasifikasi Spam Tweet Pada Twitter Menggunakan Metode Naïve Bayes (studi Kasus: Pemilihan Presiden 2019)

Authors

  • Muhammad Hanafiah Telkom University
  • Anisa Herdiani Telkom University
  • Widi Astuti Telkom University

Abstract

Abstrak
Pemilu merupakan wujud dari kebebasan berpendapat dan kebebasan berserikat. Sedangkan arti dari
pemilu itu sendiri adalah proses pemilihan orang untuk mengisi jabatan-jabatan politik tertentu. Pada
tahun 2019 Indonesia telah menyelenggarakan pesta demokrasi 5 tahunan yang telah dilaksanakan pada
tanggal 17 april 2019. Pembahasan tentang pilpres 2019 begitu ramai diperbincangkan termasuk di media
sosial twitter, Twitter telah memperkenalkan fitur Trending Topics sejak tahun 2018. Fitur ini
memudahkan pengguna untuk mengetahui berita atau informasi terbaru di seluruh dunia secara real
time. Bagi pengguna yang ingin melakukan promosi produk tentunya hal ini akan sangat bermanfaat
bagi mereka, apalagi disertai dengan hashtag yang berkaitan dengan pilpres 2019 yang sedang ramai
diperbincangkan. Dengan cara ini, mereka dapat mempromosikan konten dagangan mereka ke calon
pembeli dengan lebih cepat. Hal ini menyebabkan para pengguna biasa membuang banyak waktu dalam
memilih dan memilah informasi atau berita yang mereka inginkan karena konten yang tidak perlu
muncul secara terus menerus atau dapat juga disebut dengan spam. Dalam menghadapi permasalahan
tersebut, maka dari itu pada tugas akhir telah dibangun suatu sistem menggunakan metode Naive Bayes
untuk mengklasifikasi sekumpulan tweet kedalam dua kelas yaitu spam dan non spam. Sebelum
memasuki proses pengklasifikasian, sistem melakukan preprocessing terhadap dataset yang digunakan,
hal tersebut bertujuan untuk meningkatkan performansi dari ke dua metode yang digunakan. Dalam
penelitian ini Naïve Bayes dengan preprocessing dan Naïve Bayes tanpa preprocessing masing-masing
menghasilkan nilai akurasi 76,34% dan 74,14%.

Kata Kunci: Pemilu, Twitter, Tweet, Spam, Naïve Bayes.

Abstract
Elections are a manifestation from freedom of opinion and freedom of association. Whereas the meaning of
the election itself is the process of selecting people to fulfill certain political positions. In 2019 Indonesia has
held a 5 years democratic party which will be held on 17 April 2019. Discussions about the 2019 presidential
election are so widely discussed including on social media twitter, Twitter has introduced the Trending Topics
feature since 2018. This feature makes it easy for users to know the news or the latest information around the
world in real time. For users who want to carry out product promotions surely this will be very beneficial for
them, especially accompanied by the 2019 replace the president election hashtag which is widely being
discussed. In this way, they can promote their merchandise to potential buyers faster. This causes ordinary
users to waste a lot of time in choosing and sorting information or news they want due to content that does
not need to appear continuously or can also be called spam. In dealing with these problems, therefore in this
final project will be built a system using the Naive Bayes method to classify a set of tweets into two classes
namely spam and non spam. Before entering the classification process, the system preprocesses the data set
used, it aims to improve performance from the two methods used. In this study Naive Bayes with
preprocessing and Naive Bayes without preprocessing each produced an accuracy value of 76,34% and
74,14%.

Keywords: Election, Twitter, Tweet, Spam, Naïve Bayes

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika