Mendeteksi Spammers Di Twitter Dengan Svm Classifier

Damarsari Cahyo Wilogo, Erwin Budi Setiawan, Yuliant Sibaroni

Abstract

Abstrak Dalam Tugas Akhir ini dibahas tentang pemodelan dan simulasi mendeteksi spammer di Twitter dengan menggunakan metode Support Vector Machine (SVM). Banyaknya spam pada media sosial salah satunya Twitter dapat mempengaruhi pengguna Twitter dalam mendapatkan informasi yang dapat dipertanggungjawabkan kebenaran dari informasi tersebut, sehingga dibutuhkan suatu teknik untuk mendeteksi bahwa suatu konten merupakan spam atau tidak. Maka pada penelitian ini menggunakan metode SVM dalam mengklasifikasi spam. Pemilihan metode SVM ini dikarenakan dari beberapa penelitian bahwa metode ini dapat memberikan hasil yang baik dalam proses klasifikasi. Pada penelitian ini memberikan hasil akurasi sebesar 96.67% pada rasio 90 data training 10 data testing dengan menggunakan seluruh fitur, untuk penggunaan kelompok fitur tweet hasil akurasi tertinggi didapatkan pada rasio 80:20 sebesar 96.67%, dan untuk penggunaan kelompok fitur user hasil akurasi tertinggi didapatkan pada rasio 60:40 sebesar 75%. Dari pengujian tersebut penggunaan kelompok fitur tweet memberikan hasil yang sangat berpengaruh dibandingkan dengan penggunaan kelompok fitur user, hal ini dibuktikan dengan hasil akurasi dari penggunaan kelompok fitur tweet sama dengan hasil akurasi dari penggunaan seluruh fitur.

Kata kunci : Twitter, Support Vector Machine (SVM), Spam, Klasifikasi

Abstract In this final project discussed about modeling and simulation detecting spammers on Twitter by using Support Vector Machine (SVM) method. Many of spam on social media one of which Twitter can affect Twitter users in getting information that can be justified the truth of the information, so it takes a technique to detect a content is a spam or not, so in this final project using SVM method in classifying spam. The selection of SVM method is because of some research that this method can give good results in the process of classification. In this research, the result of accuracy is 96.67% at 90 for training 10 for testing ratio using all features, for the use of tweet feature group the highest accuracy result is found in 80:20 ratio of 96.67%, and for user feature group usage the highest accuracy result is found in ratio 60:40 by 75%. From these research the use of tweet feature groups gives a very influential result compared to the use of user feature groups, as evidenced by the accuracy of using the tweet feature group equal to the accuracy of the use of all features.

Keywords: Support Vector machine (SVM), Spam, Twitter, Classification

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0