Klasifikasi Kepribadian Berdasarkan Data Twitter dengan Menggunakan Metode Support Vector Machine

Authors

  • Alvini Fikriani Telkom University
  • Ibnu Asror Telkom University
  • Yusza Reditya Murti Telkom University

Abstract

Abstrak Jejaring sosial menjadi media yang banyak digunakan dan populer untuk penyebaran informasi serta fasilitator interaksi sosial. Interaksi pengguna memberikan wawasan berharga tentang karakteristik dan perilaku individu. Twitter merupakan layanan microblogging. Aktifitas utama twitter adalah mem-posting teks yang pendek (tweet) melalui web atau mobile.Kepribadian merupakan sebuah sikap yang unik terhadap seseorang dalam berperilaku. Untuk mengetahui kepribadian seseorang berdasarkan statusstatus (tweet) yang mereka tulis di Twitter dilakukan teknik klasifikasi teks menggunakan metode Multiclass Support Vector Machine. Bahasa yang digunakan adalah Bahasa Indonesia. Hasil pengujian dengan menggunakan 10 Fold Cross Validation menunjukan Akurasi yang didapatkan dengan menggunakan strategi One-against-One dan One-against-All dan membandingkan penggunaan dengan dan tanpa Symbol removing. Hasil percobaan didapatkan menggunakan One-against-One dengan dan tanpa Symbol removing menghasilkan akurasi 86.55% dan 86.88%, sedangkan menggunakan One-against-All dengan dan tanpa Symbol removing 85.24% dan 85.07%. Kata kunci : Kepribadian, Twitter, klasifikasi Teks Abstract Social networks have become a widely used and popular media for disseminating information and facilitating social interaction. User interaction provides valuable insights about individual characteristics and behavior. Twitter is a microblogging service. The main activity of Twitter is posting short texts (tweets) via the web or mobile. Personality is a unique attitude towards someone in their behavior. To find out someone's personality based on the statuses (tweets) they wrote on Twitter, a text classification technique was performed using the Multiclass Support Vector Machine method. The language used is Indonesian. The test results using 10 Fold Cross Validation show the accuracy obtained by using the One-against-One and One-against-All strategies and compare the use with and without Symbol removing. The experimental results obtained using One-against-One with and without Symbol removing produces an accuracy of 86.55% and 86.88%, while using One-against-All with and without Symbol removing 85.24% and 85.07%. Keywords: personality,Twitter,text classification

Downloads

Published

2019-12-01

Issue

Section

Program Studi S1 Informatika