Prediksi Big Five Personality dengan Term Frequency Inverse Document Frequency (TF – IDF) Menggunakan Metode Logistic Regression pada Pengguna Twitter

Authors

  • Rendo Zenico Telkom University
  • Erwin Budi Setiawan Telkom University
  • Fida Nurmala Nugraha Telkom University

Abstract

Kepribadian atau personality bisa didefinisikan sebagai keseluruhan cara seseorang bereaksi dan berinteraksi dengan lingkungan maupun dengan individu lainnya. Penelitian yang berkaitan dengan kepribadian seseorang sudah banyak dilakukan para ahli untuk kepentingan tertentu. Penelitian terhadap kepribadian seseorang dalam penggunaan media sosial juga sudah mulai banyak dikembangkan. Salah satu media sosial yang digunakan untuk mengamati dan meneliti kepribadian dari seseorang adalah Twitter. Dengan banyaknya pengguna aktif pada Twitter, setiap individu pasti memiliki ciri yang berbeda dalam menggunakan akun Twitter mereka. Pada penelitian tugas akhir ini, penulis membangun sistem klasifikasi kepribadian pengguna Twitter. Penelitian yang dilakukan menggunakan dua pendekatan, yaitu pendekatan linguistik dan pendekatan perilaku sosial dengan menggunakan fitur dari Twitter itu sendiri. Data yang digunakan adalah data dari 143 pengguna Twitter dengan jumlah 351,197 tweet dengan rasio perbandingan data latih dan data uji 70%:30%. Menggunakan pembobotan Term Frequency Inverse Document Frequency (TF – IDF) dan Logistic Regression sebagai algoritma klasifikasi, akurasi yang dihasilkan oleh sistem yang dibangun pada tugas akhir ini 69% untuk pendekatan perilaku sosial dan 76,20% untuk pendekatan linguistik dan pendekatan perilaku sosial. Kata kunci : twitter, pembobotan, TF – IDF, logistic regression

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Ilmu Komputasi