Prediksi Kepribadian Disc Dengan K-nearest Neighbors Algorithm (knn) Menggunakan Pembobotan Tf-idf Dan Tf-chi Square

Authors

  • Nur Ihsan Putra Munggaran Telkom University
  • Erwin Budi Setiawan Telkom University

Abstract

Abstrak
Media sosial berkembang pesat pada saat ini. Salah satu media sosial yang berkembang dengan sangat pesat
adalah twitter. Twitter adalah media sosial yang di dalamnya berisikan informasi seperti biografi seseorang dan
tweet atau cuitan dari penggunanya. Oleh karena informasi yang kita dapatkan di twitter bisa dimanfaatkan untuk
menggambarkan kepribadian seseorang. Ada banyak metode yang bisa digunakan untuk mengetahui kepribadian
seperti Big 5, MBTI dan DISC. Dalam penelitian ini penulis menggunakan metode DISC (Dominance Influence
Steadiness Conscientiousness) karena metode ini masih sangat sedikit digunakan untuk penelitian, dan penulis
menggunakan metode pengklasifikasian dari data mining dengan metode pengklasifikasian K- Nearest Neighbors
Algorithm (KNN). Fitur linguistic yang akan digunakan dibagi menjadi dua bagian yaitu fitur katagori kata dari
corpus yang dibangun secara manual dan fitur yang didapatkan langsung dari data twitter menggunakan twitter
apps. Penelitian ini akan sangat berguna untuk pemilihan sumber daya manusia karena bisa menghemat biaya
dan tenaga yang dikeluarkan, dengan menggunakan aplikasi ini bisa menentukan kepribadian seseorang hanya
dengan menggunakan media sosial twitter. Metode pembobotan yang digunakan dalam penelitian ini adalah TF-
IDF dan TF-Chi Square yang berguna untuk mengukur bobot setiap kata pada sebuah tweet. Dari hasil percobaan
didapatkan akurasi terbaik sebesar 40.60% pada perbandingan data latih dan data uji sebesar 60:40 dan
pendekatan linguistik dengan menggunakan skenario pendakatan perilaku sosial dengan pemilihan nilai k
sebesar 61.
Kata Kunci : DISC, KNN, TF-IDF, TF-Chi Square, Twitter


Abstract
Social media is growing rapidly at this time. One of the fastest growing social media is Twitter. Twitter is social
media which contains information such as someone's biography and tweets or tweets from users. Because the
information we get on twitter can be used to describe a person's personality. There are many methods that can
be used to find out personalities such as Big 5, MBTI and DISC. In this study the author uses the DISC
( Dominance Influence Steadiness Conscientiousness ) method because this method is still very little used for
research, and the author uses the classification method of data mining with classification methodsK-Nearest
Neighbors Algorithm (KNN). The linguistic feature that will be used is divided into two parts, namely the word
category feature from the manually built corpus and features obtained directly from twitter data using
twitter apps. This research will be very useful for the selection of human resources because it can save costs and
labor spent, using this application can determine one's personality using only social media twitter. The
weighting method used in this study is TF-IDF and TF- Chi Square which is useful for measuring the weight of
each word in a tweet . From the results of the experiments obtained accuracy the best is 40. 60 % in the
comparison of training data and test data at 60:40 and the linguistic approach using a social
behavior approach scenario with the selection of a k value of 61.
Keywords : DISC, KNN, TF-IDF, TF-Chi Square, Twitter

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika