Prediksi Kepribadian Disc Pada Twitter Menggunakan Metode Decision Tree C4.5 Dengan Pembobotan Tf-idf Dan Tf-rf

Penulis

  • Maulina Gustiani Tambunan Telkom University
  • Erwin Budi Setiawan Telkom University

Abstrak

Abstrak Media sosial online berperan penting bagi kebutuhan manusia sehari-hari, yang dapat membangun konektivitas antara pengguna dengan pengguna lainnya. Di zaman yang modern ini hampir setiap kalangan memiliki media sosial sebagai sarana informasi dan sebagai ungkapan dengan sudut pandang keperibadian masing-masing pengguna atas berbagai aspek kehidupan. Dengan menggunakan media sosial di twitter, penulis dapat menemukan berbagai macam karakter dan keperibadian yang dimiliki oleh masing-masing pengguna media sosial. Salah satu permasalahannya adalah bagaimana mengklarifikasi kepribadian seseorang melalui tweet pada media sosial twitter. Maka dalam hal ini, penulis melakukan klasifikasi kepribadian pengguna twitter dengan menggunakan penilaian DISC serta membangun sistem klasifikasi kepribadian untuk mengetahui tingkat akurasi algoritma metode Decision Tree C4.5 dan nilai performansi yang baik. Yang membedakan penelitian ini dengan penelitian lainnya adalah setiap kata menggunakan metode pembobotan TF-IDF dan TF-RF. Followers, following, retweet, hastag, huruf besar, huruf kecil, emoticon dan lainnya merupakan sarana pendekatan berdasarkan prilaku sosial pengguna. Percobaan melalui pendekatan perilaku sosial didapatkan hasil nilai Bi Class Dominance adalah sebesar 97.56, Influence sebesar 70.13, Steadiness sebesar 57.14, Compliance sebesar 73.34. Percobaan melalui pendekatan linguistik TF-IDF didapatkan hasil nilai Bi Class Dominance adalah 97.50, Influence sebesar 73.17, Steadiness sebesar 46.15, Compliance sebesar 74.36. Percobaan melalui pendekatan linguistik TF-RF didapatkan hasil nilai Bi Class Dominance adalah sebesar 100, Influence sebesar 75.00, Steadiness sebesar 53.28, Compliance sebesar 72.50. Hasil perhitungan F-Measure dari pendekatan perilaku sosial adalah sebesar 0.2626 dari data latih dan data uji 80 :20, melalui pendekatan linguistik pada TF-IDF didapatkan hasil perhitungan F-Measure sebesar 0.3010 dari data latih dan data uji 90 :10, dan percobaan melalui pendekatan linguistik pada TF-RF didapatkan hasil F-Measure sebesar 0.4824 dari data latih dan data uji 90 :10. Kata Kunci : DISC, Decision Tree C4.5, TF-IDF, TF-RF, Twitter Abstract Online social media plays an important role for everyday human needs, which can build connectivity between users and other users. In this modern era almost every society has social media as a means of information and as an expression with each user's personal perspective on various aspects of life. By using social media on Twitter, the author can find a variety of characters and personality possessed by each social media user. One problem is how to clarify one's personality through tweets on Twitter social media. So in this case, the writer classifies the personality of Twitter users by using the DISC assessment and builds a personality classification system to determine the accuracy of the Decision Tree C4.5 algorithm algorithm and good performance value. What distinguishes this study from other studies is that each word uses the TF-IDF and TF-RF weighting methods. Followers, following, retweet, hashtag, uppercase, lowercase, emoticons and others are a means of approach based on the user's social behavior. Experiments through the approach of social behavior obtained the value of Bi Class Dominance is 97.56, Influence is 70.13, Steadiness is 57.14, Compliance is 73.34. Experiments through the TF-IDF linguistic approach showed that the Bi Class Dominance value was 97.50, Influence was 73.17, Steadiness was 46.15, Compliance was 74.36. Experiments through the TF-RF linguistic approach showed that the Bi Class Dominance value was 100, Influence was 75.00, Steadiness was 53.28, Compliance was 72.50. The F-Measure calculation results from the social behavior approach is 0.2626 from the training data and 80: 20 test data, through the linguistic approach on TF-IDF, the F-Measure calculation results are obtained from 0.3010 from the training data and 90: 10 test data, and experiments through linguistic approach to TF-RF obtained F-Measure results of 0.4824 from training data and 90: 10 test data. Keywords : DISC, Decision Tree C.45, TF-IDF, TF-RF, Twitter

##submission.downloads##

Diterbitkan

2020-04-01

Terbitan

Bagian

Program Studi S1 Informatika