Analisis Perbandingan Pembobotan Tf-idf Dan Tf-rf Pada Trending Topic Di Twitter Dengan Menggunakan Klasifikasi K-nearest Neighbor

Authors

  • Agung N Assidyk Telkomuniversity
  • Erwin Budi Setiawan Telkomuniversity
  • Isman Kurniawan Telkomuniversity

Abstract

Abstrak

Media sosial yang sedang berkembang saat ini adalah twitter. Twitter merupakan media sosial yang di dalamnya berisikan informasi seperti biografi seseorang, informasi, tweet atau cuitan dari penggunanya. Informasi yang didapatkan dari twitter dapat dimanfaatkan untuk memprediksi suatu topik yang sedang tren atau trending. Pada penelitian ini membahas perbandingan metode pembobotan yang digunakan di suatu topik yang sedang trending topic yaitu TF-RF dan TF-IDF untuk memberikan suatu nilai/bobot pada term yang terdapat pada suatu dokumen. dan menggunakan metode pengklasifikasian dari data mining dimana metode yang digunakan adalah metode pengklasifikasian K-Nearest Neighbor, Hasil penelitian dilakukan berdasarkan berita dan percakapan diambil dari media twitter. Akurasi K-Nearest Neighbor nilai terbaik mengunakan K=1 dengan pembagian data training dan data testing (90:10) pembobotan TFIDF adalah 63,12% dengan precision 0,633 dan recall 0,633 sedangkan TF-RF yaitu 62,48 % dengan precision 0,623 dan recall 0,623.

Kata kunci : Trending, TF-IDF, TF-RF, K-Nearest Neighbor


Abstract

The social media that is currently developing is Twitter. Twitter is a social media that contains information such as a person biography, information, tweets or tweets from users. Information obtained from Twitter can be used to predict a trending topic. This research discusses comparison of the weighting methods used in a trending topic, that is TF-RF and TF-IDF to give a weight to the term contained in a document. and using the classification method of data mining where the method used is the K-Nearest Neighbor classification method. The results of the study are based on news and conversations taken from Twitter . Accuracy of K-Nearest Neighbor the best value using K = 1 with the distribution of training data and testing data (90:10) weighting TF-IDF is 63,10% with precision 0.633 and recall 0.633 while TF-RF is 62,48% with precision 0.623 and recall 0.623.

Keywords: Trending, TF-IDF, TF-RF, K-Nearest Neighbor

Downloads

Published

2020-08-01

Issue

Section

Program Studi S1 Informatika