Analisis Dan Implementasi Algoritma C4.5 Dan Pembobotan Tf-idf Untuk Menentukan Trending Topic Pada Media Sosial Twitter
Abstract
Abstrak Twitter merupakan media sosial microblogging dengan perkembangan tercepat diantara semua media sosial. Pesan yang disematkan pada twitter merupakan kejadian yang sedang terjadi. Dengan banyaknya penggunaan twitter saat ini, banyaknya jumlah tweet yang disematkan setiap harinya dapat dikelompokan menjadi sebuah trending topik yang meggambarkan berita yang banyak dibicarakan pada saat ini. Permasalahannya adalah bagaimana tweet yang disematkan ini dapat manjadi sebuah berita yang dibicarakan banyak penggunanya dengan mapping atau pembagian kelas untuk setiap tweet yang disematkan dan bagaimana sebuah tweet dapat dijadikan kedalam satu kelas tertentu. Pada penelitian tugas akhir ini, penulis membangun sistem untuk mengklasifikasi trending topik dan menganalisa trending topik twitter apa yang kemungkinan muncul menggunakan algoritma C4.5 dengan metode pembobotan TF-IDF untuk memperoleh hasil yang maksimal.
Kata Kunci: TF-IDF, Twitter, C4.5, Trending Topik,
Abstract Twitter is the fastest growing microblogging social media among all social media. Messages embedded in Twitter are events that are happening. With the current number of Twitter uses, the number of tweets embedded with each payment can be recognized as a trending topic that illustrates the news that is widely discussed at the moment. The problem is how these embedded tweets can be the news that many users talk about by mapping or class divisions for each tweet embedded and how tweets can be used for one specific class. In this final project research, the author makes a system to classify trending topics and analyze what Twitter trending topics appear using the C4.5 algorithm with the TF-IDF weighting method to obtain maximum results.
Keywords: TF-IDF, Twitter, C4.5, Trending Topic