Klasifikasi Teks Dengan Menggunakan Algoritma K-nearest Neighbor Pada Kasus Kinerja Pemerintah Di Twitter

Authors

  • Octaryo Sakti Yudha Prakasa Telkom University
  • Kemas Muslim Lhaksmana Telkom University

Abstract

Abstrak
Seiring dengan perkembangan teknologi yang begitu cepat dalam hal pengumpulan dan penyimpanan data menyebabkan tumpukan data yang sangat banyak. Dengan adanya kumpulan data yang banyak, maka muncullah suatu kebutuhan untuk bisa memanfaatkan data tersebut. Pemanfaatan data tersebut tentunya bertujuan untuk mendapatkan informasi yang penting dari pola-pola data yang terbentuk. Data yang dapat digunakan bisa diambil di sosial media salah satunya twitter. Twitter adalah salah satu media sosial yang cukup digemari oleh seluruh kalangan, tercatat sekitar 50 juta orang di Indonesia menggunakan twitter. Dengan banyaknya pengguna twitter maka data yang dapat dimanfaatkan juga banyak. Cara untuk mendapatkan informasi dari sebuah data bisa menggunakan metode klasifikasi. Salah satu algoritma dalam klasifikasi adalah algortima K-Nearest Neighbor Classifier. Algoritma KNN mempunyai sistem kerja dengan menghitung jarak terdekat dari record uji ke record testing dengan menggunakan metode Eucliden Distance. Hasil dari proses KNN berupa jarak terdekat dari record uji ke record testing sebanyak K yang diperlukan.

Kata Kunci : Twitter, Text Mining, Klasifikasi, K-Nearest Neighbor Classifier, Euclidean Distance

Abstract With the development of very fast technology in terms of storage and data storage produces very much data. With the existence of large data sets, it appears the need to be able to utilize the data. Utilization of the data is intended to obtain important information from the data patterns formed. Data that can be used in social media one of them twitter. Twitter is one of the social media that is favored by all circles, diesel around 50 million people in Indonesia using twitter. With the twitter then the data can be used also a lot. The way to obtain information from a data can use the classification method. One of the algorithms in the classification is the K-Nearest Neighbors Classifier algorithm. KNN algorithm has a working system by calculating the distance from the test record to record testing using the Eucliden Distance method. The result of the KNN process is the closest distance from the test record to the required K test record.


Keywords : Twitter, Text Mining, Klasifikasi, K-Nearest Neighbor Classifier, Euclidean Distance

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Ilmu Komputasi