Perancangan Dan Analisis Clustering Data Menggunakan K-medoids Untuk Berita Berbahasa Inggris

Harival Zayuka, Surya Michrandi Nasution, Yudha Purwanto

Abstract

Saat ini perkembangan dunia teknologi dan informasi sangat berkembang dengan pesat. Tidak heran hal ini ini terjadi juga pada jumlah dokumen berita khususnya berita digital yang ada pada media online. Hal ini menyebabkan semakin sulitnya untuk melakukan pencarian terhadap suatu topik berita. Clustering merupakan salah satu metode data mining yang bersifat unsupervised learning untuk mengelompokkan dokumen berdasarkan kemiripannya. Untuk melakukan pengelompokan tersebut, digunakan salah satu algoritma clustering yaitu Partitioning Around Medoid (PAM). Partitioning Around Medoid merupakan suatu algoritma clustering yang berusaha melakukan pengelompokan suatu dataset dengan mencari terlebih dahulu sejumlah titik yang merepresentasikan suatu cluster (medoid). Setelah mendapatkan k-medoid dokumen pada dataset dikelompokan kedalam cluster yang memiliki jarak ke medoid terdekat. Adapun metode pendekatan yang digunakan untuk menghitung jarak antar dokumen adalah euclidean distance method. Nilai rangking yang dibangun menggunakan metode TF*IDF pada penelitian ini dapat dijalankan sehingga dapat diketahui hasil summary dari berita pertama yang mempunyai nilai rangking 2.4082399653118496 dan berita kedua yang mempunyai nilai rangking 3.4614262661931448 dan sesuai dengan penentuan kalimat utama dalam website tersebut. Kata kunci : Partitioning Around Medoid, K-Medoids, Euclidean Distance Method.

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0