Klasifikasi Topik Berita Berbahasa Indonesia Menggunakan Weighted K-nearest Neighbor
Abstrak
Berita adalah salah satu sarana informasi bagi masyarakat umum. Di jaman yang modern ini orang-orang banyak menggunakan media online sebagai salah satu sarana untuk mengakses berita. Di Indonesia sendiri media online memiliki presentase paling besar sebagai sarana penyampaian berita [1]. Namun banyaknya berita yang ada dalam media online memunculkan masalah dalam mengkategorikan topik berita yang ada. Sehingga dibutuhkanlah sistem yang dapat mengkategorikan setiap topik berita yang ada pada media online. Penelitian ini bertujuan menciptakan sistem yang mampu mengkategorikan setiap berita berbahasa Indonesia pada kelas yang seharusnya. Pengklasifikasian menggunakan metode weighted k-Nearest Neighbor (wkNN) karena merupakan classifier yang sederhana namun powerful. Pada penelitian ini terdapat beberapa tahap dalam perancangan sistem, yaitu preprocessing data, feature extraction, dan pengklasifikasian menggunakan weighted k-Nearest Neighbor. Setelah tahap-tahap tersebut dilalui dilakukanlah pengukuran performansi. Hasil penelitian mampu memberikan performa sistem sebesar 75,86% dengan nilai k = 27.