Pengaruh Seleksi Fitur Information Gain pada Klasifikasi Berita Hoax di Twitter dengan Menggunakan Metode Naive Bayes Multinomial
Abstract
Abstrak - Indonesia merupakan salah satu negara
yang memiliki banyak pengguna media sosial, konsumsi
media sosial yang tinggi tanpa dibarengi dengan sikap
kritis dalam melakukan filter informasi yang didapat
membuat berita hoax menjadi semakin mudah
tersebarluaskan. Hoax merupakan berita yang
disebarkan dengan tujuan agar publik mempercayai
hal yang tidak diketahui kebenarannya. Hoax dapat
menimbulkan adanya kecemasan dan permusuhan bagi
pihak yang terpapar. Pada penelitian tugas akhir ini,
dibangun sistem klasifikasi berita hoax di twitter
dengan menggunakan metode naive bayes multinomial
yang dikombinasikan menggunakan pembobotan TFIDF serta penggunaan seleksi fitur information gain.
Hasil akhir pengujian menunjukkan bahwa
penggunaan information gain pada klasifikasi hoax ini
dapat mengurangi nilai overfitting dari akurasi. Hasil
akurasi terbaik yang didapat dari penelitian ini adalah
sebesar 79,87% dengan menggunakan klasifikasi Naive
Bayes Multinomial, pembobotan TD-IDF, dan tanpa
penggunaan seleksi fitur Information Gain.
Kata kunci : hoax, twitter, TF-IDF, information gain, naive bayes multinomial
References
DataIndonesia.id, "Pengguna media sosial di
Indonesia," 3 February 2023. [Online].
Available: dataindonesia.id/internet/detail/pengguna-media-sosial-di-indonesia-sebanyak-167-
juta-pada-2023. [Accessed 21 April 2023].
Annisa, A. Rahmadhany, A. A. Safitri and I. , "Fenomena Penyebaran Hoax dan Hate Speech
pada Media Sosial," Jurnal Teknologi dan Informasi Bisnis, vol. 3, no. 1, pp. 30-43, 2021.
MASTEL, "mastel.id," [Online]. Available: mastel.id/hasil-survey-wabah-hoaxnasional-2019/. [Accessed 24 01 2023].
D. R. Rahadi, "Perilaku Pengguna dan Informasi Hoax di Media Sosial," Jurnal Manajemen & Kewirausahaan, vol. 5, no. 1, pp. 58-70, 2017.
R. E. Hamzah and C. E. Putri, "Mengenal dan Mengantisipasi Hoax di Media Sosial pada
Kalangan Pelajar," Jurnal Abdi MOESTOPO, Vols. Vol. 03, No. 01, no. ISSN: 2599-249X, pp. 9-12, 2020.
A. V. Sandifer, C. Wilson and A. Olmsted, "Detection of Fake Online Hotel Reviews," in
International Conference for Internet Technology and Secured Transactions (ICITST), 2017.
H. K. Farid, E. B. Setiawan and I. Kurniawan, "Implementasi Seleksi Fitur Information Gain
pada Pendeteksian Berita Hoax di Twitter dengan Menggunakan Convolutional Neural Network (CNN)," Indo-JC Indonesia Journal
on Computing, vol. 5, no. 3, 2020.
A. E. Irsad, Y. A. Sari and M. A. Fauzi, "Seleksi Fitur Information Gain untuk Klasifikasi Informasi Tempat Tinggal di Kota Malang
Berdasarkan Tweet Menggunakan Metode Naive Bayes dan Pembobotan TF-IDF-CF,"
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Vols. Vol. 3, No. 5, no. e-ISSN: 2548-964X, pp. 4907-4913, 2019.
C. S. Sriyano and E. B. Setiawan, "Pendeteksian Berita Hoax Menggunakan Naive Bayes Multinomial Pada Twitter dengan Fitur
Pembobotan TF-IDF," e-Proceeding of Engineering, Vols. Vol.8, No.2, no. ISSN : 2355-9365, p. 3396, Vol.8, No.2 April 2021.
KOMINFO, "kominfo.go.id," Melawan "hoax" - Kementerian Komunikasi dan Informatika,
[Online]. Available: www.kominfo.go.id/content/detail/8790
/melawan-hoax/0/sorotan_media. [Accessed 24 01 2023].
C. Kamilah and N. Atnan, "Analisis Kemampuan Mahasiswa Bandung Raya dalam
Mengidentifikasi Hoax," Jurnal Ilmu Komunikasi, vol. 10, no. 1, 2021.
C. Juditha, "Interaksi Komunikasi Hoax di Media Sosial serta Antisipasinya," Jurnal Pekommas, Vols. 3, No 1, 2018.
H. Chumairoh, "Ancaman Berita Bohong di Tengah Pandemi Covid-19," VOX POPULI,
vol. Vol.3, no. ISSN (Print): 2087-3360 (Online): 2714-7657, pp. 22-30, 2020.
KOMINFO, "Ciri Ciri dan akibat hoaks," 13
March 2019. [Online]. Available: aptika.kominfo.go.id/2019/03/ciri-ciriakibat-dan-kenapa-kita-mudah-percaya-hoaks/.
[Accessed 22 April 2023].
T. H. Lubis and I. Koto, "Diskursus Kebenaran
Berita Berdasarkan Undang-Undang Nomor 40
Tahun 1999 Tentang Pers Dan Kode Etik Jurnalistik," DELEGALATA (Jurnal Ilmu
Hukum), vol. 5, no. 2, 2020.
B. Irena and E. B. Setiawan, "Identifikasi Berita
Palsu (Hoax) Pada Media Sosial Twitter dengan
Metode Decision Tree C4.5," Resti (Rekayasa Sistem dan Teknologi Informasi), Vols. vol.9,,
no. ISSN: 2355-9365, p. 1853, 2020.
D. H. Kalokasari, I. M. Shofi and A. H.
Setyaningrum, "Implementasi Algoritma Multinomial Naive Bayes Classifier Pada
Sistem Klasifikasi Surat Keluar (Studi Kasus : DISKOMINFO Kabupaten Tangerang),"
JURNAL TEKNIK INFORMATIKA, Vols. VOL.10 NO.2,, p. 109, 2017.
F. Handayani and F. S. Pribadi, "Implementasi Algoritma Naive Bayes Classifier dalam
Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan
Call Center 110," Jurnal Teknik Elektro, Vols. 7, No.1, 2015.
A. Sabrani, I. G. P. W. Wedashwara W and F. Bimantoro, "Metode Multinomial Naive Bayes
Untuk Klasifikasi Artikel Online Tentang Gempa di Indonesia," JTIKA, Vols. Vol. 2, No.
,, no. ISSN:2657-0327, 2020.
W. A. Firmansyach, "Analisa Terjadinya
Overfitting dan Underfitting pada Algoritma Naive Bayes dan Decision Tree dengan Teknik
Cross Validation," JATI (Jurnal Mahasiswa Teknik Informatika), Vols. 7, No 1, 2023.