Pengaruh Seleksi Fitur Information Gain pada Klasifikasi Berita Hoax di Twitter dengan Menggunakan Metode Naive Bayes Multinomial

Authors

  • Annisa Dwi Andiani Telkom University
  • Kemas Muslim L Telkom University

Abstract

Abstrak - Indonesia merupakan salah satu negara
yang memiliki banyak pengguna media sosial, konsumsi
media sosial yang tinggi tanpa dibarengi dengan sikap
kritis dalam melakukan filter informasi yang didapat
membuat berita hoax menjadi semakin mudah
tersebarluaskan. Hoax merupakan berita yang
disebarkan dengan tujuan agar publik mempercayai
hal yang tidak diketahui kebenarannya. Hoax dapat
menimbulkan adanya kecemasan dan permusuhan bagi
pihak yang terpapar. Pada penelitian tugas akhir ini,
dibangun sistem klasifikasi berita hoax di twitter
dengan menggunakan metode naive bayes multinomial
yang dikombinasikan menggunakan pembobotan TFIDF serta penggunaan seleksi fitur information gain.
Hasil akhir pengujian menunjukkan bahwa
penggunaan information gain pada klasifikasi hoax ini
dapat mengurangi nilai overfitting dari akurasi. Hasil
akurasi terbaik yang didapat dari penelitian ini adalah
sebesar 79,87% dengan menggunakan klasifikasi Naive
Bayes Multinomial, pembobotan TD-IDF, dan tanpa
penggunaan seleksi fitur Information Gain.

Kata kunci : hoax, twitter, TF-IDF, information gain, naive bayes multinomial

References

DataIndonesia.id, "Pengguna media sosial di

Indonesia," 3 February 2023. [Online].

Available: dataindonesia.id/internet/detail/pengguna-media-sosial-di-indonesia-sebanyak-167-

juta-pada-2023. [Accessed 21 April 2023].

Annisa, A. Rahmadhany, A. A. Safitri and I. , "Fenomena Penyebaran Hoax dan Hate Speech

pada Media Sosial," Jurnal Teknologi dan Informasi Bisnis, vol. 3, no. 1, pp. 30-43, 2021.

MASTEL, "mastel.id," [Online]. Available: mastel.id/hasil-survey-wabah-hoaxnasional-2019/. [Accessed 24 01 2023].

D. R. Rahadi, "Perilaku Pengguna dan Informasi Hoax di Media Sosial," Jurnal Manajemen & Kewirausahaan, vol. 5, no. 1, pp. 58-70, 2017.

R. E. Hamzah and C. E. Putri, "Mengenal dan Mengantisipasi Hoax di Media Sosial pada

Kalangan Pelajar," Jurnal Abdi MOESTOPO, Vols. Vol. 03, No. 01, no. ISSN: 2599-249X, pp. 9-12, 2020.

A. V. Sandifer, C. Wilson and A. Olmsted, "Detection of Fake Online Hotel Reviews," in

International Conference for Internet Technology and Secured Transactions (ICITST), 2017.

H. K. Farid, E. B. Setiawan and I. Kurniawan, "Implementasi Seleksi Fitur Information Gain

pada Pendeteksian Berita Hoax di Twitter dengan Menggunakan Convolutional Neural Network (CNN)," Indo-JC Indonesia Journal

on Computing, vol. 5, no. 3, 2020.

A. E. Irsad, Y. A. Sari and M. A. Fauzi, "Seleksi Fitur Information Gain untuk Klasifikasi Informasi Tempat Tinggal di Kota Malang

Berdasarkan Tweet Menggunakan Metode Naive Bayes dan Pembobotan TF-IDF-CF,"

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Vols. Vol. 3, No. 5, no. e-ISSN: 2548-964X, pp. 4907-4913, 2019.

C. S. Sriyano and E. B. Setiawan, "Pendeteksian Berita Hoax Menggunakan Naive Bayes Multinomial Pada Twitter dengan Fitur

Pembobotan TF-IDF," e-Proceeding of Engineering, Vols. Vol.8, No.2, no. ISSN : 2355-9365, p. 3396, Vol.8, No.2 April 2021.

KOMINFO, "kominfo.go.id," Melawan "hoax" - Kementerian Komunikasi dan Informatika,

[Online]. Available: www.kominfo.go.id/content/detail/8790

/melawan-hoax/0/sorotan_media. [Accessed 24 01 2023].

C. Kamilah and N. Atnan, "Analisis Kemampuan Mahasiswa Bandung Raya dalam

Mengidentifikasi Hoax," Jurnal Ilmu Komunikasi, vol. 10, no. 1, 2021.

C. Juditha, "Interaksi Komunikasi Hoax di Media Sosial serta Antisipasinya," Jurnal Pekommas, Vols. 3, No 1, 2018.

H. Chumairoh, "Ancaman Berita Bohong di Tengah Pandemi Covid-19," VOX POPULI,

vol. Vol.3, no. ISSN (Print): 2087-3360 (Online): 2714-7657, pp. 22-30, 2020.

KOMINFO, "Ciri Ciri dan akibat hoaks," 13

March 2019. [Online]. Available: aptika.kominfo.go.id/2019/03/ciri-ciriakibat-dan-kenapa-kita-mudah-percaya-hoaks/.

[Accessed 22 April 2023].

T. H. Lubis and I. Koto, "Diskursus Kebenaran

Berita Berdasarkan Undang-Undang Nomor 40

Tahun 1999 Tentang Pers Dan Kode Etik Jurnalistik," DELEGALATA (Jurnal Ilmu

Hukum), vol. 5, no. 2, 2020.

B. Irena and E. B. Setiawan, "Identifikasi Berita

Palsu (Hoax) Pada Media Sosial Twitter dengan

Metode Decision Tree C4.5," Resti (Rekayasa Sistem dan Teknologi Informasi), Vols. vol.9,,

no. ISSN: 2355-9365, p. 1853, 2020.

D. H. Kalokasari, I. M. Shofi and A. H.

Setyaningrum, "Implementasi Algoritma Multinomial Naive Bayes Classifier Pada

Sistem Klasifikasi Surat Keluar (Studi Kasus : DISKOMINFO Kabupaten Tangerang),"

JURNAL TEKNIK INFORMATIKA, Vols. VOL.10 NO.2,, p. 109, 2017.

F. Handayani and F. S. Pribadi, "Implementasi Algoritma Naive Bayes Classifier dalam

Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan

Call Center 110," Jurnal Teknik Elektro, Vols. 7, No.1, 2015.

A. Sabrani, I. G. P. W. Wedashwara W and F. Bimantoro, "Metode Multinomial Naive Bayes

Untuk Klasifikasi Artikel Online Tentang Gempa di Indonesia," JTIKA, Vols. Vol. 2, No.

,, no. ISSN:2657-0327, 2020.

W. A. Firmansyach, "Analisa Terjadinya

Overfitting dan Underfitting pada Algoritma Naive Bayes dan Decision Tree dengan Teknik

Cross Validation," JATI (Jurnal Mahasiswa Teknik Informatika), Vols. 7, No 1, 2023.

Published

2024-10-18

Issue

Section

Program Studi S1 Informatika