Deteksi Hate Speech Pada Twitter Menggunakan Algoritma BERT

Penulis

  • Adine Nayla Telkom University
  • Casi Setianingsih Telkom University
  • Burhanuddin Dirgantoro Telkom University

Abstrak

Abstrak— Hate speech atau ujaran kebencian pada salah satu platform sosial media yaitu Twitter sudah tidak jarang ditemukan. Pada platform Twitter, pengguna bebas mendapatkan, bertukar informasi, serta mengungkapkan opini. Hal ini merupakan salah satu faktor utama seseorang dapat terkena ujaran kebencian pada Twitter. Korban yang terkena ujaran kebencian memiliki kemungkinan menderita gangguan kesehatan mental, dikarenakan sebagian besar korban ujaran kebencian diserang secara verbal atapun emosional. Minimnya penanggulangan deteksi ujaran kebencian pada platform sosial media Twitter masih jarang ditemukan. Pada penelitian ini, dilakukan proses simulasi menggunakan website beserta dengan pengujian dan analisis terhadap pendeteksian ujaran kebencian. Pengujian dilakukan dengan cara pengguna akan melakukan input kalimat pada website hate speech, lalu website akan melakukan preprocessing dan menganalisa kalimat tersebut menggunakan Algoritma BERT untuk mengklasifikasikan apakah kalimat tersebut termasuk hate speech atau tidak. Dari hasil pengujian diperoleh bahwa pendeteksian hate speech pada akun pengguna Twitter menggunakan Algoritma BERT mendapatkan akurasi sebesar 78.69%, presisi sebesar 78.90%, recall sebesar 78.69%, dan F1 score sebesar 78.77% terhadap pengklasifikasian golongan hate speech. Dengan demikian pengguna akan lebih mudah mendeteksi hate speech pada Twitter dengan menggunakan website hate speech.
Keywords-- algoritma BERT, aplikasi web, hate speech, twitter.

Referensi

T. A. Cahyanto, V. Wahanggara and D. Ramdana, "Analisis dan Deteksi Malware Menggunakan Metode Malware Analisis Dinamis dan Malware Analisis Statis," Jurnal Sistem & Teknologi Informasi Indonesia, vol. 2, p. 19, 2017.

R. Garett, L. R. Lord and S. D. Young, "Associations Between Social Media and Cyberbullying : A Review of The Literature," vol. 2, 2016.

IBM Cloud Education, "IBM Cloud Learn Hub," Natural Language Processing (NLP), 2 Juli 2020. [Online]. Available: https://www.ibm.com/cloud/learn/natural-language-processing. [Accessed 20 Juli 2022].

P. M. Nadkarni, L. Ohno-Machado and W. W. Chapman, "Natural Language Processing : an introduction," pp. 544-551, 2011.

SAS Institute Inc., "Neural Networks : What they are & why they matter," [Online]. Available: https://www.sas.com/en_id/insights/analytics/neural-networks.html. [Accessed 12 September 2022].

Pandu Nayak, "Understanding searches better than ever before," Google, 25 Oktober 2019. [Online]. Available: https://blog.google/products/search/search-language-understanding-bert/. [Accessed 30 November 2021].

B. Muller, "huggingface bert 101," BERT 101 STATE OF THE ART NLP MODEL EXPLAINED, 2 Maret 2022. [Online]. Available: https://huggingface.co/blog/bert-101. [Accessed 28 Agustus 2022].

D. Gunawan, C. A. Sembiring and M. A. Budiman, "The Implementation of Cosine Similarity to Calculate Text Relevance between Two Documents," Journal of Physics : Conference Series, pp. 1-6, 2017.

##submission.downloads##

Diterbitkan

2023-03-06

Terbitan

Bagian

Program Studi S1 Teknik Komputer