Penggunaan Metode K-fold Untuk Data Imbalance Pada Klasfikasi Hwe Dan Qpq Dalam Kejahatan Tweet Pelecehan Seksual

Authors

  • Irfan Dwi Wijaya Telkom University
  • Aji Gautama Putrada Telkom University
  • Dita Oktaria Telkom University

Abstract

Sexual Harrasment merupakan perilaku yang ditandai dengan pesan atau komentar yang melecehkan, ancaman atau hal-hal yang tidak senonoh, ajakan untuk melakukan aksi porno, atau seluruh perilaku melenceng yang dilakukan di media online. Permasalahan terhadap pelecehan seksual di media sosial menjadi hal penting yang harus dikaji. Analisis sentimen dapat digunakan sebagai solusi untuk mengindentifikasi media sosial mengenai pelecahan seksual. Tujuan tugas akhir ini yaitu untuk mengklasifikasikan data ujaran yang menjerumus pada pelecehan seksual berdasarkan kelas quid pro quo dan hostile work environment dari data tweet #MeToo yang telah dirangkum oleh website survey theprofesorission.com dengan menggunakan metode Gaussian Naïve Bayes dan KNN. Sistem dibangun melalui tahap preprocessing, oversampling. pembagian data latih dan data uji menggunakan k-fold dan evaluasi dengan membandingkan nilai akurasi. Dalam pengujian sistem, didapatkan nilai akurasi pada model klasifikasi Naïve bayes dengan menggunakan K-Fold cross Validation sebesar 90.7% dan model klasifikasi KNN dengan menggunakan K-Fold cross validation mencapai nilai 87.9%. Kata kunci : sexual harassment, gaussian naïve bayes, analisis sentiment, quid pro quo, hostile work environment

Downloads

Published

2021-10-01

Issue

Section

Program Studi S1 Informatika