Implementasi Algoritma Long Short-term Memory (lstm) Untuk Mendeteksi Penggunaan Kalimat Abusive Pada Teks Bahasa Indonesia

Authors

  • Rizka Dwi Wulandari Santosa Telkom University
  • Moch. Arif Bijaksana Telkom University
  • Ade Romadhony Telkom University

Abstract

Abstrak Penelitian dengan menggunakan Jaringan Syaraf Tiruan atau Artificial Neural Network (ANN) sudah banyak dilakukan dan dikembangkan terlebih dalam hal prediksi, klasifikasi dan pendeteksian suatu objek. Salah satu perkembangan dari ANN adalah Recurrent Neural Network (RNN). Pada penelitian ini menggunakan salah satu arsitektur dari RNN yaitu Long Short Term Memory (LSTM) yang biasa digunakan untuk masalah deep learning. Arsitektur LSTM diimplementasikan untuk mendeteksi penggunaan kalimat abusive pada teks bahasa indonesia. Dataset yang digunakan pada penelitian mengalami ketidakseimbangan jumlah data pada setiap kelas sehingga dilakukan penambahan data untuk mengetahui pengaruh penambahan jumlah data terhadap hasil performansi arsitektur. Tahapan pengerjaan dalam penelitian ini dimulai dari pembangunan dataset, pra-pemrosesan data, pembuatan model pendeteksi kalimat abusive, pelatihan dan pengujian. Pengujian dilakukan terhadap arsitektur LSTM dan didapatkan hasil bahwa arsitektur ini hanya dapat memprediksi terhadap kelas mayoritas sehingga dilakukan penambahan penggunaan arsitektur yaitu Bidirectional LSTM (BiLSTM). Hasil uji coba menunjukkan BiLSTM lebih baik dalam mengklasifikasikan kalimat karena terdapat forward dan backward layer yang membuat proses pembelajaran model lebih kompleks dalam mengenal konteks kalimat dan hal ini akan meningkatkan keakuratan hasil klasifikasi pada setiap label. Pada LSTM hanya menghasilkan nilai F1 Score untuk kelas mayoritas saja sebesar 0.812 sedangkan pada BiLSTM sudah dapat menghasilkan nilai F1 Score untuk semua kelas. Kata Kunci: Kalimat Abusive, LSTM, BiLSTM, F1 Score Abstract Research using Artificial Neural Network (ANN) has been done and developed especially in terms of prediction, classification and detection of an object. One of the developments of ANN is the Recurrent Neural Network (RNN). In this study, it uses one of the architectures of RNN, Long Short Term Memory (LSTM) which is commonly used for deep learning problems. LSTM architecture is implemented to detect the use of abusive sentences in Indonesian text. The dataset used in the study experienced an imbalance in the amount of data in each class so that the addition of data to find out the effect of increasing the amount of data on the results of architectural performance. The stages of work in this research began from dataset development, data pre-processing, abusive sentence detection modeling, training and testing. Testing was carried out on LSTM architecture and it was obtained that this architecture can only predict against the majority class so that the additional use of architecture is Bidirectional LSTM (BiLSTM). The test results showed that BiLSTM is better at classifying sentences because there are forward and backward layers that make the model learning process more complex in knowing the context of sentences and this will improve the accuracy of classification results on each label. In LSTM only produce F1 Score for majority class only of 0.812 while in BiLSTM can already produce F1 Score for all classes. Keywords: Kalimat Abusive, LSTM, BiLSTM, F1 Score

Downloads

Published

2021-02-01

Issue

Section

Program Studi S1 Informatika