Implementasi Algoritma Long Short-term Memory (lstm) Untuk Mendeteksi Penggunaan Kalimat Abusive Pada Teks Bahasa Indonesia

Rizka Dwi Wulandari Santosa, Moch. Arif Bijaksana, Ade Romadhony

Abstract

Abstrak
Penelitian dengan menggunakan Jaringan Syaraf Tiruan atau Artificial Neural Network (ANN) sudah
banyak dilakukan dan dikembangkan terlebih dalam hal prediksi, klasifikasi dan pendeteksian suatu
objek. Salah satu perkembangan dari ANN adalah Recurrent Neural Network (RNN). Pada penelitian ini
menggunakan salah satu arsitektur dari RNN yaitu Long Short Term Memory (LSTM) yang biasa
digunakan untuk masalah deep learning. Arsitektur LSTM diimplementasikan untuk mendeteksi
penggunaan kalimat abusive pada teks bahasa indonesia. Dataset yang digunakan pada penelitian
mengalami ketidakseimbangan jumlah data pada setiap kelas sehingga dilakukan penambahan data untuk
mengetahui pengaruh penambahan jumlah data terhadap hasil performansi arsitektur. Tahapan
pengerjaan dalam penelitian ini dimulai dari pembangunan dataset, pra-pemrosesan data, pembuatan
model pendeteksi kalimat abusive, pelatihan dan pengujian. Pengujian dilakukan terhadap arsitektur
LSTM dan didapatkan hasil bahwa arsitektur ini hanya dapat memprediksi terhadap kelas mayoritas
sehingga dilakukan penambahan penggunaan arsitektur yaitu Bidirectional LSTM (BiLSTM). Hasil uji
coba menunjukkan BiLSTM lebih baik dalam mengklasifikasikan kalimat karena terdapat forward dan
backward layer yang membuat proses pembelajaran model lebih kompleks dalam mengenal konteks
kalimat dan hal ini akan meningkatkan keakuratan hasil klasifikasi pada setiap label. Pada LSTM hanya
menghasilkan nilai F1 Score untuk kelas mayoritas saja sebesar 0.812 sedangkan pada BiLSTM sudah
dapat menghasilkan nilai F1 Score untuk semua kelas.
Kata Kunci: Kalimat Abusive, LSTM, BiLSTM, F1 Score
Abstract
Research using Artificial Neural Network (ANN) has been done and developed especially in terms of
prediction, classification and detection of an object. One of the developments of ANN is the Recurrent
Neural Network (RNN). In this study, it uses one of the architectures of RNN, Long Short Term Memory
(LSTM) which is commonly used for deep learning problems. LSTM architecture is implemented to detect
the use of abusive sentences in Indonesian text. The dataset used in the study experienced an imbalance in
the amount of data in each class so that the addition of data to find out the effect of increasing the amount
of data on the results of architectural performance. The stages of work in this research began from dataset
development, data pre-processing, abusive sentence detection modeling, training and testing. Testing was
carried out on LSTM architecture and it was obtained that this architecture can only predict against the
majority class so that the additional use of architecture is Bidirectional LSTM (BiLSTM). The test results
showed that BiLSTM is better at classifying sentences because there are forward and backward layers that
make the model learning process more complex in knowing the context of sentences and this will improve
the accuracy of classification results on each label. In LSTM only produce F1 Score for majority class only
of 0.812 while in BiLSTM can already produce F1 Score for all classes.
Keywords: Kalimat Abusive, LSTM, BiLSTM, F1 Score

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0