Peringkas Teks Otomatis Bahasa Indonesia Secara Abstraktif Menggunakan Metode Long Short-term Memory
Abstract
bstrak
Salah satu topik dalam bidang Natural Language Processing (NLP) yang cukup menantang adalah
peringkas teks otomatis. Dalam praktiknya peringkas teks otomatis terbagi menjadi dua pendekatan,
yaitu ekstraktif dan abstraktif. Pendekatan abstraktif dinilai lebih baik karena cara kerjanya
mendekati cara kerja manusia ketika meringkas teks atau yang disebut parafrase. Metode yang
digunakan pada penelitian ini adalah Long Short-Term Memory (LSTM) yang mana metode tersebut
telah sukses melakukan peringkasan dalam Bahasa Inggris. Dataset yang digunakan adalah
kumpulan artikel berita media daring Bahasa Indonesia. Hasil terbaik yang didapatkan pada
pengujian dengan metode LSTM menggunakan metode evaluasi ROUGE-1 adalah 0.13846.
Kata kunci: peringkas teks otomatis, abstraktif, Bahasa Indonesia, long short-term memory, ROUGE
Abstract
One topic about natural language processing that is quite challenging is automatic text summarization.
Automatic-text-summarization is practically divided into two kinds of approach, namely extractive and
abstractive. Abstractive-approach is considered better since it resembles how humans work in terms of text
summarizing or paraphrasing. A method used in this study is Long Short-Term Memory (LSTM) which
has succeeded to summarize texts in English. Datasets that have been used are a number of online news
articles in Bahasa Indonesia. The best result gained using LSTM based on the ROUGE-1 evaluation is
0.13846.
Keywords: automatic text summarization, Bahasa Indonesia, long short-term memory, ROUGE
Salah satu topik dalam bidang Natural Language Processing (NLP) yang cukup menantang adalah
peringkas teks otomatis. Dalam praktiknya peringkas teks otomatis terbagi menjadi dua pendekatan,
yaitu ekstraktif dan abstraktif. Pendekatan abstraktif dinilai lebih baik karena cara kerjanya
mendekati cara kerja manusia ketika meringkas teks atau yang disebut parafrase. Metode yang
digunakan pada penelitian ini adalah Long Short-Term Memory (LSTM) yang mana metode tersebut
telah sukses melakukan peringkasan dalam Bahasa Inggris. Dataset yang digunakan adalah
kumpulan artikel berita media daring Bahasa Indonesia. Hasil terbaik yang didapatkan pada
pengujian dengan metode LSTM menggunakan metode evaluasi ROUGE-1 adalah 0.13846.
Kata kunci: peringkas teks otomatis, abstraktif, Bahasa Indonesia, long short-term memory, ROUGE
Abstract
One topic about natural language processing that is quite challenging is automatic text summarization.
Automatic-text-summarization is practically divided into two kinds of approach, namely extractive and
abstractive. Abstractive-approach is considered better since it resembles how humans work in terms of text
summarizing or paraphrasing. A method used in this study is Long Short-Term Memory (LSTM) which
has succeeded to summarize texts in English. Datasets that have been used are a number of online news
articles in Bahasa Indonesia. The best result gained using LSTM based on the ROUGE-1 evaluation is
0.13846.
Keywords: automatic text summarization, Bahasa Indonesia, long short-term memory, ROUGE
Full Text:
PDFRefbacks
- There are currently no refbacks.