Extractive Text Summarization Terhadap Artikel Berita Indonesia Berbasis Machine Learning

Authors

  • Muhammad Raihan Hadwirianto Telkom University
  • Faqih Hamami Telkom University
  • Oktariani Nurul Pratiwi Telkom University

Abstract

Abstrak — Terciptanya internet, jejaring sosial, forum, dan
teknologi informasi yang tersebar secara cepat, menyebabkan
interaksi terhadap informasi semakin sulit untuk dipahami,
dibuat, dikembangkan, dan disimpan. Dengan luasnya
informasi sehingga hampir tidak mungkin untuk seorang pun
untuk memproses dan meringkas semua data informasi yang
tersedia. Indonesia memiliki literasi yang sangat rendah dari
negara lain dengan beberapa faktor seperti tidak membiasakan
diri untuk membaca buku dari rumah, perkembangan
teknologi yang semakin pesat, minimnya sarana untuk
membaca, kurangnya motivasi untuk membaca, dan sifat malas
untuk mengembangkan ide. Automatic text summarization
adalah salah satu alternatif teknologi yang bisa digunakan
untuk menyelesaikan masalah tersebut. Automatic text
summarization merupakan bagian dari bidang Natural
Language Processing (NLP) yang bertujuan untuk
merepresentasikan dokumen teks yang panjang menjadi lebih
ringkas, sehingga pengguna dapat dengan mudah memahami
informasi dengan cepat. Berbagai metode telah dilakukan
untuk mengatasi masalah peringkasan teks otomatis untuk
objek berbahasa Indonesia, yaitu berbasis extractive dan
abstractive. Untuk mengatasi masalah ini, pada penelitian
digunakan extractive text summarization berbasis machine
learning. Pada penelitian ini menggunakan dataset publik yang
bisa digunakan untuk penelitian-penelitian selanjutnya. Metode
yang digunakan untuk mendapatkan hasil summarization
dengan menggunakan metode Word2Vec dengan penerapan
model Continous Bag-of-Word (CBOW) dan Skip-Gram. Metode
yang digunakan untuk evaluasi akurasi hasil ringkasan adalah
Recall-Oriented Understudy for Gisting Evaluation (ROUGE).

Kata kunci— Automatic Text Summarization, Word2Vec,
Continous Bag-of-Words, Skip-Gram, Recall-Oriented
Understudy for Gisting Evaluation

References

Rupal. Bhargava and Yashvardhan. Sharma,

Extractive Text Summarization,= in Procedia

Computer Science, Elsevier B.V., 2020, pp. 138-146.

doi: 10.1016/j.procs.2020.03.191.

B. Mutlu, E. A. Sezer, and M. A. Akcayol,

summarization,= Inf Process Manag, vol. 57, no. 6,

Nov. 2020, doi: 10.1016/j.ipm.2020.102359.

N. Savanti Widya Gotami, Indriati, and R. Kartika

Dewi,

Pada Artikel Berita Kesehatan Berbahasa Indonesia

Dengan Menggunakan Metode Latent Semantic

Analysis,= 2018. [Online]. Available: http://jptiik.ub.ac.id

B. U. Ilham,

Peringkat Ke-62 Dari 70 Negara,= 2022.

https://bisniskumkm.com/harbuknas-2022-literasiindonesia-peringkat-ke-62-dari-70-negara/ (accessed

Jan. 06, 2023).

Jessica, <5 Penyebab Rendahnya Budaya Literasi di

Indonesia,= Jul. 10, 2017.

https://www.educenter.id/5-penyebab-rendahnyabudaya-literasi-di-indonesia/ (accessed Jan. 06,

.

M. M. Mubarok,

NEWS SUMMARIZATION BERBASIS DEEP

LEARNING DENGAN METODE SEQUENCETO-SEQUENCE LONG SHORT-TERM

MEMORY,= 2021.

A. Joshi, E. Fidalgo, E. Alegre, and L. FernandezRobles,

for extractive text summarization based on deep autoencoders,= Expert Syst Appl, vol. 129, pp. 200-215,

Sep. 2019, doi: 10.1016/J.ESWA.2019.03.045.

S. Singh, A. Singh, S. Majumder, A. Sawhney, D.

Krishnan, and S. Deshmukh,

Summarization Techniques of News Articles: Issues,

Challenges and Approaches,= in Proceedings -

International Conference on Vision Towards

Emerging Trends in Communication and

Networking, ViTECoN 2019, 2019. doi:

1109/ViTECoN.2019.8899706.

R. Adelia, S. Suyanto, and U. N. Wisesty,

bidirectional gated recurrent unit,= in Procedia

Computer Science, Elsevier B.V., 2019, pp. 581-588.

doi: 10.1016/j.procs.2019.09.017.

N. Moratanch and S. Chitrakala,

extractive text summarization,= in International

Conference on Computer, Communication, and

Signal Processing: Special Focus on IoT, ICCCSP

, 2017. doi: 10.1109/ICCCSP.2017.7944061.

K. Kurniawan and S. Louvan,

Benchmark Dataset for Indonesian Text

Summarization,= Proceedings of the 2018

International Conference on Asian Language

Processing, IALP 2018, pp. 215-220, Jan. 2019, doi:

1109/IALP.2018.8629109.

I. R. Musyaffanto, G. Budi Herwanto, and M.

Riasetiawan,

summarization for indonesian news articles using

maximal marginal relevance and non-negative matrix

factorization,= in Proceedings - 2019 5th

International Conference on Science and

Technology, ICST 2019, 2019. doi:

1109/ICST47872.2019.9166376.

L. Liu, Y. Lu, M. Yang, Q. Qu, J. Zhu, and H. Li,

[Online]. Available: www.aaai.org

H. T. Le and T. M. Le,

text summarization,= in 2013 International

Conference on Soft Computing and Pattern

Recognition (SoCPaR), IEEE, Dec. 2013, pp. 371-

doi: 10.1109/SOCPAR.2013.7054161.

N. Moratanch and S. Chitrakala,

abstractive text summarization,= in 2016

International Conference on Circuit, Power and

Computing Technologies (ICCPCT), IEEE, Mar.

, pp. 1-7. doi: 10.1109/ICCPCT.2016.7530193.

F. Horasan and B. Bilen,

Summarization System for News Texts,=

International Journal of Applied Mathematics

Electronics and Computers, 2020, doi:

18100/ijamec.800905.

R. Bonetto and V. Latzko,

Computing in Communication Networks: From

Theory to Practice, pp. 135-167, Jan. 2020, doi:

1016/B978-0-12-820488-7.00021-9.

K. Jain, M. Chawla, A. Gadhwal, R. Jain, and P.

Nagrath,

Convolutional Neural Network,= in Lecture Notes in

Networks and Systems, 2020. doi: 10.1007/978-981-

-3369-3_19.

C. E. Lawson et al.,

engineering: A review,= Metabolic Engineering, vol.

2021. doi: 10.1016/j.ymben.2020.10.005.

A. Pant,

://towardsdatascience.com/workflow-ofa-machine-learning-project-ec1dba419b94 (accessed

Jan. 07, 2023).

Published

2024-10-21

Issue

Section

Program Studi S1 Sistem Informasi