Extractive Text Summarization Terhadap Artikel Berita Indonesia Berbasis Machine Learning
Abstract
Abstrak — Terciptanya internet, jejaring sosial, forum, dan
teknologi informasi yang tersebar secara cepat, menyebabkan
interaksi terhadap informasi semakin sulit untuk dipahami,
dibuat, dikembangkan, dan disimpan. Dengan luasnya
informasi sehingga hampir tidak mungkin untuk seorang pun
untuk memproses dan meringkas semua data informasi yang
tersedia. Indonesia memiliki literasi yang sangat rendah dari
negara lain dengan beberapa faktor seperti tidak membiasakan
diri untuk membaca buku dari rumah, perkembangan
teknologi yang semakin pesat, minimnya sarana untuk
membaca, kurangnya motivasi untuk membaca, dan sifat malas
untuk mengembangkan ide. Automatic text summarization
adalah salah satu alternatif teknologi yang bisa digunakan
untuk menyelesaikan masalah tersebut. Automatic text
summarization merupakan bagian dari bidang Natural
Language Processing (NLP) yang bertujuan untuk
merepresentasikan dokumen teks yang panjang menjadi lebih
ringkas, sehingga pengguna dapat dengan mudah memahami
informasi dengan cepat. Berbagai metode telah dilakukan
untuk mengatasi masalah peringkasan teks otomatis untuk
objek berbahasa Indonesia, yaitu berbasis extractive dan
abstractive. Untuk mengatasi masalah ini, pada penelitian
digunakan extractive text summarization berbasis machine
learning. Pada penelitian ini menggunakan dataset publik yang
bisa digunakan untuk penelitian-penelitian selanjutnya. Metode
yang digunakan untuk mendapatkan hasil summarization
dengan menggunakan metode Word2Vec dengan penerapan
model Continous Bag-of-Word (CBOW) dan Skip-Gram. Metode
yang digunakan untuk evaluasi akurasi hasil ringkasan adalah
Recall-Oriented Understudy for Gisting Evaluation (ROUGE).
Kata kunci— Automatic Text Summarization, Word2Vec,
Continous Bag-of-Words, Skip-Gram, Recall-Oriented
Understudy for Gisting Evaluation
References
Rupal. Bhargava and Yashvardhan. Sharma,
Extractive Text Summarization,= in Procedia
Computer Science, Elsevier B.V., 2020, pp. 138-146.
doi: 10.1016/j.procs.2020.03.191.
B. Mutlu, E. A. Sezer, and M. A. Akcayol,
summarization,= Inf Process Manag, vol. 57, no. 6,
Nov. 2020, doi: 10.1016/j.ipm.2020.102359.
N. Savanti Widya Gotami, Indriati, and R. Kartika
Dewi,
Pada Artikel Berita Kesehatan Berbahasa Indonesia
Dengan Menggunakan Metode Latent Semantic
Analysis,= 2018. [Online]. Available: http://jptiik.ub.ac.id
B. U. Ilham,
Peringkat Ke-62 Dari 70 Negara,= 2022.
https://bisniskumkm.com/harbuknas-2022-literasiindonesia-peringkat-ke-62-dari-70-negara/ (accessed
Jan. 06, 2023).
Jessica, <5 Penyebab Rendahnya Budaya Literasi di
Indonesia,= Jul. 10, 2017.
https://www.educenter.id/5-penyebab-rendahnyabudaya-literasi-di-indonesia/ (accessed Jan. 06,
.
M. M. Mubarok,
NEWS SUMMARIZATION BERBASIS DEEP
LEARNING DENGAN METODE SEQUENCETO-SEQUENCE LONG SHORT-TERM
MEMORY,= 2021.
A. Joshi, E. Fidalgo, E. Alegre, and L. FernandezRobles,
for extractive text summarization based on deep autoencoders,= Expert Syst Appl, vol. 129, pp. 200-215,
Sep. 2019, doi: 10.1016/J.ESWA.2019.03.045.
S. Singh, A. Singh, S. Majumder, A. Sawhney, D.
Krishnan, and S. Deshmukh,
Summarization Techniques of News Articles: Issues,
Challenges and Approaches,= in Proceedings -
International Conference on Vision Towards
Emerging Trends in Communication and
Networking, ViTECoN 2019, 2019. doi:
1109/ViTECoN.2019.8899706.
R. Adelia, S. Suyanto, and U. N. Wisesty,
bidirectional gated recurrent unit,= in Procedia
Computer Science, Elsevier B.V., 2019, pp. 581-588.
doi: 10.1016/j.procs.2019.09.017.
N. Moratanch and S. Chitrakala,
extractive text summarization,= in International
Conference on Computer, Communication, and
Signal Processing: Special Focus on IoT, ICCCSP
, 2017. doi: 10.1109/ICCCSP.2017.7944061.
K. Kurniawan and S. Louvan,
Benchmark Dataset for Indonesian Text
Summarization,= Proceedings of the 2018
International Conference on Asian Language
Processing, IALP 2018, pp. 215-220, Jan. 2019, doi:
1109/IALP.2018.8629109.
I. R. Musyaffanto, G. Budi Herwanto, and M.
Riasetiawan,
summarization for indonesian news articles using
maximal marginal relevance and non-negative matrix
factorization,= in Proceedings - 2019 5th
International Conference on Science and
Technology, ICST 2019, 2019. doi:
1109/ICST47872.2019.9166376.
L. Liu, Y. Lu, M. Yang, Q. Qu, J. Zhu, and H. Li,
[Online]. Available: www.aaai.org
H. T. Le and T. M. Le,
text summarization,= in 2013 International
Conference on Soft Computing and Pattern
Recognition (SoCPaR), IEEE, Dec. 2013, pp. 371-
doi: 10.1109/SOCPAR.2013.7054161.
N. Moratanch and S. Chitrakala,
abstractive text summarization,= in 2016
International Conference on Circuit, Power and
Computing Technologies (ICCPCT), IEEE, Mar.
, pp. 1-7. doi: 10.1109/ICCPCT.2016.7530193.
F. Horasan and B. Bilen,
Summarization System for News Texts,=
International Journal of Applied Mathematics
Electronics and Computers, 2020, doi:
18100/ijamec.800905.
R. Bonetto and V. Latzko,
Computing in Communication Networks: From
Theory to Practice, pp. 135-167, Jan. 2020, doi:
1016/B978-0-12-820488-7.00021-9.
K. Jain, M. Chawla, A. Gadhwal, R. Jain, and P.
Nagrath,
Convolutional Neural Network,= in Lecture Notes in
Networks and Systems, 2020. doi: 10.1007/978-981-
-3369-3_19.
C. E. Lawson et al.,
engineering: A review,= Metabolic Engineering, vol.
2021. doi: 10.1016/j.ymben.2020.10.005.
A. Pant,
://towardsdatascience.com/workflow-ofa-machine-learning-project-ec1dba419b94 (accessed
Jan. 07, 2023).



