Ekspansi Fitur dengan FastText untuk Analisis Sentimen di Media Sosial X Menggunakan Recurrent Neural Network dan Covlutional Neural Networ

Authors

  • Robith Naufal Razzak Telkom University
  • Erwin Budi Setiawan Telkom University

Abstract

Abstrak - Dalam era digital, media X telah menjadi platform penting bagi masyarakat untuk ekspresi dan pertukaran informasi, terutama selama pemilihan umum, memungkinkan analisis sentimen untuk memahami opini publik secara real-time. Namun, tantangan utama adalah pengolahan teks yang tidak terstruktur dan kompleks, yang sering menghasilkan analisis yang kurang akurat. Untuk mengatasi ini, penelitian ini mengembangkan model hybrid deep learning yang mengintegrasikan Recurrent Neural Networks (RNN) dan Convolutional Neural Networks (CNN). Selain itu, penggunaan ekspansi fitur FastText memungkinkan model untuk mengatasi inkonsistensi kosakata dan meningkatkan pemahaman kontekstual, dengan mengidentifikasi dan menggantikan kata-kata yang kurang representatif dengan alternatif yang memiliki kemiripan semantik. Dua dataset digunakan untuk membangun similarity corpus dengan dataset media X sebesar 62.955 dan datset IndoNews sebesar 126.673. Sistem menunjukkan tingkat akurasi maksimum pada model hybrid deep learning RNN-CNN yaitu sebesar 73,00% dengan peningkatan 2,50% terhadap model RNN dan 3,00% terhadap model CNN. Hasil ini menunjukkan bahwa integrasi RNN dan CNN, bersama dengan teknik ekspansi fitur FastText, meningkatkan kemampuan analisis sentimen, memberikan metode yang lebih efisien dan akurat dalam mengklasifikasikan sentimen publik.

Kata kunci - hybrid, RNN, CNN, fasttext, analisis sentimen

References

Kaplan, Andreas & Haenlein, Michael. 2010. Users of the World, Unite! The Challenges and Opportunities of Social Media. Business Horizons. 53. 59-68. 10.1016/j.bushor.2009.09.003.

Bollen, Johan & Mao, Huina & Zeng, Xiao-Jun. 2010. Twitter Mood Predicts the Stock Market. Journal of Computational Science. 2.10.1016/j.jocs.2010.12.007.

Budiharto, W., Meiliana, M. 2018. Prediction and analysis of Indonesia Presidential election from Twitter using sentiment analysis. J Big Data 5, 51. https://doi.org/10.1186/s40537-018-0164-1.

Tul, Qurat & Ali, Mubashir & Riaz, Amna & Noureen, Amna & Kamranz, Muhammad & Hayat, Babar & Rehman, Aziz Ur. 2017. Sentiment Analysis Using Deep Learning Techniques: A Review. International Journal of Advanced Computer Science and Applications. 8. 10.14569/IJACSA.2017.080657.

Umer, Muhammad & Imtiaz, Zainab & Ahmad, Muhammad & Nappi, Michele & Medaglia, Carlo & Choi, Gyu Sang & Mehmood, Arif. (2022). Impact of convolutional neural network and FastText embedding on text classification. Multimedia Tools and Applications. 82. 10.1007/s11042-022-13459-x.

M. A. Saputra and E. B. Setiawan, "Aspect Based Sentiment Analysis Using Recurrent Neural Networks (RNN) on Social Media Twitter," 2023 International Conference on Data Science and Its Applications (ICoDSA), Bandung, Indonesia, 2023, pp. 265-270, doi:10.1109/ICoDSA58501.2023.10276768..

Rhanoui M, Mikram M, Yousfi S, Barzali S. A CNNBiLSTM Model for Document-Level Sentiment Analysis. Machine Learning and Knowledge Extraction. 2019; 1(3):832-847. https://doi.org/10.3390/make1030048.

Sharma, Ankita & Rani, Shalli & Bashir, Ali & Alhudhaif, Adi & Koundal, Deepika & RN, Emine. 2022. An efficient CNN-LSTM model for sentiment detection in #BlackLivesMatter. Expert Systems with Applications. 193. 116256. 10.1016/j.eswa.2021.116256.

Muniasamy, A., & Alasiry, A. (2020). Deep Learning: The Impact on Future eLearning. International Journal of Emerging Technologies in Learning (iJET), 15(01), pp. 188–199. https://doi.org/10.3991/ijet.v15i01.11435.

Setiawan, Erwin & Widyantoro, Dwi & Surendro, Kridanto. 2016. Feature expansion using word embedding for tweet topic classification. 1-5. 10.1109/TSSA.2016.7871085.

B. Keith Norambuena, E. F. Lettura, and C. M. Villegas,

L. Kurniasari and A. Setyanto,

J. Hartmann, J. Huppertz, C. Schamp, and M. Heitmann,

Salsabila, Nikmatun & Winatmoko, Yosef & Septiandri, Ali & Jamal, Ade. (2018). Colloquial Indonesian Lexicon. 226-229. 10.1109/IALP.2018.8629151.

Alessa, Ali & Faezipour, Miad. (2018). Tweet Classification Using Sentiment Analysis Features and TF-IDF Weighting for Improved Flu Trend Detection. 10.1007/978-3-319-96136-1_15.

A. O. Salau and S. Jain,

Jianming, Zhang. "Weibo Text Sentiment Classification Model Based on FastText-BERTAttention." 2 (2024).:29-35. doi: 10.62517/jbdc.202401104.

Aufa, Rizki & Prasetiyowati, Sri & Sibaroni, Yuliant. (2023). The Effect of Feature Weighting on Sentiment Analysis TikTok Application Using The RNN Classification. Building of Informatics, Technology and Science (BITS). 5. 10.47065/bits.v5i1.3597.

Nurdin, Arliyanti & Seno aji, Bernadus & Bustamin, Anugrayani & Abidin, Zaenal. (2020). PERBANDINGAN KINERJA WORD EMBEDDING WORD2VEC, GLOVE, DAN FASTTEXT PADA KLASIFIKASI TEKS. Jurnal Tekno Kompak. 14. 74. 10.33365/jtk.v14i2.732.

Zhang, D., & Lee, W. S. (2018). Sensitivity analysis of convolutional neural networks for sentence classification. Knowledge-Based Systems, 139, 30- 39.

O. Bayat, S. Aljawarneh, H. F. Carlak, International Association of Researchers, Institute of Electrical and Electronics Engineers, and Akdeniz Üniversitesi,

H. Khotimah, E. Budi, and I. Kurniawan,

M. U. Salur and I. Aydin,

Babacar, Gaye., Aziguli, Wulamu. (2019). Sentiment Analysis of Text Classification Algorithms Using Confusion Matrix. doi: 10.1007/978-981-15-1922- 2_16.

Published

2025-04-10

Issue

Section

Program Studi S1 Informatika