Ekpansi Fitur dengan Word2vec dalam klasifikasi Hoax di Twitter
Abstract
Abstrak-Media sosial sekarang sudah banyak digunakan untuk berbagi informasi, dan juga tempat untuk berkomunikasi. Dalam berbagi informasi banyak peluang untuk menyebarkan hoax, contohnya seperti diaplikasi Twitter. Terkadang ada ketidaksesuaian kosa kata dalam setiap tweet. Oleh karena itu pada penelitian ini dilakukan penerapan metode fitur ekpansi menggunakan Word2vec untuk meminimalisir ketidaksesuaian kosakata tersebut. metode klasifikasi yang digunakan adalah Naive bayes, ANN, Decision Tree. Hasil dari penelitian ini, nilai tertinggi sebesar 82,44% yang menggunakan ekspansi fitur Word2vec pada metode klasifikasi ANN yang meningkat sebesar 1,17%.
Kata kunci - hoax, fitur ekspansi, twitter.
References
S. Sucipto, A. G. Tammam, and R. Indriati, “Hoax Detection at Social Media With Text Mining Clarification System-Based,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 3, no. 2, pp. 94– 100, 2018, doi: 10.29100/jipi.v3i2.837.
R. Sistem, “JURNAL RESTI Hoax Detection on Twitter using Feed-forward and Back-propagation,” vol. 1, no. 10, pp. 655–663, 2021.
A. N. Laili, P. P. Adikara, and S. Adinugroho, “Rekomendasi Film Berdasarkan Sinopsis Menggunakan Metode Word2Vec,” vol. 3, no. 6, pp. 6035–6043, 2019.
A. Fitri Niasita, P. P. Adikara, and S. Adinugroho, “Analisis Sentimen Pembangunan Infrastruktur di Indonesia dengan Automated Lexicon Word2Vec dan Naive-Bayes,” J-Ptiik, vol. 3, no. 3, pp. 2673– 2679, 2019, [Online]. Available: http://j-ptiik.ub.ac.id
N. Saputra, T. B. Adji, and A. E. Permanasari, “Analisis Sentimen Data Presiden Jokowi dengan Preprocessing Normalisasi dan Stemming Menggunakan Metode Naive Bayes dan SVM,” J. Din. Inform., vol. 5, no. November, p. 12, 2015, [Online]. Available: http://ojs.upy.ac.id/ojs/index.php/dinf/article/view/113
A. Muzakir and R. A. Wulandari, “Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree,” Sci. J. Informatics, vol. 3, no. 1, pp. 19–26, 2016, doi: 10.15294/sji.v3i1.4610.
D. Wahyuningsih, I. Zuhroh, and - Zainuri, “Prediksi Inflasi Indonesia Dengan Model Artificial Neural Network,” J. Indones. Appl. Econ., vol. 2, no. 2, pp. 2–2008, 2008, doi: 10.21776/ub.jiae.2008.002.02.7.
S. Mujilahwati, “Pre-Processing Text Mining Pada Data Twitter,” Semin. Nas. Teknol. Inf. dan Komun., vol. 2016, no. Sentika, pp. 2089–9815, 2016.
F. W. Nurwariz and Y. Sibaroni, “Analisis Sentimen Review Game pada Steam Menggunakan Metode Support Vector Machine dengan Information Gain,” 2019.
H. W. A. Kesuma, “Penerapan Metode TF-IDF dan Cosine Similarity dalam Aplikasi Kitab Undang- Undang Hukum Dagang,” 2016.
B. Herwijayanti, D. E. Ratnawati, and L. Muflikhah, “Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity,” Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 306–312, 2018.
F. W. KURNIAWAN, “Analisis Sentimen Twitter Bahasa Indonesia dengan Word2Vec,” 2020, [Online]. Available: https://openlibrary.telkomuniversity.ac.id/home/catalog/id/159923/slug/analisis- sentimen-twitter-bahasa-indonesia-dengan-word2vec.html%0A/home/catalog/id/159923/slug/analisis- sentimen-twitter-bahasa-indonesia-dengan-word2vec.html
J. Nurjaman, R. Ilyas, F. Kasyidi, J. Informatika, U. Jenderal, and A. Yani, “Pengukuran Kesamaan Semantik Pasangan Kalimat Sitasi Menggunakan Convolutional Neural Network,” pp. 26–27, 2020.
I. L. S. Nabila Nanda Widyastuti, Arif Arif Bijaksana, “Analisis Word2vec untuk Perhitungan Kesamaan Semantik antar Kata | Widyastuti | eProceedings of Engineering,” vol. 5, no. 3, pp. 7603–7612, 2018, [Online]. Available: https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineering/article/view/7263
S. R. DEWI, “Deep Learning Object Detection Pada Video,” Deep Learn. Object Detect. Pada Video Menggunakan Tensorflow Dan Convolutional Neural Netw., pp. 1–60, 2018, [Online]. Available: https://dspace.uii.ac.id/bitstream/handle/123456789/7762/14611242_Syarifah Rosita Dewi_Statistika.pdf?sequence=1
C. Sammut and G. I. Webb, “Encyclopedia of Machine Learning”.
X. Deng, Q. Liu, Y. Deng, and S. Mahadevan, “An improved method to construct basic probability assignment based on the confusion matrix for classification problem,” Inf. Sci. (Ny)., vol. 340–341, pp. 250–261, 2016, doi: 10.1016/j.ins.2016.01.033.
a. K. Santra and C. J. Christy, “Genetic Algorithm and Confusion Matrix for Document Clustering,” Int.
J. Comput. Sci., vol. 9, no. 1, pp. 322–328, 2012, [Online]. Available: http://ijcsi.org/papers/IJCSI-9-1-2- 322-328.pdf
C. Kim, V. Zhu, J. Obeid, and L. Lenert, “Natural language processing and machine learning algorithm to identify brain MRI reports with acute ischemic stroke,” PLoS One, vol. 14, no. 2, pp. 1–13, 2019, doi: 10.1371/journal.pone.0212778.