Ekspansi Query Menggunakan Word2Vec pada Pencarian Artikel Ilmiah
Abstrak
Abstrak — Pencarian informasi di internet sudah menjadi kebutuhan bagi sebagian besar orang dengan keperluannya masing masing, khususnya untuk para pelajar. Untuk pencarian artikel ilmiah sendiri bisa menggunakan mesin pencari google scholar untuk memudahkan pencarian agar lebih spesifik untuk artikel ilmiah. Meski menggunakan mesin pencari google scholar, informasi yang disediakan oleh mesin pencari tersebut masih terbilang banyak dan dibutuhkan kata kunci tertentu agar bisa mencari artikel ilmiah yang sesuai dengan yang diinginkan. Maka penggunaan ekspansi query dirasa sangat tepat untuk membantu pengguna dalam menentukan kata kunci yang tepat untuk melakukan pencarian. Pada penelitian ini dilakukan percobaan untuk menggunakan metode word embedding word2vec untuk melakukan ekspansi query dan melakukan dua skenario pencarian artikel ilmiah dengan menggunakan mesin pencari google scholar. Dataset yang digunakan untuk membuat model word2vec menggunakan data dari repository WINGNUS/scisumm-corpus. Nilai total akurasi yang didapat pada hasil pencarian skenario pertama sebesar 89,9% sedangkan untuk nilai total akurasi untuk hasil pencarian skenario kedua sebesar 76,1%.
Kata kunci— word2vec, ekspansi query, IR, pencarian artikel ilmiah
Referensi
REFERENSI
SiswadiI. 2016. Mengenal Konsep Penetapan Kata Kunci.
Jurnal Pustakawan Indonesia. 12, 2 (Mar. 2016).
DOI:https://doi.org/10.29244/jpi.12.2
S. Yang, X. Zheng, X. Yin, H. Mao and D. Zhao,
"An Algorithm of Query Expansion for Chinese EMR
Retrieval by Improving Expansion Term Weights and
Retrieval Scores," in IEEE Access, vol. 8, pp. 200063-
, 2020, doi: 10.1109/ACCESS.2020.3033017.
Dirga Nugraha, N. P., Maskur, M., & Hayatin, N.
(2019). Ekspansi Query Berbasis Semantik Pada Online
Public Access Catalog (OPAC). Jurnal Repositor, 1(2), 87-
https://doi.org/10.22219/repositor.v1i2.24
Azad, H. K., & Deepak, A. (2019). Query expansion
techniques for information retrieval: A survey. Information
Processing & Management, 56(5), 1698-1735.
doi:10.1016/j.ipm.2019.05.009
Silva, Alfredo & Mendoza, Marcelo. (2020).
Improving query expansion strategies with word
embeddings. 1-4. 10.1145/3395027.3419601.
Claudio Carpineto and Giovanni Romano. 2012. A
Survey of Automatic Query Expansion in Information
Retrieval. ACM Comput. Surv. 44, 1, Article 1 (January
, 50 pages. https://doi.org/10.1145/2071389.2071390
Kuzi, Saar & Shtok, Anna & Kurland, Oren. (2016).
Query Expansion Using Word Embeddings. 1929-1932.
1145/2983323.2983876.
Chandrasekaran, Yasunaga, M. K., Radev, M. a.,
Freitag, D. a., Kan, D. a., & Min-Yen. (2019). Overview and
Results: CL-SciSumm Shared Task 2019. BIRNDL.
Retrieved from Github: https://github.com/WINGNUS/scisumm-corpus
Aklouche, Billel & Bounhas, Ibrahim & Slimani,
Yahya. (2018). Query Expansion Based on NLP and Word
Embeddings.
Diaz, F.D., Mitra, B., & Craswell, N. (2016). Query
Expansion with Locally-Trained Word Embeddings. ArXiv,
abs/1605.07891.
Mosbah, Mawloud. (2018). Improving the Results
of Google Scholar Engine through Automatic Query
Expansion Mechanism and Pseudo Re-ranking using MVRA.
Journal of information and organizational sciences. 42. 219-
10.31341/jios.42.2.5.
jain, d. (2021, June 29). geeksforgeeks. Retrieved
from geeksforgeeks web site:
https://www.geeksforgeeks.org/data-preprocessing-in-datamining/
team, t. p. (n.d.). tutorials point. Retrieved from
tutorials point web site:
https://www.tutorialspoint.com/python_text_processing/pyt
hon_remove_stopwords.html
Beri, A. (2020, May 14). Towards Data Science.
Retrieved from Towards Data Science web site:
https://towardsdatascience.com/stemming-vslemmatization-2daddabcb221
Radim YehuZek, p. (n.d.). Word2vec embeddings.
Retrieved from radimrehurek web:
https://radimrehurek.com/gensim/models/word2vec.html
Brownlee, J. (2017, Oktober 11). Machine Learning
Mastery. Retrieved from Machine Learning Mastery
Website: https://machinelearningmastery.com/what-areword-embeddings/
Vatsal. (2021, juli 29). Toward Data Science.
Retrieved from Toward Data Science Website:
https://towardsdatascience.com/word2vec-explained49c52b4ccb71
Piramuthu, Robinson & Bhardwaj, Anurag & di,
Wei & Sundaresan, Neel. (2013). Visual Search: A LargeScale Perspective. 10.1016/B978-0-444-53859-8.00011-4.
Long, B., Chang, Y. (2014). Relevance Ranking for
Vertical Search Engines ([edition unavailable]). Elsevier
Science. Retrieved from
https://www.perlego.com/book/1810021/relevance-rankingfor-vertical-search-engines-pdf (Original work published
Rodd, Jennifer & Gaskell, Gareth & MarslenWilson, William. (2004). Modeling the effect of semanticambiguity in word recognition. Cognitive Science. 28. 89-
10.1016/j.cogsci.2003.08.002.
Beel, Joeran & Gipp, Bela. (2009). Google Scholar's
Ranking Algorithm: An Introductory Overview.