Ekspansi Query Menggunakan Word2Vec pada Pencarian Artikel Ilmiah

Penulis

  • Bayu Tresna Ariesta Telkom University
  • Ade Romadhony Telkom University
  • Hasmawati Hasmawati Telkom University

Abstrak

Abstrak — Pencarian informasi di internet sudah menjadi kebutuhan bagi sebagian besar orang dengan keperluannya masing masing, khususnya untuk para pelajar. Untuk pencarian artikel ilmiah sendiri bisa menggunakan mesin pencari google scholar untuk memudahkan pencarian agar lebih spesifik untuk artikel ilmiah. Meski menggunakan mesin pencari google scholar, informasi yang disediakan oleh mesin pencari tersebut masih terbilang banyak dan dibutuhkan kata kunci tertentu agar bisa mencari artikel ilmiah yang sesuai dengan yang diinginkan. Maka penggunaan ekspansi query dirasa sangat tepat untuk membantu pengguna dalam menentukan kata kunci yang tepat untuk melakukan pencarian. Pada penelitian ini dilakukan percobaan untuk menggunakan metode word embedding word2vec untuk melakukan ekspansi query dan melakukan dua skenario pencarian artikel ilmiah dengan menggunakan mesin pencari google scholar. Dataset yang digunakan untuk membuat model word2vec menggunakan data dari repository WINGNUS/scisumm-corpus. Nilai total akurasi yang didapat pada hasil pencarian skenario pertama sebesar 89,9% sedangkan untuk nilai total akurasi untuk hasil pencarian skenario kedua sebesar 76,1%.

Kata kunci— word2vec, ekspansi query, IR, pencarian artikel ilmiah

Referensi

REFERENSI

SiswadiI. 2016. Mengenal Konsep Penetapan Kata Kunci.

Jurnal Pustakawan Indonesia. 12, 2 (Mar. 2016).

DOI:https://doi.org/10.29244/jpi.12.2

S. Yang, X. Zheng, X. Yin, H. Mao and D. Zhao,

"An Algorithm of Query Expansion for Chinese EMR

Retrieval by Improving Expansion Term Weights and

Retrieval Scores," in IEEE Access, vol. 8, pp. 200063-

, 2020, doi: 10.1109/ACCESS.2020.3033017.

Dirga Nugraha, N. P., Maskur, M., & Hayatin, N.

(2019). Ekspansi Query Berbasis Semantik Pada Online

Public Access Catalog (OPAC). Jurnal Repositor, 1(2), 87-

https://doi.org/10.22219/repositor.v1i2.24

Azad, H. K., & Deepak, A. (2019). Query expansion

techniques for information retrieval: A survey. Information

Processing & Management, 56(5), 1698-1735.

doi:10.1016/j.ipm.2019.05.009

Silva, Alfredo & Mendoza, Marcelo. (2020).

Improving query expansion strategies with word

embeddings. 1-4. 10.1145/3395027.3419601.

Claudio Carpineto and Giovanni Romano. 2012. A

Survey of Automatic Query Expansion in Information

Retrieval. ACM Comput. Surv. 44, 1, Article 1 (January

, 50 pages. https://doi.org/10.1145/2071389.2071390

Kuzi, Saar & Shtok, Anna & Kurland, Oren. (2016).

Query Expansion Using Word Embeddings. 1929-1932.

1145/2983323.2983876.

Chandrasekaran, Yasunaga, M. K., Radev, M. a.,

Freitag, D. a., Kan, D. a., & Min-Yen. (2019). Overview and

Results: CL-SciSumm Shared Task 2019. BIRNDL.

Retrieved from Github: https://github.com/WINGNUS/scisumm-corpus

Aklouche, Billel & Bounhas, Ibrahim & Slimani,

Yahya. (2018). Query Expansion Based on NLP and Word

Embeddings.

Diaz, F.D., Mitra, B., & Craswell, N. (2016). Query

Expansion with Locally-Trained Word Embeddings. ArXiv,

abs/1605.07891.

Mosbah, Mawloud. (2018). Improving the Results

of Google Scholar Engine through Automatic Query

Expansion Mechanism and Pseudo Re-ranking using MVRA.

Journal of information and organizational sciences. 42. 219-

10.31341/jios.42.2.5.

jain, d. (2021, June 29). geeksforgeeks. Retrieved

from geeksforgeeks web site:

https://www.geeksforgeeks.org/data-preprocessing-in-datamining/

team, t. p. (n.d.). tutorials point. Retrieved from

tutorials point web site:

https://www.tutorialspoint.com/python_text_processing/pyt

hon_remove_stopwords.html

Beri, A. (2020, May 14). Towards Data Science.

Retrieved from Towards Data Science web site:

https://towardsdatascience.com/stemming-vslemmatization-2daddabcb221

Radim YehuZek, p. (n.d.). Word2vec embeddings.

Retrieved from radimrehurek web:

https://radimrehurek.com/gensim/models/word2vec.html

Brownlee, J. (2017, Oktober 11). Machine Learning

Mastery. Retrieved from Machine Learning Mastery

Website: https://machinelearningmastery.com/what-areword-embeddings/

Vatsal. (2021, juli 29). Toward Data Science.

Retrieved from Toward Data Science Website:

https://towardsdatascience.com/word2vec-explained49c52b4ccb71

Piramuthu, Robinson & Bhardwaj, Anurag & di,

Wei & Sundaresan, Neel. (2013). Visual Search: A LargeScale Perspective. 10.1016/B978-0-444-53859-8.00011-4.

Long, B., Chang, Y. (2014). Relevance Ranking for

Vertical Search Engines ([edition unavailable]). Elsevier

Science. Retrieved from

https://www.perlego.com/book/1810021/relevance-rankingfor-vertical-search-engines-pdf (Original work published

Rodd, Jennifer & Gaskell, Gareth & MarslenWilson, William. (2004). Modeling the effect of semanticambiguity in word recognition. Cognitive Science. 28. 89-

10.1016/j.cogsci.2003.08.002.

Beel, Joeran & Gipp, Bela. (2009). Google Scholar's

Ranking Algorithm: An Introductory Overview.

##submission.downloads##

Diterbitkan

2023-11-01

Terbitan

Bagian

Program Studi S1 Informatika