Analisis Dan Implementasi Short Text Similarity Dengan Metode Latent Semantic Analysis Untuk Mengetahui Kesamaan Ayat Al-quran

Mochamad Irfan Dary, Moc. Arif Bijaksana, Siti Sa'adah

Abstract

Salah satu cara untuk membantu memahami sebuah konsep adalah dengan mencari hubungan antara konsep tersebut dengan konsep yang lainnya. Latent semantic analysis (LSA) adalah salah satu penerapan dari hal tersebut. Dimana  LSA dapat mencari nilai kesamaan antar konsep. LSA adalah suatu cara untuk mengekstraksi tulisan dan membuat representasi statistik dari tulisan tersebut dengan pendekatan dimensi rendah (low rank approximation), dimana digunakan dimensi yang kecil untuk mengetahui keseluruhan makna dokumen. Tetapi salah satu kekurangan LSA adalah tidak ada cara yang pasti untuk mengetahui berapa dimensi yang harus digunakan dan bagaimana signifikansi dari penggunaannya pada short text seperti ayat al-Quran. Dari hasil pengujian didapat bahwa dari berbagai dimensi yang digunakan, akurasi maksimum adalah 71% dan F-measure terbaik adalah 40%. Lebih baik dibandingkan term document matrix biasa (tanpa LSA) dengan akurasi 85% tetapi F-measure 0%. Temuan lainnya adalah jika dimensi yang dipilih terlalu rendah, maka nilainya semakin seragam dan bias sehingga nilainya kurang relevan. Selain itu ada dimensi keseimbangan, dimana dimulai dari dimensi tersebut, hasil similarity tidak akan terlalu jauh berbeda.  Kata Kunci: latent semantic analysis, similarity, al-Quran, clustering, matriks, singular value decomposition, cosine similarity

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0