Pencarian Ayat Al-qur’an Yang Tidak Utuh Berdasarkan Kemiripan Fonetis
Abstract
Abstrak Al-Qur’an merupakan kitab suci umat islam yang memiliki banyak kata didalamnya dengan peng- gunaan aksara arab. Aksara arab ini tidak berkesinambungan dengan aksara latin terutama latin Indo- nesia. Seiring perkembangan teknologi, di kembangkan sebuah sistem pencarian ayat Al-Qur’an berda- sarkan kemiripan fonetis salah satunya adalah lafzi+ yang merupakan perkembangan dari sistem lafzi. Namun lafzi+ belum bisa menangani dengan baik ketika pengguna ingin mencari ayat yang tidak leng- kap atau tidak utuh dikarenakan kueri yang dimasukkan oleh pengguna tidak sama dengan kueri dalam korpus Al-Qur’an. Maka dari masalah tersebut dibuatlah pengembangan dari sistem lafzi+. Dengan me- lakukan pengindeksan trigram untuk kecocokan string antara kueri dengan transliterasi ayat Al-Qur’an serta menghitung pemeringkatan dokumen dengan batas ambang maka hasil yang di munculkan mampu mengeluarkan tujuan standar ayat yang ingin dihasilkan serta kemungkinan-kemungkinan ayat dari kueri masukkan. Pengujian menunjukkan bahwa sistem ini menghasilkan nilai lebih besar dari sistem-sistem se- belumnya yaitu dengan nilai Recall dan MAP sebesar 99,92% dan 91,40%. Sistem ini dapat menghasilkan . Sedangkan sistem sebelumnya mendapatkan hasil 16,74% dan 18%.
Kata kunci :Al-Qur’an, sistem pencarian, kemiripan fonetis, trigram
Abstract The Qur’an is the Muslim holy book which has many words in it with the use of Arabic script. This Arabic script is not sustainable with Latin script, especially Latin Indonesia. As technology develops, a system for searching verses of the Qur’an is developed based on phonetic similarities, one of which is lafzi + which is the development of the lafzi system. However, lafzi+ cannot handle it well when users want to look for verses that are incomplete or incomplete because the query entered by the user is not the same as the query in the corpus of the Qur’an. Then from this problem the development of the lafzi+ system was made. By doing trigram indexing for matching strings between the query and transliteration of the verses of the Qur’an and calculating the ranking of documents with a threshold, the results that appear are able to issue the standard purpose of the verse to be produced as well as the possibilities of verses from the entered query. Tests show that this system produces a greater value than previous systems, namely the Recall and MAP values of 99.92 % and 91.40 %. This system can produce. Whereas the previous system got results of 16.74 % and 18 %. Keywords: Al-Qur’an, search system, phonetic similarity, trigram.