Pengembangan Sistem Berbasis Komputer Untuk Pembangunan Stemming Pada Al-quran Menggunakan Algoritma Shereen Khoja Stemmer
Abstract
Abstrak
Saat ini banyak ahli dalam bidang teknologi informasi telah merancang dan mengembangkan algoritma untuk memecahkan masalah stemming, khususnya dalam bahasa arab. Namun dari sekian banyak analisa stemming dalam bahasa arab, belum ada standardisasi algoritma stemming yang baik dalam menganalisa akurasi teks pada Al-Quran. Pembangunan stemming pada Al-Quran merupakan suatu pekerjaan yang penting karena mendukung klasifikasi sharaf dalam Al-Quran guna memahami arti dari setiap kata pada Al-Qur‟an. Salah satu stemmer atau algoritma stemming untuk mencari bentuk dasar dari suatu kata dalam bahasa arab ialah algoritma Khoja Stemmer. Cara kerja dari Khoja Stemmer ialah dengan mencoba untuk mencari akar pada suatu kata dalam bahasa arab dengan menghilangkan awalan terpanjang dan akhiran terpanjang suatu kata, lalu mencoba untuk menentukan akar dari kata yang tersisa menggunakan kamus akar kata. Dalam penelitian kali ini, Khoja Stemmer yang dibangun mampu menghitung rata-rata stemming pada Al-Quran sebesar 95,295%. Akan tetapi akar kata yang dihasilkan oleh Khoja Stemmer apabila di periksa secara manual masih terdapat beberapa kesalahan. Dengan demikian, dibutuhkan suatu kamus Al-Quran untuk menganalisa setiap hasil stemming yang dilakukan oleh Khoja stemmer dalam melakukan stemming pada Al-Quran.
Kata kunci: al-quran, stemming, khoja stemmer, sharaf, bahasa arab
Abstract
Today many experts in the field of information technology have been designing and developing algorithms to solve stemming problems, especially in Arabic. But, from many stemming analysis in Arabic, there is no standardization of good stemming algorithm in analyzing the accuracy of the text in the Quran. The construction of stemming in the Quran is an important work because it supports the classifica tion of sharaf in the Quran to understand the meaning of every word in the Quran. One stemmer or stemming algorithm to find the basic form of a word in Arabic is the Khoja Stemmer algorithm. The workings of Khoja Stemmer is to try to search root in a word of Arabic by removing the longest prefix and longest suffix of a word, then trying to determine the root of the remaining word using the root dictionary. In this research, the built of Khoja Stemmer is able to calculate the average stemming in the Quran of 95.295%. However, the roots produced by Khoja Stemmer are still found some errors when manually checked. Thus, it takes a dictionary of the Quran to analyze every result of stemming done by Khoja Stemmer in order to stemming the Quran.
Keywords: quran, stemming, khoja stemmer, sharaf, arabic