Analisis Pencocokan Nama Arab Terjemahan Bahasa Indonesia Menggunakan Soundex dan Levenshtein Distance

Fauzan Ramadhan, Moch. Arif Bijaksana, Bambang Ari Wahyudi

Abstract

Cara seseorang dalam mengeja nama orang lain seringkali berbeda dengan orang yang lain. Padahal nama yang akan dieja adalah nama dari seseorang yang sama. Seperti nama ‘Aisyah’, kadang ada yang mengejanya dengan kata ‘Aisyah’, ‘Aisha’, ‘Aisah’, dan lain-lain. Pencarian nama periwayat pada saat ini baru sampai tahap ‘string matching’, sehingga ketika seseorang menggunakan ejaan nama yang berbeda, sistem tersebut tidak akan menampilkan hadits yang diriwayatkan oleh nama-nama yang dianggap mirip. Harapannya dengan sistem yang dibangun ini akan memperbaiki pengalaman pencarian nama dari periwayat hadits, sehingga sistem yang ada akan menampilkan hadits yang diriwayatkan oleh seseorang dimulai dari yang mempunyai kemiripan nama tertinggi sampai terendah dengan nama yang dicari. Penelitian ini menggunakan metode Soundex, lalu dilanjutkan dengan metode Levenshtein. Setelah itu, akan dilakukan penghitungan untuk menilai kinerja dari sistem ini menggunakan nilai precision, recall, f-measure dan akurasi. Soundex akan menentukan nama yang mempunyai kesamaan pengucapan suatu nama terhadap nama lain. Sedangkan Levenshtein akan memberikan nilai kemiripan dari nama yang sudah dipilih sebelumnya dengan nama yang dicari oleh pengguna. Nilai kinerja sistem didapat dari hasil yang diberikan dibandingkan dengan nilai yang ada pada gold standard. Dengan beberapa pengujian, sistem yang dibangun menggunakan Soundex dan Levenshtein ini mendapatkan nilai akurasi sebesar 99.95 persen. Kata kunci : Soundex, Levenshtein, precision, recall, f-measure, akurasi

Abstract The way someone spells someone else’s name is often different from other people. Even though the name that will be spelled is the name of the same person. Like the name ’Aisha’, sometimes there are who spell it with the words ’Aisyah’, ’Aisha’, ’Aisah’, and others. The search for the name of the narrator at this time is only until the string matching stage, so when someone uses a different spelling of the name, the system will not display the hadith narrated by names that are considered similar. The hope with this system will improve the experience of searching the names of the hadith narrators, so that the existing system will display the hadith narrated by someone starting from the one having the highest to the lowest name with the name sought. This study used the Soundex method, then continued with the Levenshtein method. After that, it will be calculated to assess the performance of this system using precision, recall, f-measure and accuracy. Soundex will determine the name that has the same pronunciation as a name for another name. Whereas Levenshtein will give a similar value of the name that has been previously selected with the name that is searched by the user. The value of system performance is obtained from the results given compared to the values that are at the gold standard. From several tests, the system built using Soundex and Levenshtein has an accuracy value of 99.95 percent. Keywords: Soundex, Levenshtein, precision, recall, f-measure, accuracy

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0