Analisis Pencocokan Nama dengan Nama Arab Terjemahan Bahasa Indonesia Menggunakan metode Levenshtein Distance

Authors

  • Wahyu Kurniawan Telkom University
  • Moch. Arif Bijaksana Telkom University
  • Bambang Ari Wahyudi Telkom University

Abstract

Abstrak Dalam pencarian nama masih ada yang menuliskannya tidak sesuai dengan nama aslinya yang dicari sehingga nama yang ingin didapatkan itu tidak akan ketemu. Terkadang beberapa nama mempunyai kesamaan dalam pengucapannya, namun tulisannya berbeda-beda atau ejaannya pun bisa berbeda dari setiap orang yang menuliskannya. Karena nama yang ejaan atau tulisannya yang berbeda tersebut mungkin merupakan nama yang sama, sehingga perlu adanya penelitian nama yang berbeda tersebut memiliki kemiripan yang sama. Untuk mengetahui itu adalah nama yang sama, maka nama tersebut dicocokkan dengan metode name matching yang merupakan metode yang didalamnya terdapat algoritma untuk mencocokkan nama. Algoritma levenshtein distance merupakan salah satu metode yang digunakan dalam pencocokan nama yang dapat menkonversi dua nama dengan tulisan atau ejaannya yang berbeda memiliki kemiripan yang sama. Hasil analisis yang didapat dari varian nama yang digunakan untuk pencocokkan nama menggunakan metode levenshtein distance mendapatkan nilai precision, recall, f-measure dan Akurasi yang berubah-ubah tergantung dari nilai kemiripannya dan pengaruh kesesuaian query dengan gold standard nya, sehingga nilai precision, recall, f-measure dan akurasi dapat mencapai 100%.

Kata kunci : levenshtein distance, precision, recall, name matching,

akurasi, f-measure. Abstract In the search for names there are still those who write it not according to the original name they are looking for so that the name you want to get will not be found. Sometimes some names have similarities in pronunciation, but the writing is different or the spelling can be different from everyone who wrote it. Because the name whose spelling or writing is different may be the same name, so the need for research of different names has the same similarity. To find out that is the same name, the name is matched with the name matching method which is a method in which there is an algorithm to match names. The levenshtein distance algorithm is one of the methods used in matching names that can convert two names with different writing or spelling having the same similarity. The results of the analysis obtained from the name variants used for name matching using the levenshtein distance method get precision, recall, f-measure and accuracy that vary depending on the similarity value and the influence of the gold standard query compatibility, so the precision, recall, f-measure and accuracy can reach 100%. Keywords: levenshtein distance, precision, recall, name matching, accuracy, f-measure.

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Informatika