Stemming Words Dengan N-Gram Dan Lexeme Based Untuk Teks Berbahasa Korea
Abstrak
Bahasa Korea termasuk ke dalam bahasa aglutinatif yang termasuk unik dan memiliki berbagai jenis pelekatan morfem, dengan kondisi ini, pengaplikasian teknik stemming words dianggap sedikit sulit untuk dilakukan. Beberapa penelitian sudah dilakukan, namun masih ditemui beberapa kesalahan dikarenakan adanya keunikan dari karakter kata dalam Bahasa Korea. Dalam penelitian kali ini akan dibahas teknik baru untuk melakukan stemming words atau pencarian kata dasar disertai dengan deteksi imbuhannya. Penelitian ini bertujuan untuk membentuk kata dasar dari kata kerja berimbuhan pada bahasa Korea dan mencari jenis dan arti dari imbuhan yang melekat pada kata tersebut. Penelitian ini dilakukan dengan menggabungkan metode N-gram dan Lexeme Based. Dalam pencarian kata dasar ini sejumlah kata kerja yang mendapat imbuhan dalam tata bahasa tertentu dipecah untuk menghasilkan kata dasar dan imbuhan yang sesuai. Pemecahan kata berimbuhan dilakukan dengan metode N- gram dan dilanjutkan dengan pengaplikasian metode Lexeme Based untuk pencarian kata dasar serta jenis dan arti imbuhan. Hasil yang didapatkan pada penelitian ini adalah pembentukan kata dasar dan imbuhan yang disertai dengan jenis imbuhan serta arti dari imbuhan tersebut.
Kata kunci : stemming words, Bahasa Korea, N-gram, Lexeme Based, aglutinatif.