Analisis Dan Implementasi Kesamaan Semantik Antar Teks Menggunakan Pendekatan Alignment Dan Vektor Semantik Pada Terjemahan Alquran
Abstract
Alquran adalah pedoman hidup umat Islam yang sudah memiliki banyak tafsiran agar mudah untuk dipahami. Untuk mempermudah pencarian kesamaan ayat maka dilakukanlah penelitian pada teks terjemahan Alquran. Banyak metode dalam bidang text mining dan NLP yang dapat digunakan untuk mengukur kesamaan semantik antar kalimat, beberapa diantara yaitu menggunakan alignment dan vektor semantik. Alignment adalah salah satu metode yang dapat menghitung kesamaan semantik dengan melakukan penyejajaran kata-kata. Fitur alignment yang digunakan dalam penelitian ini yaitu identical words, PPDB, word sequences, dan named entities. Sementara vektor semantik adalah metode yang digunakan untuk menghitung kemiripan sebuah kata dari distribusi kata-kata di sekitarnya. Agar memperoleh hasil yang lebih baik maka dilakukan kombinasi dari metode alignment dengan vektor semantik menggunakan regresi ridge. Selain itu, dilakukan juga pembuatan gold standard sebagai tolak ukur untuk mengetahui nilai korelasi yang menjadi kontribusi penulis untuk menambahkan data yang sudah ada pada penelitian tahun lalu. Kombinasi metode alignment dan vektor semantik untuk menghitung kesamaan semantik pada data terjemahan Alquran tahun 2016 menghasilkan nilai korelasi 0,90467, sementara untuk data terjemahan Alquran yang dikumpulkan pada tahun 2017 menghasilkan nilai korelasi 0,79756. Kata kunci: text mining, nlp, word alignment, semantik, vektor semantik, quran, islam, regresiDownloads
Published
2017-08-01
Issue
Section
Program Studi S1 Informatika