Implementasi Dan Analisis Kesamaan Semantik Pada Bahasa Indonesia Dengan Metode Berbasis Vektor

Authors

  • Rhesa Hermawan Telkom University
  • Ade Romadhony Telkom University
  • Said Faraby Telkom University

Abstract

Kesamaan semantik adalah tugas untuk memperkirakan kekuatan hubungan semantik antara unit bahasa atau konsep, dalam hal ini kesamaan makna yang dimiliki oleh sepasang kata. Kesamaan semantik pada kata bahasa Indonesia dapat diukur dengan menggunakan basis pengetahuan seperti Kamus Besar Bahasa Indonesia. Metode berbasis vektor merupakan salah satu metode yang dapat digunakan untuk mengukur kesamaan semantik. Pada Tugas Akhir ini diimplementasikan kesamaan semantik pada pasangan kata bahasa Indonesia dengan menggunakan metode berbasis vektor, pembobotan tf-idf, dan perhitungan kesamaan kosinus, Kamus Besar Bahasa Indonesia sebagai basis pengetahuan, dan dataset yang digunakan dibuat berdasarkan referensi dari SimLex999 dan Rubensteingoodenough sebanyak 180 pasang kata, gold standard yang didapat berdasarkan hasil kuesioner terhadap 31 orang responden. Hasil penelitian yang telah dilakukan, didapatkan nilai korelasi terbaik sebesar 0.5416 dengan menambahkan definisi sinonim dalam pengujian. Parameter terbaik yang mempengaruhi nilai kesamaan semantik pada penelitian ini adalah dengan menambahkan definisi dari sinonim tanpa stopword removal. Kata Kunci: gold standard, Kamus Besar Bahasa Indonesia, kesamaan semantik, kesamaan kosinus, metode berbasis vektor, tf-idf.

Downloads

Published

2017-12-01

Issue

Section

Program Studi S1 Informatika