Analisis Dan Implementasi Keterkaitan Semantik Dengan Metode Berbasis Vektor

Authors

  • Chandra Pangestu Telkom University
  • Moc. Arif Bijaksana Telkom University

Abstract

Keterkaitan semantik adalah mengukur kekuatan koneksi semantik yang ada antara unit tekstual, dalam hal ini antar pasangan kata. keterkaitan antara pasangan kata yang mana memiliki keterkaitan makna. Misalnya ingin menentukan besar nilai keterkaitan semantik antara meja dengan kursi. Untuk mengukur nilai keterkaitan antara pasangan kata tersebut ada beberapa metode yang bisa digunakan yang salah satunya adalah metode yang berbasis vektor. Metode berbasis vektor merupakan salah satu metode yang digunakan untuk mengukur seberapa besar keterkaitan semantik antar pasangan kata. Dengan menggunakan metode vektor ini, sepasang kata akan diubah ke dalam bentuk vektor masing-masing dengan membandingkan beberapa fitur antara kedua kata tersebut. Pada Tugas Akhir ini diimplementasikan dalam bentuk aplikasi untuk mengukur keterkaitan antara sepasang kata dengan metode berbasis vektor, dengan fitur yang didapat dari kedua kata tersebut dengan menggunakan WordNet, metode tf-idf, dan wordsim353 sebagai dataset pengujian yang berisi 252 pasangan kata beserta nilai gold standard. Hasil penelitian yang didapat menggunakan metode berbasis vektor pada wordsim353 didapatkan nilai korelasi sebesar 0,42 dengan menggunakan gloss dan meronim. Dan parameter yang mempengaruhi nilai keterkaitan semantik yang baik adalah dengan menggunakan gloss dan hipernim.

Kata Kunci: WordNet, vektor , keterkaitan semantik, tf-idf, pasangan kata, dataset.

Downloads

Published

2016-04-01

Issue

Section

Program Studi S1 Informatika