Implementasi Dan Analisis Kesamaan Semantik Antar Kata Berbahasa Inggris Dengan Metode Second Order Co-occurrence Pointwise Mutual Information

Authors

  • I Komang Resnawan Tri Putra Telkom University
  • Moch. Arif Bijaksana Telkom University
  • Mohamad Syahrul Mubarok Telkom University

Abstract

Keterkaitan semantik mengacu pada sejauh mana dua konsep atau kata-kata yang terkait (atau tidak), sedangkan kesamaan semantik adalah kasus khusus atau bagian dari keterkaitan semantik. Kesamaan kata (word similarity) adalah pengukuran seberapa mirip sebuah pasangan kata secara semantik, dengan adanya hubungan sinonim maka pasangan kata tersebut memiliki nilai tertinggi. Pointwise Mutual Information (PMI) merupakan salah satu pengukuran secara statistik untuk keterkaitan semantik dan kesamaan semantik yang telah banyak digunakan. Salah satu varian pada PMI ialah Second Order Co-ocurrence Pointwise Mutual Information (SOC- PMI). Hasil dari penelitian pada tugas akhir ini merupakan nilai korelasi antara skor kesamaan yang dihasilkan sistem dengan gold standard SimLex-999, WordSim353 dan Miller and Charles. Nilai korelasi tertinggi yaitu 0,2881 dengan menggunakan window size = 33 dan nilai δ = 6,5. Parameter yang menyebabkan korelasi terbaik dengan metode SOC-PMI ini ialah konteks katanya antara pasangan kata yang dibandingkan.

Kata kunci : Kesamaan semantik, Pointwise Mutual Information, Second Order Co-occurrence Pointwise Mutual Information.

Downloads

Published

2016-12-01

Issue

Section

Program Studi S1 Informatika