Implementasi Dan Analisis Kesamaan Semantik Antar Kata Berbahasa Inggris Dengan Metode Second Order Co-occurrence Pointwise Mutual Information

I Komang Resnawan Tri Putra, Moch. Arif Bijaksana, Mohamad Syahrul Mubarok

Abstract

Keterkaitan semantik mengacu pada sejauh mana dua konsep atau kata-kata yang terkait (atau tidak), sedangkan kesamaan semantik adalah kasus khusus atau bagian dari keterkaitan semantik. Kesamaan kata (word similarity) adalah pengukuran seberapa mirip sebuah pasangan kata secara semantik, dengan adanya hubungan sinonim maka pasangan kata tersebut memiliki nilai tertinggi. Pointwise Mutual Information (PMI) merupakan salah satu pengukuran secara statistik untuk keterkaitan semantik dan kesamaan semantik yang telah banyak digunakan. Salah satu varian pada PMI ialah Second Order Co-ocurrence Pointwise Mutual Information (SOC- PMI). Hasil dari penelitian pada tugas akhir ini merupakan nilai korelasi antara skor kesamaan yang dihasilkan sistem dengan gold standard SimLex-999, WordSim353 dan Miller and Charles. Nilai korelasi tertinggi yaitu 0,2881 dengan menggunakan window size = 33 dan nilai δ = 6,5. Parameter yang menyebabkan korelasi terbaik dengan metode SOC-PMI ini ialah konteks katanya antara pasangan kata yang dibandingkan.

Kata kunci : Kesamaan semantik, Pointwise Mutual Information, Second Order Co-occurrence Pointwise Mutual Information.

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0