Pembangunan Basis Data Leksikal Wordnet Bahasa Sunda

Authors

  • Novihana Nurani Setiawan Telkom University
  • Sari Dewi Budiwati Telkom University

Abstract

WordNet adalah suatu sumber informasi rujukan yang banyak dipakai dalam berbagai aplikasi mutakhir yang membantu manusia mengolah dan mencerna informasi, misalnya aplikasi-aplikasi information retrieval, machine translation, dan natural language processing (NLP). WordNet bahasa Sunda adalah kamus bahasa Sunda yang memfokuskan pada makna kata. Satu makna dalam WordNet dapat dinyatakan dengan synset yaitu kumpulan kata yang merepresentasikan suatu makna. Selain representasi makna, di dalam WordNet juga terdapat relasi antar makna seperti sinonim, antonim, hipernim, hiponim, holonim, meronim. Proyek Akhir ini bertujuan untuk membangun WordNet bahasa Sunda berdasarkan konsep Princeton WordNet (PWN). Data-data yang digunakan antara lain bersumber dari WordNet bahasa Indonesia, Kamus Umum Bahasa Sunda (KUBS), dan Kamus Besar Bahasa Indonesia (KBBI). Metode yang digunkan adalah metode merge, dengan langkah pertama yang dilakukan adalah membandingkan dua bahasa untuk mencari kesamaan dan perbedaannya, unsur penentu yang dibandingkan berupa bentuk leksikal bahasa Sunda dengan bahasa Indonesia. Proses ini dilakukan dengan menggunakan aplikasi web-based dan melibatkan sejumlah pengguna untuk berpartisipasi dengan cara menentukan sinonim, antonim, hipernim-hiponim, dan holonim-meronim dari sinset yang telah di sediakan aplikasi WordNet bahasa Sunda.

Kata kunci : WordNet, Sinonim set, Relasi Leksikal, Relasi Semantik.

Downloads

Published

2016-04-01

Issue

Section

Program Studi D3 Manajemen Informatika