Implementasi Algoritma Naïve Bayes Untuk Word Senses Disambiguation Dalam Bahasa Indonesia

Authors

  • Rifki Mifathur Sutomo Telkomuniversity
  • Arie Ardiyanti Suryani Telkomuniversity

Abstract

Abstrak Kata atau kalimat ambigu merupakan suatu permasalahan yang ditemukan dalam penggunaan bahasa baik dalam kontek verbal atau tekstual. Suatu kata dikatakan ambigu jika memiliki lebih dari satu makna. Dalam kalimat, makna kata dapat ditentukan oleh struktur dari kalimatnya. Dalam Natural Language Processing terdapat metode yang dapat mencari suatu makna kata dengan proses perhitungan yang tepat yaitu dinamakan word sense disambiguation. Penelitian ini berfokus dalam penerepan algoritma naïve bayes dalam word sense disambiguation bahasa Indonesia. Pemilihan algoritma naïve bayes dikarenakan naïve bayes dapat menghasilkan akurasi yang bagus sebagai salah satu bagian dari supervised method. Penelitian ini mengumpulkan data dari korpus bahasa Indonesia. Korpus diambil dari jejaring sosial, surat kabar online dan membuat kalimat ambigu sendiri. Dalam mempermudah klasifikasi penelitian ini menggunakan bahasa pemrograman python. Dalam python terdapat module yang digunakan untuk menemukan pola string tertentu yang disebut regex. Tujuan penelitian ini mengklasifikasi, serta menganalisis penerapan algoritma naïve bayes kedalam word sense disambiguation bahasa Indonesia.

Kata kunci : kata ambigu, Bahasa Indonesia, natural language processing, word sense disambiguation, supervised, klasifikasi naïve bayes

Abstract Ambiguous words or sentences are a problem found in the use of language both in verbal and textual contexts. A word is ambiguous if it has more than one meaning. In a sentences, the meaning of words can be determined by the structure of the sentence. In Natural Language Processing there is a method that can search for a word's meaning with an exact calculation process that is called word sense disambiguation. This research focuses on the advance of naïve Bayes algorithm in Indonesian sense of word disambiguation. The choices of naïve bayes algorithm is because naïve bayes can produce good accuracy as part of the supervised method. This research collected data from the Indonesian corpus. The corpus was taken from social networks, online newspapers and made own ambiguous sentences. In simplifying the classification of this research using the python programming language. In python there is a module that is used to find certain string patterns called regex. The purpose of this study is to classify, also to analyze the application of the Naïve Bayes algorithm into word sense disambiguation in Indonesian language.

Keywords: ambigious words, Indonesia language, natural language processing, word sense disambiguation, supervised, naïve bayes classification

Downloads

Published

2020-08-01

Issue

Section

Program Studi S1 Informatika