Identifikasi Parafrasa Bahasa Indonesia Menggunakan Naive Bayes

Authors

  • Bayu Julianto Telkom University
  • Adiwijaya Adiwijaya Telkom University
  • Muhammad Mubarok Telkom University

Abstract

Salah satu tujuan dari Natural Languange Processing adalah mengidentifikasi parafrasa, yang berarti untuk mengajarkan kepada mesin apakah sebuah kalimat memiliki makna yang sama dengan kalimat lainnya. Parafrasa berarti pengungkapan kembali suatu tuturan dari sebuah tingkatan atau macam bahasa menjadi yang lain tanpa merubah pengertian. Dalam penelitian ini dilakukan klasifikasi untuk menentukan apakah dua kalimat Bahasa Indonesia termasuk kedalam parafrasa atau non-parafrasa.. Penelitian dilakukan dengan menggunakan Naïve Bayes sebagai classifer. Performansi terbaik dari sistem menghasilkan akurasi 0.713, presisi 0.688, recall 0.798, dan F1-Measure 0.735. Kata kunci :Naive Bayes, identifikasi parafrasa, preprocessing.

Downloads

Published

2017-12-01

Issue

Section

Program Studi S1 Informatika