Pemberian Peringkat Jawaban Pada Forum Tanya-jawab Online Menggunakan Lexical Dan Semantic Similarity Measure Feature

Authors

  • Riska Junia Wulandari Telkom University
  • Ade Romadhony Telkom University
  • Moch. Arif Bijaksana Telkom University

Abstract

Maraknya penggunaan internet saat ini membuat banyak forum tanya-jawab (Community Question Answering On- line) bermunculan. Bahkan forum tanya jawab yang muncul bukan hanya untuk masalah akademik, tetapi tentang kehidupan disuatu negara seperti QatarLiving Forum. Namun, tidak semua jawaban yang diberikan sesuai dengan pertanyaan yang diajukan. Membutuhkan waktu yang lama untuk menentukan jawaban yang sesuai dengan per- tanyaan yang diajukan. Untuk itu, dibutuhkan suatu sistem yang dapat memberikan peringkat pada jawaban untuk membantu merangking jawaban yang sesuai dengan pertanyaan. Adapun tahapan yang dilakukan pada penelitian ini yaitu, dimulai dari preprocessing dataset berdasarkan SemEval 2016 question answering similarity, melakukan ekstraksi fitur untuk membantu proses klasifikasi dengan menggunakan lexical similarity feature, semantic similar- ity feature, non textual feature grup dan Heuristic. Penelitian ini memfokuskan pada penggunaan lexical similarity dan semantic similarity untuk mencari kemiripan antar pertanyaan dan jawaban. Hasil ekstraksi fitur ini akan dijadikan inputan untuk classfier untuk membuat model yang akan digunakan oleh data uji. Classifier yang digu- nakan yaitu Support Vector Machine (SVM) dan logistic regression untuk mendapatkan score klasifikasi dimana score ini yang menentukan peringkat sebuah jawaban untuk setiap pertanyaan. Hasil penelitian yang diperoleh me- nunjukkan pengaruh fitur terhadap kedekatan antara pertanyaan dan jawaban. Lexical similarity feature terutama sub feature Cosine similarity dan LCS menunjukkan semakin tinggi nilai feature pada jawaban semakin jawaban tersebut mendekati pertanyaan yang diajukan. Sedangkan nilai semantic similarity menggunakan Wu Palmer Algo- rithm, persebaran nilai antar kelasnya lebih merata, sehingga cukup sulit untuk membedakan ciri setiap kelasnya. Non Textual Feature Group membantu dalam melakukan klasifikasi jawaban dan meningkatkan akurasi sebanyak 4%.


Kata Kunci: Community Question Answering, Question Answering System, similarity measure, classifier, per- ingkat jawaban CQA, MAP.

Downloads

Published

2016-08-01

Issue

Section

Program Studi S1 Informatika