Pemeringkatan Jawaban Pada Community Question Answering Dengan Tekstual Fitur Dan Pemodelan Topik

Authors

  • Luh Putri Ayu Ningsih Telkom University
  • Ade Romadhony Telkom University
  • Moch. Arif Bijaksana Telkom University

Abstract

Community question answering(CQA), seperti qatar living forum telah menjadi salah satu tempat bagi pengguna in- ternet untuk mendapatkan informasi. Satu pertanyaan pada CQA dapat memiliki banyak jawaban, namun pengguna harus memilih jawaban yang paling sesuai dengan pertanyaannya secara manual yang membutuhkan waktu cukup lama.Permasalahan ini dapat diatasi dengan membangun sistem pemeringkatan jawaban dari list jawaban yang telah ada dimana jawaban yang sesuai dengan pertanyaan diatas jawaban yang tidak sesuai dengan pertanyaan. Proses per- tama yang akan dilakukan dalam penelitian yaitu teks preprocessing.Setelah data teks menjadi lebih teratur dilakukan ekstraksi fitur , dimana fitur yang akan digunakan adalah tekstual fitur dan pemodelan topik .Tekstual fitur adalah mengidentifikasi ciri ciri sebuah jawaban yang Good dan bad dengan melihat elemen-elemen teksnya seperti melihat apakah sebuah jawaban mengandung tanda tanya(?), emotikon,link atau kata-kata tertentu.Pemodelan topik meru- pakan pemodelan data tekstual yang bertujuan menemukan variabel tersembunyi.  Dalam Penelitian ini akan fokus pada penggunaan pemodelan topik untuk mencari kemiripan antar pertanyaan dan jawaban. Hasil ekstraksi fitur ini akan dijadikan inputan untuk classfier untuk membuat model yang akan digunakan oleh data uji. Pada pengerjaan tu- gas akhir ini mengunakan Support Vector Machine (SVM) dan logistic regression untuk mendapatkan score klasifikasi dimana score ini yang menentukan peringkat sebuah jawaban untuk setiap pertanyaan. Berdasarkan hasil evaluasi dari penelitian yang dilakukan penulis didapatkan bahwa sistem pemeringkatan yang dibuat memiliki nilai mean avarage precision sebesar 71.9. Hasil ini didapatkan mengunakan logistic regression sebagai classifiernya. Jika dibandingkan dengan hasil peserta SemEval 2016 task 3 hasil yang didapatkan dalam penelitian ini berada di rangking 8 dari 13 peserta. Kata Kunci: community question answering,tekstual fitur, pemodelan topik,ekstraksi fitur,Peringkat

Downloads

Published

2016-08-01

Issue

Section

Program Studi S1 Informatika