Klasifikasi Argumen Semantik Menggunakan Kombinasi Fitur Named Entities In Constituent, Head Word Pos, Dan Syntactic Frame

Authors

  • Nisaa' 'Ainulfithri Telkom University
  • Moch. Arif Bijaksana Telkom University
  • Siti Sa'adah Telkom University

Abstract

Abstrak  Natural Language Processing (NLP) merupakan salah satu cabang ilmu komputer yang berfokus pada pengolahan bahasa natural/bahasa manusia. Sebagian besar task NLP   seperti Question Answering, Semantic Role Labeling, dan Information Extraction memerlukan informasi 5W (Who, What, Where, When, Why)  dan  1H  (How)  untuk  mengekstrak  informasi  yang  dibutuhkan.  Klasifikasi  argumen  semantik merupakan proses pelabelan argumen berdasarkan aturan semantik dimana aturan semantik dapat merepresentasikan informasi 5W+1H tersebut. Dalam melakukan klasifikasi argumen semantik diperlukan fitur-fitur yang dapat membantu proses klasifikasi. Pada penelitian ini, fitur yang akan digunakan adalah fitur dasar dan tiga fitur tambahan yaitu Named Entities in Constituent, Head Word POS, dan Syntactic Frame. Penggunaan ketiga fitur tambahan tersebut terbukti dapat meningkatkan akurasi. Algoritma yang digunakan dalam proses klasifikasi adalah Sequential Minimum Optimization (SMO) yang merupakan pengembangan dari Support Vector Machine (SVM). Algoritma SMO dapat mengatasi permasalahan multi-class dan dapat melakukan proses learning dengan waktu yang lebih singkat daripada SVM. Berdasarkan pengujian yang telah dilakukan, penggunaan tiga fitur tambahan yaitu Named Entities in Constituent, Head Word POS, dan Syntactic Frame dapat meningkatkan hasil akurasi dengan kenaikan akurasi sebesar 11,82%. Kata  kunci  :  klasifikasi  argumen  semantik,  Sequential  Minimum  Optimization  (SMO),  Natural Language Processing (NLP), Named Entities in Constituent, Head Word POS, Syntactic Frame

Downloads

Published

2015-08-01

Issue

Section

Program Studi S1 Informatika