Argumentation Mining Menggunakan Ekstraksi Lexical Feature Dan Contextual Feature Dengan Metode Naïve Bayes

Dievarino Dwisusanto, Ibnu Asror, Yanuar Firdaus Arie Wibowo

Abstract

Abstrak
Zaman ini perkembangan informasi semakin pesat termasuk perkembangan pada data yaitu data teks.
Teks merupakan data berbahasa alami yang tidak terstruktur. Seiring berjalannya waktu data teks
semakin banyak, dengan itu maka dilakukan pemanfaatan pada data teks , salah satu nya pemanfaatan
untuk menentukan komponen argumen pada teks. Argumen sendiri sering kali ditemukan diberbagai data
teks, contohnya pada berita, essai, debat online. Dengan mendeteksi secara otomatis komponen argumen
pada teks, dapat diketahui bahwa sebuah teks tersebut mengandung unsur argumen atau tidak, yang itu
berguna untuk pencarian dan pegolahan informasi. Solusi dari permasalahan teks tersebut adalah dengan
membangun sebuah model sistem yaitu naive bayes classifer yang akan mengklasifikasikan komponen
argumen pada teks, yaitu komponen claim atau komponen premise. Claim dan premise tersebut dibutuhkan
untuk pembentukan sebuah argumen. Dengan dibangunnya model classifier, evaluasi yang dilakukan pada
hasil klasifikasi menggunakan preprocessing, lalu ekstraksi fitur lexical dan contextual. Hasil paling optimal
pada penelitian ini adalah penggunaan fitur lexical dan contextual dan tanpa menggunakan laplace
smoothing yang mendapatkan tingkat akurasi 66.84% dan f1 score 79.45%.
Kata kunci : argumen, claim, premise, naive bayes, ekstraksi fitur, lexical, contextual
Abstract
In this era, the development of information is growing very fast including the development of data
especially text data. Text is unstructured natural language data, as time goes by the text data will be
more and more, so it can be used on utilization itself, one of the utilization of data text is how to
determine the components of the argument in the text. The argument itself is often found in various
text data, for example on news, essays, and online debates. By automatically detecting the components
of the argument in the text, then it can be known that the text contains an argument or not, which is
useful for information retrieval and searching information. The solution for this problem is to build a
system model called naive bayes classifier that will classify the components of the argument in the text,
the components are claim or premise. The claim and premise are the component to build an argument
itself. By building the classifier then the classification result will be evaluated by doing preprocessing,
then extracting the lexical and contextual feature. The most optimal results in this study are the use of
lexical and contextual features and without using laplace smoothing which gets an accuracy rate of
66.84% and f1 score 79.45%.
Keywords: argument, claim, premise, naive bayes, feature extraction, lexical, contextual

Full Text:

PDF

Refbacks

  • There are currently no refbacks.