Argumentation Mining Menggunakan Ekstraksi Lexical Feature Dan Contextual Feature Dengan Metode Naïve Bayes


  • Dievarino Dwisusanto Telkom University
  • Ibnu Asror Telkom University
  • Yanuar Firdaus Arie Wibowo Telkom University


Abstrak Zaman ini perkembangan informasi semakin pesat termasuk perkembangan pada data yaitu data teks. Teks merupakan data berbahasa alami yang tidak terstruktur. Seiring berjalannya waktu data teks semakin banyak, dengan itu maka dilakukan pemanfaatan pada data teks , salah satu nya pemanfaatan untuk menentukan komponen argumen pada teks. Argumen sendiri sering kali ditemukan diberbagai data teks, contohnya pada berita, essai, debat online. Dengan mendeteksi secara otomatis komponen argumen pada teks, dapat diketahui bahwa sebuah teks tersebut mengandung unsur argumen atau tidak, yang itu berguna untuk pencarian dan pegolahan informasi. Solusi dari permasalahan teks tersebut adalah dengan membangun sebuah model sistem yaitu naive bayes classifer yang akan mengklasifikasikan komponen argumen pada teks, yaitu komponen claim atau komponen premise. Claim dan premise tersebut dibutuhkan untuk pembentukan sebuah argumen. Dengan dibangunnya model classifier, evaluasi yang dilakukan pada hasil klasifikasi menggunakan preprocessing, lalu ekstraksi fitur lexical dan contextual. Hasil paling optimal pada penelitian ini adalah penggunaan fitur lexical dan contextual dan tanpa menggunakan laplace smoothing yang mendapatkan tingkat akurasi 66.84% dan f1 score 79.45%. Kata kunci : argumen, claim, premise, naive bayes, ekstraksi fitur, lexical, contextual Abstract In this era, the development of information is growing very fast including the development of data especially text data. Text is unstructured natural language data, as time goes by the text data will be more and more, so it can be used on utilization itself, one of the utilization of data text is how to determine the components of the argument in the text. The argument itself is often found in various text data, for example on news, essays, and online debates. By automatically detecting the components of the argument in the text, then it can be known that the text contains an argument or not, which is useful for information retrieval and searching information. The solution for this problem is to build a system model called naive bayes classifier that will classify the components of the argument in the text, the components are claim or premise. The claim and premise are the component to build an argument itself. By building the classifier then the classification result will be evaluated by doing preprocessing, then extracting the lexical and contextual feature. The most optimal results in this study are the use of lexical and contextual features and without using laplace smoothing which gets an accuracy rate of 66.84% and f1 score 79.45%. Keywords: argument, claim, premise, naive bayes, feature extraction, lexical, contextual






Program Studi S1 Informatika