Pembobotan Fitur Ekstraksi Pada Peringkasan Teks Bahasa Indonesia Menggunakan Algoritma Genetika

Authors

  • Zulkifli Zulkifli Telkom University
  • Agung Toto Wibowo Telkom University
  • Gia Septiana Telkom University

Abstract

Abstrak— Hal yang penting dari peringkasan teks otomatis adalah bagaimana cara menetukkan informasi penting dari sebuah dokumen. Informasi penting dapat diperoleh dengan menggunakan teknik ekstraksi. Teknik ekstraksi merupakan teknik peringkasan secara lengkap yang terdiri dari urutan- urutan kalimat yang disalin dan memilih bagian-bagian kalimat penting dari dokumen asli. Peringkasan teks otomatis dengan teknik ekstraksi dapat dilakukan dengan menggunakan beberapa fitur ekstraksi teks. Tiap-tiap fitur ekstraksi teks memiliki tingkat pengaruh yang berbeda-beda terhadap hasil ringkasan sistem. Oleh karena itu, dibutuhkanlah sebuah algoritma optimasi untuk menentukkan tingkat kepentingan atau nilai bobot dari tiap-tiap fitur ekstraksi. Salah satu algoritma optimasi yang dapat digunakan adalah algoritma genetika. Dengan dataset yang sama untuk CR 30%, penelitian yang telah dilakukan oleh Aristoteles, Marlina, Rivaldi dan Wibowo menghasilkan maksimal akurasi berturut-turut 47%, 42,8%, 44% dan 52,47%. Pada TA ini, algoritma genetika digunakan untuk melakukan optimasi bobot fitur ekstraksi pada peringkasan teks bahasa Indonesia. Pada tahap pelatihan algoritma genetika mampu melakukan optimasi bobot fitur ekstraksi teks yang menghasilkan akurasi sekitar 46%. Sedangkan pada tahap pengujian, sistem menghasilkan ringkasan dengan akurasi 46% untuk sepuluh fitur teks. Setelah dilakukan observasi model kromosom terbaik, sistem menghasilkan ringkasan dengan akurasi 53% untuk delapan fitur ekstraksi teks.

Kata kunci— peringkasan, teks, otomatis, fitur, ekstraksi teks, algoritma genetika.

Downloads

Published

2015-08-01

Issue

Section

Program Studi S1 Informatika