Part Of Speech Tagging In Javanese Using Support Vector Machine Method
Abstract
Abstraksi— Part Of Speech (POS) Tagging untuk Bahasa Jawa menggunakan metode Support Vector Machine (SVM). Bahasa Jawa merupakan salah satu Bahasa daerah di Indonesia, terutama di pulau jawa bagian tengah sampai timur. Dalam penerapan metode SVM ini data yang digunakan diambil dari berita online dengan Bahasa Jawa. SVM sudah banyak digunakan untuk melakukan klasifikasi teks, namun untuk kasus POS Tagging masih sedikit dan khusus untuk Bahasa tertentu mungkin belum pernah ada yang menerapakannya. Sehingga kami ingin menerapkan metode SVM untuk kasus POS Tagging Bahasa Jawa. Dalam pengujian model yang sudah kami buat hasil terbaik yang kami dapatkan memiliki akurasi 77% dengan total jumlah label 20.
Keywords—Part of Speech, SVM, tagger, Bahasa Jawa.
Abstrac— Part of Speech (POS) Tagging for Javanese uses the Support Vector Machine (SVM) method. Javanese is one of the regional languages in Indonesia, especially in the central to eastern Java islands. In the application of this SVM method the data used is taken from online news in Javanese. SVM has been widely used to classify text, but in the case of POS Tagging is still small and especially for certain languages may have never been applied. So we want to apply the SVM method for the Java POS Tagging case. In testing the model we have made the best results we get have an accuracy of 77% with a total number of labels of 20. Keywords—Part of Speech, SVM, tagger, Bahasa Jawa.