Klasifikasi Sentiment Analysis pada Review Buku Novel Berbahasa Inggris dengan Menggunakan Metode Support Vector Machine (SVM)

Authors

  • Chandra Gilang Kencana Telkom University
  • Yuliant Sibaroni Telkom University

Abstract

Abstrak Bukunovel merupakan suatu karya sastra berbentuk prosa naratif yang panjang, yang memiliki rangkaian cerita tentang kehidupan seorang tokoh dan orang-orang di sekitarnya dengan menonjolkan sifat dan watak dari setiap tokoh pada novel tersebut. Dengan banyaknya review yang muncul dari pendapat pembaca, maka semakin sulit untuk menemukan review yang sesuai dengan pilihan konsumen. Ini yang menjadi suatu permasalahan yang dimana, konsumen tidak selalu menerima review dari pembaca. Untuk memecahkan permasalahan tersebut, diperlukan sebuah metode yang dapat memudahkan untuk menganalisis terkait dengan review tersebut. Maka dari itu, solusi yang akan dilakukan yaitu dengan menerapkan klasifikasi sentiment analysis. Sentiment analysis merupakan penambangan kontekstual data berupa teks, yang bertujuan untuk menganalisa berbagai pendapat atau opini berupa isu, komentar, dan lain-lain terhadap suatu objek atau permasalahan oleh seseorang yang dimana nilai tersebut akan memiliki nilai positif atau negatif. Penelitian ini, memiliki beberapa tujuan yaitu, untuk mengetahui performansi pada sistem klasifikasi Support Vector Machine (SVM) yang dibangun. Kedua, untuk mengetahui performansi pada pembobotan fitur Term Frequency-Inverse Document Frequency (TF-IDF) dan seleksi fitur Chi Square. Ketiga, Untuk mengetahui performansi pada pembobotan fitur Term Frequency (TF) dan seleksi fitur Chi Square. Dari hasil eksperimen, diperoleh bahwa hasil perfomansi terbaik untuk klasifikasi sentiment analysis pada review buku novel berbahasa Inggris, yaitu pada penggunaan kernel Gaussian RBF untuk setiap kedua pembobotan fitur dengan seleksi fitur yang digunakan dengan nilai performansi sebesar 74.2%. Kata kunci: Support Vector Machine (SVM), Sentiment Analysis, review, Term Frequency-Inverse Document Frequency (TF-IDF), Term Frequency (TF), Chi Square Abstract The novel book is a literary work in the form of a long narrative prose, which has a series of stories about the life of a character and people around him by highlighting the nature and character of each character in the novel. With so many reviews that arise from the opinions of readers, it is increasingly difficult to find reviews that are in accordance with consumer choice. This is a problem in which, consumers do not always receive reviews from readers. To solve this problem, we need a method that can make it easy to analyze related to the review. Therefore, the solution that will be carried out is by applying a sentiment analysis classification. Sentiment analysis is a contextual mining of data in the form of text, which aims to analyze various opinions or opinions in the form of issues, comments, etc. on an object or problem by someone whose value will have a positive or negative value. This study, has several objectives, namely, to determine the performance of the Support Vector Machine (SVM) classification system that was built. Second, to find out the performance in weighting the Term Frequency-Inverse Document Frequency (TF-IDF) feature and Chi Square feature selection. Third, to determine the performance of the Term Frequency (TF) weighting and Chi Square feature selection. From the experimental results, it was found that the best performance results for the classification of sentiment analysis in the review of English-language novel books, namely the use of Gaussian RBF kernels for each of the two weighting features with feature selection used with a performance value of 74.2%. Keywords: Support Vector Machine (SVM), Sentiment Analysis, review, Term Frequency-Inverse Document Frequency (TF-IDF), Term Frequency (TF), Chi Square

Downloads

Published

2019-12-01

Issue

Section

Program Studi S1 Informatika