Deteksi Fake Review Menggunakan Support Vector Machine

Authors

  • Bety Elysabeth Pasaribu Telkom University
  • Anisa Herdiani Telkom University
  • Widi Astuti Telkom University

Abstract

Abstrak
Maraknya berbagai e-commerce menjadikan calon pembeli semakin selektif sehingga bergantung pada
review yang ditinggalkan oleh pembeli sebelumnya untuk menentukan keputusan membeli suatu
produk. Banyaknya review, baik itu yang bersifat positif atau negatif, sangat mempengaruhi sisi mana
yang dapat dipercaya. Jika review yang dibaca tidak nyata atau disebut fake review maka akan
merugikan baik sisi penjual ataupun sisi pembeli. Untuk itu, perlu dilakukan analisis untuk mendeteksi
fake review pada kumpulan review produk. Penelitian ini dilakukan dengan pendekatan lima kelas
feature yaitu sentiment feature, personal feature, brand-only feature, content feature, dan metadata feature
dengan menggunakan metode klasifikasi Support Vector Machine. Pada penelitian ini dibandingkan
antara SentiwordNet dan SenticNet untuk mendapatkan ekstraksi sentiment mana yang lebih baik. Pada
penelitian ini juga dilakukan pemilihan dan penggabungan feature, serta tuning parameter dan jenis
kernel pada SVM apakah akan memengaruhi sistem. Hasil terbaik diperoleh akurasi sebesar 74,46%.
Dari hasil penelitian ini diperoleh bahwa SenticNet lebih baik daripada SentiwordNet, kemudian tuning
parameter serta pemilihan jenis kernel pada SVM bisa mendapatkan hasil yang optimal, serta
penggunaan sentiment feature sangat mempengaruhi sistem untuk deteksi fake review.

Kata kunci: fake reviews, support vector machine, feature, sentiwordnet, senticnet

Abstract
Lot of various e-commerce makes prospective buyers more selective so that it relies on reviews left by
The rise of various e-commerce makes prospective buyers more selective so that it relies on reviews left
by previous buyers to determine the decision to buy a product. The number of reviews, both positive and
negative, greatly influences which side can be trusted. If the review that is read is not real or is called a
fake review, it will harm both of the seller and the buyer side. For this reason, an analysis is needed to
detect fake reviews on a collection of product reviews. This research was approached with a five-class
features named sentiment features, personal features, brand-only features, content feature, and
metadata feature using the Support Vector Machine classification method. This research compares
between SentiwordNet and SenticNet to get which sentiment extraction is better. This research also
carried out to analyze whether the differences in the use of SentiwordNet and SenticNet, the selection
and integration of features, and changes in parameters also choosing kernel in SVM will affect the
system. The best results obtained an accuracy of 74,46%. From the results of this study, it was found
that SenticNet is better than SentiwordNet, then tuning SVM parameters can get optimal results, also
using sentiment feature affect the system for detecting fake review.

Keywords: fake reviews, support vector machine, features, sentiwordnet, senticnet

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Informatika