Analisis Sentimen Twitter Bahasa Indonesia Dengan Word2vec
Abstract
Abstrak Sentimen merupakan opini seseorang terhadap suatu topik, produk, atau layanan tertentu. Analisis sentimen digunakan untuk menganalisis opini terhadap suatu topik tertentu apakah cenderung positif atau negatif. Media sosial Twitter digunakan oleh masyarakat Indonesia untuk menuliskan opini mereka dalam bentuk cuitan (tweet). Penelitian ini menjelaskan klasifikasi sentimen pada data Twitter berbahasa Indonesia untuk membantu dalam memahami sentimen pengguna Indonesia terhadap suatu topik yang dibahas di Twitter. Penelitian ini menggunakan metode word2vec untuk mengekstraksi fitur dengan mengkonversi data menjadi nilai vektor. Word2Vec memiliki keunggulan dapat melihat hubungan semantik antar kata. Metode klasifikasi pada penelitian ini menggunakan support vector machine (SVM). Proses klasifikasi sentimen dilakukan dengan mengolah data latih berupa data cuitan yang sudah dikumpulkan yang kemudian menjadi model untuk proses pengujian pada data uji. Dari hasil pengujian, penerapan metode word2vec dan SVM menghasilkan tingkat presisi sebesar 64,4%, recall sebesar 58%, dan f-score sebesar 61,1%
Kata kunci : analisis sentimen, twitter, word2vec, svm
Abstract Sentiment is an opinion of someone on a certain topics, products or services. Sentiment Analysis is used to analyze opinion on a certain topics to decide whether they are positive or negative. Twitter is used by Indonesian to express their opinion in the form of tweets. This study used word2vec method to extract features by converting data into vector score. Word2Vec has the advantage of being able to see semantic relationships between words. This study used support vector machine (SVM) classification method. The sentiment classification process is done by processing training data in the form of collected tweets then turned into model to be tested with testing data. This result of applying word2vec and SVM produce score of precision 64,4%, recall 58%, and f-score 61,1%.
Keywords: sentiment analysis, twitter, word2vec, svm