Klasifikasi Emosi Berdasarkan Sinyal Suara Manusia Menggunakan Metode K-nearest Neighbor

Authors

  • Fajar Dwi Septria Telkom University
  • Jangkung Raharjo Telkom University
  • Nur Ibrahim Telkom University

Abstract

Abstrak Salah satu bentuk interaksi antar manusia adalah dengan berdialog atau berbicara. Biasanya interaksi antar manusia tidak selalu baik dikarenakan pengaruh beberapa faktor seperti berbeda pendapat, harapan tidak sesuai kenyataan atau tidak selalu buruk dikarenakan faktor suasana hati yang sedang baik. Hal-hal tersebut pasti akan sangat mempengaruhi kepada emosi seseorang, emosi tersebut dapat ditentukan melalui sinyal suara. Emosi yang akan diidentifikasi pada penelitian ini adalah bahagia, marah, sedih, dan kaget. Sinyal suara direpresentasikan dengan fitur Linear Predictive Coding (LPC). Performa dari sistem akan diukur berdasarkan akurasi dalam ketepatan deteksi emosi. penggunaan metode klasifikasi yaitu Key-Nearest Neighbor (K-NN) Pemilihan metode ini akan diujikan dengan objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut, beberapa aturan jarak pada K-NN juga mempengaruhi terhadap akurasi sistem pengujian. Hasil pengujian menunjukan bahwa akurasi tertinggi yang didapatkan adalah 92.5% dengan menggunakan 6 feature statistik LPC yaitu mean, variance, standar deviasi, skewness, kurtois, entrophy dan menggunakan Distance Cityblock pada K-NN dari 100 data latih dan 40 data uji. Parameter terbaik yang didapatkan adalah 14 panjang matriks maksimum, 22 window cepstral, dan parameter k adalah 1 (satu). Kata kunci : K-Nearest Neighbor (K-NN), Linear Pedictive Coding (LPC), Emosi. Abstract One form of interaction between humans is by talking or dialogue. The interaction between humans is not always going well because it influenced by several factors such as differing opinions, expectations not in reality or not always bad due to good mood factors. These things will definitely affect a person's emotions, these emotions can be determined through sound signals. The emotions that will be identified in this study are happy, angry, sad, and shocked. Sound signals are represented by the Linear Predictive Coding (LPC) feature. The performance of the system will be measured based on accuracy in the accuracy of emotional detection. This research is proposed using the Key-Nearest Neighbor (K-NN) classification method. The selection of this method will be tested with objects based on learning data that is the closest distance to the object, some rules of distance on K-NN also affect the accuracy of the testing system. The result of the test showed that the highest accuracy obtained was 92.5% using 6 LPC statistical features, which contain mean, variance, standard deviation, skewness, kurtois, entrophy and Distance Cityblock on K-NN from 100 training data and 40 test data. The best parameters obtained are 14 maximum matrix lengths, 22 cepstral windows, and the k parameter is 1 (one). Keywords : K-Nearest Neighbor (K-NN), Linear Pedictive Coding (LPC), Emotion.

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Teknik Telekomunikasi