Deteksi Suara Manusia Dalam Keadaan Emosi Dengan Menggunakan Linear Predictive Coding (lpc) Dengan Klasifikasi Coarse To Fine Search (cfs) Berbasis Pengolahan Data

Authors

  • Isnaeny Rahmawanthi Telkom University
  • Jangkung Raharjo Telkom University
  • Angga Rusdinar Telkom University

Abstract

Abstrak Informasi paralinguistik mengacu kepada pesan tersirat yang terkandung di dalam ucapan, seperti emosi dari pengucap. Emosi yang akan diidentifikasi pada penelitian ini adalah senang, sedih, marah, jijik, dan netral. Emosi tersebut biasa disebut archetypal emosi. Sinyal suara direpresentasikan dengan beberapa ciri, yaitu: fitur Linear Predictive Coding (LPC), turunan orde pertama koefisien spektral, fundamental frekuensi, dan energi. Performa dari sistem akan diukur berdasarkan akurasi dalam ketepatan deteksi emosi. Dalam tugas akhir ini melalui analisis frekuensi suara manusia tersebut, dapat diteliti suara seseorang termasuk level normal, berisiko atau tinggi. Metode klasifikasi yang digunakan adalah metode Coarse-to-Fine Search (CFS). Pemilihan metode tersebut ditujukan untuk membagi data suara manusia menjadi beberapa kelas berdasarkan polanya dan mengklasifikasikannya. Tujuan dari penelitian ini adalah untuk mendeteksi suara emosi manusia melihat dari parameter yang dicari akurasi dan optimasi yang terbaik pada sistem. Hasil pengujian menunjukkan bahwa akurasi tertinggi yang didapatkan adalah 75% dengan menggunakan 6 feature LPC yaitu, mean, standar deviasi, skewness, variance, kurtosis, dan entropy dari 36 data latih dan 8 data uji. Parameter terbaik yang didapatkan adalah 13 panjang matriks maksimum pada klasifikasi dengan 20 fungsi kendala dan 5 jumlah individu dengan perulangan N+1, di mana N merupakan jumlah perulangan yang telah ditetapkan pada sistem untuk mengetahui titik konvergen. Kata Kunci: Linear Predictive Coding (LPC), Coarse-to-Fine Search (CFS), Emosi. Abstract Paralinguistic information refers to the implied message contained in speech, like the emotion of the speaker. Emotions that will be identified in this study are happy, sad, angry, disgusted, and neutral. Emotions are usually called archetypal emotions. Sound signals are represented by several characteristics, namely: the Linear Predictive Coding (LPC) feature, the first-order derivative of the spectral coefficient, fundamental frequency, and energy. The performance of the system will be measured based on accuracy in the accuracy of emotional detection. In this final project, through the analysis of human voice frequency, a person's voice can be examined, including normal, risky or high levels. The classification method used is the Coarse-to-Fine Search (CFS) method. The choice of the method is intended to divide human voice data into several classes based on their patterns and classify them. The purpose of this study was to detect the sound of human emotions seeing from the parameters sought the best accuracy and optimization on the system. The test results showed that the highest accuracy obtained was 75\% using 6 LPC features, namely, mean, standard deviation, skewness, variance, kurtosis, and entropy from 36 training data and 8 test data. The best parameters obtained are 13 maximum matrix lengths in classification with 20 constraint functions and 5 number of individuals with loop N + 1, where N is the number of repetitions that have been set in the system to find out the convergent point. Keyword: Linear Predictive Coding (LPC), Coarse-to-Fine Search (CFS), Emotion.

Downloads

Published

2019-04-01

Issue

Section

Program Studi S1 Teknik Telekomunikasi