Penginderaan Kompresif Berbasis Sparsity Averaging Reweighted Analysis Untuk Kompresi Sinyal Audio Dan Speech

Rahmawan Ilham Al Fatha, Jangkung Raharjo, Jaspar Hasudungan

Abstract

Data audio di era digital ini sangat umum digunakan baik untuk kebutuhan personal maupun industri. Namun, ukuran data dalam proses transmisi dan penyimpanan adalah bagian yang penting karena masalah ukuran datanya yang sering kali memiliki ukuran yang besar. Kompresi data audio yang efisien menyelesaikan masalah ukuran data untuk kebutuhan penyimpanan dan transmisi ini. Compressed sensing (CS) memperkenalkan teknik akuisisi sinyal yang melampaui efisiensi teori Nyquist pada umumnya dalam pengambilan sampel. Salah satu metode CS adalah sparsity averaging reweighted analysis (SARA) yang diusulkan untuk meningkatkan kinerja dari metode basis pursuit denoise (BPDN). Kemudian, terdapat metode source separation via reweighted analysis (SSRA) diusulkan untuk data sinyal satu dimensi. Metode SSRA tidak melakukan rata-rata basis sparsity seperti yang dilakukan pada metode SARA, sehingga jurnal ini melakukan analisis untuk kinerja SARA yang dimodifikasi mengikuti prinsip SSRA pada sinyal satu dimensi. Jurnal ini menganalisis kinerja SARA pada data sinyal senandung suara dan sinyal musik hasil segmentasi yang terdiri dari reff/chorus dan verse dari musik bergenre jazz dan reggae dengan jenis file wav. Dimana nantinya akan dilakukan pengujian terhadap 4 file audi yaitu jazz.wav dan reggae.wav yang mewakili data music, kemudian ep2.wav dan ep3.wav untuk jenis file senandung suara. SARA terdiri dari 2 tahap, yaitu tahap awal untuk penentuan basis sparsity dengan mengusulkan basis baru dari hasil rata-rata dari beberapa basis dan proses reweighted dari metode rekonstruksi BPDN. Hasil data audio yang paling bagus diperoleh file audio Jazz dengan nilai Signal to Noise Ratio (SNR) sebesar 56.75 dB, nilai Object Different Grade ODG yang dihasilkan sebesar -1.643 dan nilai Structural Similary Index Measure (SSIM) sebesar 0.9997. Sedangkan, performansi data speech terbaik diperoleh file Ep2 dengan nilai SNR sebesar 45.10 dB, nilai ODG sebesar -3.948 dan SSIM sebesar 0.9981. Keywords: Compressed sensing , sparsity averaging, reweighted analysis, basis pursuit denoise , spread spectrum, wavelet

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0