Sistem Klasifikasi Tangisan Bayi Menggunakan Machine Learning
Abstract
Abstrak— Salah satu permasalahan yang dihadapi oleh orang tua yang baru memiliki anak adalah sulitnya memahami maksud dari tangisan bayi mereka. Pengklasifikasian penyebab tangisan bayi sudah mulai diteliti dari tahun 1960 dengan menggunakan bantuan manusia (suster anak berpengalaman) untuk mengenali ‘sinyal’ penyebab tangisan bayi. Pada sebuah studi tahun 2006 oleh Dunstan, ditemukan pola refleks suara pada bayi yang dapat diartikan kedalam 5 penyebab tangisan, yaitu butuh bersendawa, tidak nyaman, lapar, sakit perut, dan lelah. Teori ini Bernama Dunstan Baby Language (DBL). Dengan berkembangnya teknologi kecerdasan buatan berupa audio classification, hal ini dapat menjadi solusi untuk permasalahan orang tua baru yang belum memahami arti tangisan bayinya. Untuk itu, pada Tugas Akhir ini penulis merancang sebuah simulasi sistem klasifikasi penyebab tangisan bayi menggunakan Machine Learning dengan ekstraksi fitur MFCC (Mel-Frequency Cepstral Coefficients) dan pengklasifikasian ANN (Artificial Neural Network). Pembuatan dan pengujian sistem ini menggunakan sampel suara dari dataset penelitian sebelumnya yang berisi suara-suara tangisan bayi. Dengan model yang telah dibuat menggunakan n_mfcc 40, 1 hidden layer dengan dense 300, dihasilkan akurasi validasi saat training sebesar 65% dan F1 Score saat testing sebesar 49%.
Kata kunci— klasifikasi tangisan bayi, DBL, MFCC, ANN
References
E. V. O. Wasz-Höckert, T. J. Partanen, V. Vuorenkoski, K. Michelsson, “The identification of some specific meanings in infant vocalization. Experientia.,” 1964.
M. D. Renanti, “Identifikasi Arti Tangisan Bayi Versi Dunstan Baby Language Menggunakan Jarak Terpendek Dari Jarak Mahalanobis (Infant Cries Identification of Dunstan Baby Language Version using the Shortest Distance of Mahalanobis),” Jurnal Sains Terapan, vol. 3, no. 1, pp. 27–34, 1970, doi: 10.29244/jstsv.3.1.27-34.
B. K. J. Mukhopadhyay, B. Saha, B. Majumdar, A. K. Majumdar, S. Gorain and A. S. Arya, S. D. Bhattacharya, “An evaluation of human perception for neonatal cry using a database of cry and underlying cause,” 2013 Indian Conference on Medical Informatics and Telemedicine, ICMIT 2013, 2013.
T. Gulzar, A. Singh, and S. Sharma, “Comparative Analysis of LPCC, MFCC and BFCC for the Recognition of Hindi Words using Artificial Neural Networks,” Int J Comput Appl, vol. 101, no. 12, pp. 22–27, 2014, doi: 10.5120/17740-8271.
G. Dede and M. H. Sazli, “Speech recognition with artificial neural networks,” Digital Signal Processing: A Review Journal, vol. 20, no. 3, pp. 763–768, 2010, doi: 10.1016/j.dsp.2009.10.004.
A. H.Mansour, G. Zen Alabdeen Salh, and K. A. Mohammed, “Voice Recognition using Dynamic Time Warping and Mel-Frequency Cepstral Coefficients Algorithms,” Int J Comput Appl, vol. 116, no. 2, pp. 34–41, 2015, doi: 10.5120/20312-2362.
aditya yanuar R, “Artificial Neural Network (ANN) – Universitas Gadjah Mada Menara Ilmu Machine Learning,” Machinelearning.Mipa.Ugm.Ac.Id. p. 5, 2018. [Online]. Available: https://machinelearning.mipa.ugm.ac.id/2018/05/24/artificial-neural-network-ann/
R. H. Prasetiyo, I. I. Tritoasmoro, L. Novamizanti, and F. T. Elektro, “Sistem Identifikasi Arti Tangisan Bayi Menggunakan Metode Mfcc , Dwt Dan Knn Pada Raspberry Pi Identification System of Baby Cry Using Mfcc , Dwt and,” vol. 7, no. 2, pp. 4203–4210, 2020.