Implementasi Voice Recognition Menggunakan Metode Mel-Frequency Ceptral Coefficients dan Convolutional Neural Network Pada Smart Dorm Key Telkom University
Abstract
Keamanan asrama di Telkom University saat ini masih mengandalkan sistem konvensional seperti kunci manual dan logbook, yang dinilai kurang memadai, rentan, dan kurang aman. Keterbatasan ini memungkinkan akses yang tidak sah dan meningkatkan risiko kehilangan barang berharga mahasiswa. Untuk mengatasi permasalahan tersebut, dirancanglah sebuah "Smart Dorm Key" berbasis pengenalan suara (voice recognition) menggunakan machine learning dengan metode Mel-Frequency Cepstral Coefficients (MFCC) untuk pemrosesan ekstraksi suara dan menggunakan model Convolutional Neural Networks (CNN) untuk pengenalan suara. Pengujian sistem dilakukan dengan melibatkan Hazbi berjumlah 475 dataset, Ito 712 dataset, Faiq 477 dataset, dan Unknown 988 dataset. Terdapat tiga macam kondisi pengujian yaitu dalam keadaan normal, berisik, dan serak. Hasil pengujian menunjukkan bahwa sistem ini dapat mengenali suara dengan akurasi dalam keadaan normal 91% untuk dataset suara terdaftar dan 88% untuk dataset suara tidak terdaftar, namun dalam keadaan berisik dan serak akurasi berkurang menjadi 68% (terdaftar) dan 62% (tidak terdaftar) untuk keadaan berisik, 73% (terdaftar) dan 66% (tidak terdaftar) dalam keadaan serak.
Kata kunci— CNN, Keamanan Asrama, MFCC, Smart Dorm Key, Voice Recognition.
References
Telkom University, “Asrama.” Diakses: 11 Juli 2025. [Daring]. Tersedia pada: https://telkomuniversity.ac.id/asrama/
R. Arunashmi, S. S. Gouda, dan K. Agrawal, “Speech Recognition Using MFCC & CNN,” International Journal of Scientific Research and Engineering Development, vol. 4.
F. D. Adhinata, D. P. Rakhmadani, and A. J. T. Segara, "Pengenalan Jenis Kelamin Manusia Berbasis Suara Menggunakan MFCC dan GMM," Jurnal Dinda, vol. 1, no. 1, pp. 1-6, 2021.
Y. LeCun, Y. Bengio, dan G. Hinton, “Deep Learning,” Nature, vol. 521, hlm. 436–444, Mei 2015, doi: 10.1038/nature14539.
S. Swaminathan dan B. R. Tantri, “Confusion Matrix-Based Performance Evaluation Metrics,” African Journal of Biomedical Research, vol. 27, hlm. 4023–4031, Nov 2024, doi: 10.53555/AJBR.v27i4S.4345.
D. A. Pramudhita, F. Azzahra, I. K. Arfat, R. Magdalena, dan S. Saidah, “Strawberry Plant Diseases Classification Using CNN Based on MobileNetV3-Large and EfficientNet-B0 Architecture,” Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, vol. 9, no. 3, hlm. 522–534, Jul 2023, doi: 10.26555/jiteki.v9i3.26341.
D. Nagajyothi and P. Siddaiah, "Speech Recognition Using Convolutional Neural Networks," International Journal of Engineering & Technology, vol. 7, no. 4.6, pp. 133-137, 2018.
V. H. Phung and E. J. Rhee, "A High-Accuracy Model Average Ensemble of Convolutional Neural Networks for Classification of Cloud Image Patches on Small Datasets," Appl. Sci., vol. 9, no. 21, p. 4500, Oct. 2019.
I. T. Nugraha, R. Patmasari, and A. I. Irawan, "Implementasi Membuka Kunci Pintu Otomatis Menggunakan Face Recognition pada Raspberry Pi Berbasis Internet of Thing," e-Proceeding of Engineering, vol. 7, no. 1, pp. 707-715, Apr. 2020.
M. I. Yoren, R. Purnamasari, and E. Suhartono, "Penerapan Metode Histogram Oriented Of Gradients Dan Haar-Cascad Pada Pintu Asrama Pintar Telkom University," e-Proceeding of Engineering, vol. 11, no. 6, pp. 6487-6489, Dec. 2024.
A. Y. Nasirudin, S. A. Wibowo, and R. Purnamasari, "Performance Analysis on Fine-tuned Region-based CNN for Object Recognition," in Symposium of Future Telecommunication and Technologies (SOFTT), no. 2, Dec. 2018.



