Implementasi Deep Neural Network Untuk Perintah Suara Dan Pengenalan Pembicara Pada Smart Home
Abstract
Perkembangan smart home mendorong kebutuhan sistem kendali yang tidak hanya praktis melalui perintah suara, tetapi juga aman melalui identifikasi pembicara. Pada penelitian ini dirancang dan diimplementasikan sistem smart home berbasis Deep Neural Network (DNN) yang menggabungkan modul pengenalan perintah suara dengan modul pengenalan pembicara (speaker recognition). Sistem direalisasikan menggunakan mikrofon sebagai sensor suara yang terhubung ke Raspberry Pi 5 untuk menjalankan proses deep learning, kemudian perintah diteruskan secara nirkabel ke ESP32 untuk mengendalikan relay (quad-channel) sehingga beban listrik (misalnya lampu) dapat dinyalakan atau dimatikan. Metode pengenalan pembicara menggunakan model gabungan CNNSpeaker dan RNN BiLSTM, di mana CNN mengekstraksi pola lokal pada domain waktu–frekuensi dari fitur akustik 105 dimensi (log Mel- spectrogram, MFCC, delta, delta-delta, RMS, dan frekuensi dasar), sedangkan BiLSTM memodelkan dinamika temporal ujaran; mekanisme attention merangkum urutan fitur menjadi embedding 256 dimensi. Hasil pengujian menunjukkan akurasi klasifikasi sekitar 91% pada 900 sampel uji dengan nilai F1-score di atas 87%. Selain itu, pengujian verifikasi dengan threshold sekitar 0,7 menunjukkan hasil pengenalan pembicara yang baik.
Kata kunci: Smart home, voice command, speaker recognition, deep neural network, CNN–BiLSTM
References
M. R. Alam, M. B. I. Reaz, dan M. A. M. Ali, “A review of smart homes - Past, present, and future,” IEEE Transactions on Systems, Man and Cybernetics Part C: Applications and Reviews, vol. 42, no. 6, 2012, doi: 10.1109/TSMCC.2012.2189204.
N. S. Nugroho dan B. A. Pramudita, “Sistem Smart Home dengan Voice Command Untuk Memantau dan Mengaktifkan Peralatan Listrik Rumah.”
A. Iqbal dkk., “Interoperable Internet-of-Things platform for smart home system using Web-of-Objects and cloud,” Sustain Cities Soc, vol. 38, 2018, doi: 10.1016/j.scs.2018.01.044.
T. K. Tran, K. T. Huynh, D. N. Le, M. Arif, dan H. M. Dinh, “A Deep Trash Classification Model on Raspberry Pi 4,” Intelligent Automation and Soft Computing, vol. 35, no. 2, hlm. 2479–2491, 2023, doi: 10.32604/iasc.2023.029078.
S. Yin dkk., “Noisy training for deep neural networks in speech recognition,” EURASIP J Audio Speech Music Process, vol. 2015, no. 1, 2015, doi: 10.1186/s13636-014-0047-0.
N. Saxena dan D. Varshney, “Smart Home Security Solutions using Facial Authentication and Speaker Recognition through Artificial Neural Networks,” International Journal of Cognitive Computing in Engineering, vol. 2, 2021, doi: 10.1016/j.ijcce.2021.10.001. [7]F. M. Talaat, “Explainable Enhanced Recurrent Neural Network for lie detection using voice stress analysis,” Multimed Tools Appl, vol. 83, no. 11, 2024, doi: 10.1007/s11042-023-16769-w.
S. Ilham, A. Muin, dan D. Candro, “System control device electronics smart home using neural networks,” Advances in Science, Technology and Engineering Systems, vol. 2, no. 5, 2017, doi: 10.25046/aj020507.
P. D. Hung, T. M. Giang, L. H. Nam, dan P. M. Duong, “Vietnamese speech command recognition using Recurrent Neural Networks,” International Journal of Advanced Computer Science and Applications, vol. 10, no. 7, 2019, doi: 10.14569/ijacsa.2019.0100728.



