Speech To Text Menggunakan Metode Hidden Markov Model

Muhammad Fariz Taswarul Afkar; Budhi Irawan; Surya Michrandi Nasution

Authors

Muhammad Fariz Taswarul Afkar Telkom University
Budhi Irawan Telkom University
Surya Michrandi Nasution Telkom University

Abstract

Aplikasi Speech to Text (STT) ini menggunakan metode Hidden Markov Models (HMM) Hybird dengan Gaussian Mixture Model (GMM). Tahap awal dari Hidden Markov Models adalah ketika ada suara, maka suara tersebut akan dikenali sebagai Speech Signal. Kemudian menggunakan Feature extraction yaitu Mel-frequency cepstral coefficients (MFCC) signal tersebut disimpan ke dalam frame-frame dan dicari nilai koefisien cepstralnya. Selanjutnya tiap vector di kuantisasi yang menghasilkan output simbol observasi (codebook). Setiap kata yang tidak dikenal maka akan dimodelkan dengan HMM/GMM sehingga mendapatkan model kata. Untuk proses pengenalan kata maka akan dihitung probabilitas kemiripan pola dari tiap model HMM/GMM yang dimiliki dengan hasil dari observasi. Hasil probabilitas paling maksimum kemudian ditetapkan sebagai kata yang di kenali. Pengujian ini dilakukan dengan mengubah nilai feature MFCC dan nilai mixture GMM. Performansi sistem diukur berdasarkan akurasi yang didapat dari parameter WER(Word Error Rate). Setelah dilakukan pengujian terhadap sistem dengan beberapa skenario, diperoleh akurasi terbaik 100% dalam mengenali 10 kata. Akurasi ini deperoleh dari hasil pengujian dengan MFCC 13 Feature dan GMM 6 mixture. Kata kunci : Speech to Text, Hidden Markov Model, Mel-frequency cepstral coefficient, Gaussian Mixture Model

Speech To Text Menggunakan Metode Hidden Markov Model

Authors

Abstract

Downloads

Published

Issue

Section

Developed By

Language