Speech To Text Menggunakan Metode Hidden Markov Model

Authors

  • Muhammad Fariz Taswarul Afkar Telkom University
  • Budhi Irawan Telkom University
  • Surya Michrandi Nasution Telkom University

Abstract

Aplikasi Speech to Text (STT) ini menggunakan metode Hidden Markov Models (HMM) Hybird dengan Gaussian Mixture Model (GMM). Tahap awal dari Hidden Markov Models adalah ketika ada suara, maka suara tersebut akan dikenali sebagai Speech Signal. Kemudian menggunakan Feature extraction yaitu Mel-frequency cepstral coefficients (MFCC) signal tersebut disimpan ke dalam frame-frame dan dicari nilai koefisien cepstralnya. Selanjutnya tiap vector di kuantisasi yang menghasilkan output simbol observasi (codebook). Setiap kata yang tidak dikenal maka akan dimodelkan dengan HMM/GMM sehingga mendapatkan model kata. Untuk proses pengenalan kata maka akan dihitung probabilitas kemiripan pola dari tiap model HMM/GMM yang dimiliki dengan hasil dari observasi. Hasil probabilitas paling maksimum kemudian ditetapkan sebagai kata yang di kenali. Pengujian ini dilakukan dengan mengubah nilai feature MFCC dan nilai mixture GMM. Performansi sistem diukur berdasarkan akurasi yang didapat dari parameter WER(Word Error Rate). Setelah dilakukan pengujian terhadap sistem dengan beberapa skenario, diperoleh akurasi terbaik 100% dalam mengenali 10 kata. Akurasi ini deperoleh dari hasil pengujian dengan MFCC 13 Feature dan GMM 6 mixture. Kata kunci : Speech to Text, Hidden Markov Model, Mel-frequency cepstral coefficient, Gaussian Mixture Model

Downloads

Published

2019-08-01

Issue

Section

Program Studi S1 Teknik Komputer