Recurrent Neural Network Untuk Pengenalan Ucapan Pada Bahasa Sunda Selatan Dialek Garut

Authors

  • Luthfi Abdul Hakim Telkom University
  • Andrew Brian Osmond Telkom University
  • Randy Erfa Saputra Telkom University

Abstract

Abstrak Bahasa adalah alat yang digunakan manusia untuk berkomunikasi. Pada sebuah bahasa memiliki bermacam-macam dialek, salah satunya adalah bahasa sunda. Bahasa sunda ini memiliki 6 dialek, yaitu dialek Barat (bahasa banten), dialek Utara, dialek Selatan (priangan), dialek Tengah Timur, dialek Timur laut (bahasa Cirebon), dialek Tenggara. Dengan kata lain dialek ini juga merupakan pembeda (cirikhas) dalam sebuah bahasa. Bisa dikatakan bahwa dialek memiliki pola yang membedakan antara satu dialek dengan dialek yang lain. Pembedaan pola ini bisa dilakukan dengan menggunakanrecurrent neural network dengan memfokuskan pada pengambilan sampel yang baik, dan penggunaan fungsi utama recurrent neural networkyang membaca data secara sekuensial (sejalan dengan waktu), metode recurrent neural network yang digunakan disini adalah long-short term memory. Pada penelitian ini didapat hasil epoch terbaik adalah 250, minibatch size terbaik adalah 10 dan hidden size terbaik adalah 50, dan akurasi kecocokan antara data uji dan data latih yang di dapat adalah saat diuji dengan bahasa sunda dialek garut sebesar 100%, diuji dengan bahasa sunda yang dialeknya bukan garut sebesar 77,778%, dan untuk orang yang bukan sunda sebesar 66,667%. dari penelitian ini dapat disimpulkan bahwa pengaruh besar nilai epoch, minibatch size, hidden size dan banyak data latih berpengaruh terhadap nilai akhir. Kata kunci : Bahasa sunda, dialek, recurrent neural network, long-short term memory. Abstract Language is a tool that humans use to communicate. In a language has a variety of dialects, one of which is the language of Sundanese. This Sundanese language has 6 dialects, which are Western dialect (banten language), Northern dialect, Southern dialect (Priangan), Middle Eastern dialect, Northeastern dialect (Cirebon language), Southeastern dialect. In other words this dialect is also a differentiator in a language. It can be said that dialect has a pattern that distinguishes between one dialect with another dialect. The differentiation of this pattern can be done using a recurrent neural network by focusing on good sampling, and the use of the main recurrent neural network function that reads data sequentially (over time), the recurrent neural network method used here is long-short term memory. In this research, the best epoch result is 250, the best minibatch size is 10 and the best hidden size is 50, and the accuracy of the match between the test data and the train data can be tested with Sundanese dialect garut 100%, tested with Sundanese language the dialect is not garut of 77.778%, and for people who are not Sundanese 66.667%. from this research can be concluded that the influence of the value of epoch, minibatch size, hidden size and a lot of training data affect the final value. Keywords: language of Sundanese, dialect, recurrent neural network, long-short term memory

Downloads

Published

2018-12-01

Issue

Section

Program Studi S1 Sistem Komputer