Implementasi Pengenalan Tulisan Cetak Menggunakan Tesseract Dan Komunikasi Jaringan Menggunakan Python
Abstract
Dokumen cetak masih digunakan di banyak industri untuk menyimpan informasi penting dalam satu format: faktur, kwitansi, dan dokumen cetak lainnya. Ini menjadi masalah ketika formulir informasi digital diperlukan dari dokumen cetak. Oleh karena itu diperlukan suatu sistem yang dapat mengubah gambar dokumen untuk dicetak menjadi string, sehingga tidak perlu memasukkan data secara manual ke dalam komputer. Saat ini, salah satu teknologi yang mengenali huruf dalam gambar adalah Optical Character Recognition (OCR) yang terdapat di dalamnya. diprogram untuk melakukan segmentasi, ekstraksi fitur, klasifikasi, pelatihan, dan pengenalan. Namun, akurasi Tesseract bergantung pada kualitas gambar, noise, dan ukuran font, sehingga diperlukan pemrosesan gambar tambahan. Oleh karena itu, alat pemindaian portabel untuk dokumen cetak dikembangkan dalam penelitian ini Menggunakan OCR Tesseract dengan langkah-langkah pemrosesan gambar: Grayscale, Unsharp Mask, Threshold, dan ekstensi dengan pustaka menggunakan komunikasi jaringan menggunaka python. Arial, fake receipt dan calibri dengan ukuran 11, 12 dan 14 memberikan tingkat akurasi rata -rata sebesar 93.33%.
Kata kunci— Optical Characther Recognition, Tesseract, Pemindaian Portbel, Pemprosesan gambar, Komunikasi Jaringan menggunakan python, paramiko.
References
Mobile Operating System Market Share Worldwide
- April 2019. 2019. Statcounter. Retrieved from
http://gs.statcounter.com/os-marketshare/mobile/worldwide
Kayethri D, Dharunya R, Harini M,
DETECTION USING DEEP LEARNING
TECHNIQUES= Computer Science & Engineering:
An International Journal (CSEIJ), Vol 12, No 6,
December 2022 DOI:10.5121/cseij.2022.12614 145
A. Chaudhuri, K. Mandaviya, P. Badelia, and S. K.
Ghosh,
Studies in Fuzziness and Soft Computing, vol. 352,
Springer Verlag, 2017, pp. 9-41. doi: 10.1007/978-
- 319-50252-6 2.
Ariefsyahnakri
DOKUMEN CETAK PORTABEL
MENGGUNAKAN TESSERACT DAN
OPENCV= Diterima pada 20 Februari 2022;
diterbitkan pada 31 Desember 2022.
Ali Firdaus, M. Syamsu Kurnia, Tia Shafera, Wahyu
Istalama Firdaus.
Recognition (OCR) Pada Masa Pandemi Covid-19=
J urnal JUPITER, Vol. 13, No. 2, Bulan Oktober,
Tahun 2021 Hal. 188 - 194.
N Venkata Rao and D. Ascssastry,
Character Recognition Technique Algorithms,=
Journal of Theoretical and Applied Information
Technology, vol. 20, no. 2, 2016, [Online].
Available: www.jatit.org
E. H. A. and R. N,
Document Images Through a Novel Pre-Processing
Approach,= Signal & Image Processing: An
International Journal, vol. 6, no. 4, pp. 01-18, Aug.
, doi: 10.5121/sipij.2015.6401.
C. Kanan and G. W. Cottrell,
Does the method matter in image recognition?,=
PLoS ONE, vol. 7, no. 1, Jan. 2012, doi:
1371/journal.pone.0029740.
Gambar 8
Presentase kesalahan pengujian identifikasi pada tulisan cetak
algorithm,= IEEE Transactions on Image
Processing, vol. 20, no. 5, pp. 1249-1261, May
, doi: 10.1109/TIP.2010.2092441.
J. Yousefi,
Thresholding Algorithm,= 2011, doi:
13140/RG.2.1.4758.9284.
. R. A. Wiryawan and N. R. Rosyid,
Aplikasi Otomatisasi Administrasi Jaringan
Berbasis Website Menggunakan Bahasa
Pemrograman Python,= Simetris J. Tek. Mesin,
Elektro dan Ilmu Komput., vol. 10, no. 2, pp. 741-
, 2019.