Implementasi Pengenalan Tulisan Cetak Menggunakan Tesseract Dan Komunikasi Jaringan Menggunakan Python

Authors

  • Muhammad Rizkiyanda Telkom University
  • Wahmisari Priharti Telkom University
  • Iswahyudi Hidayat Telkom University

Abstract

Dokumen cetak masih digunakan di banyak industri untuk menyimpan informasi penting dalam satu format: faktur, kwitansi, dan dokumen cetak lainnya. Ini menjadi masalah ketika formulir informasi digital diperlukan dari dokumen cetak. Oleh karena itu diperlukan suatu sistem yang dapat mengubah gambar dokumen untuk dicetak menjadi string, sehingga tidak perlu memasukkan data secara manual ke dalam komputer. Saat ini, salah satu teknologi yang mengenali huruf dalam gambar adalah Optical Character Recognition (OCR) yang terdapat di dalamnya. diprogram untuk melakukan segmentasi, ekstraksi fitur, klasifikasi, pelatihan, dan pengenalan. Namun, akurasi Tesseract bergantung pada kualitas gambar, noise, dan ukuran font, sehingga diperlukan pemrosesan gambar tambahan. Oleh karena itu, alat pemindaian portabel untuk dokumen cetak dikembangkan dalam penelitian ini Menggunakan OCR Tesseract dengan langkah-langkah pemrosesan gambar: Grayscale, Unsharp Mask, Threshold, dan ekstensi dengan pustaka menggunakan komunikasi jaringan menggunaka python. Arial, fake receipt dan calibri dengan ukuran 11, 12 dan 14 memberikan tingkat akurasi rata -rata sebesar 93.33%.

Kata kunci— Optical Characther Recognition, Tesseract, Pemindaian Portbel, Pemprosesan gambar, Komunikasi Jaringan menggunakan python, paramiko.

References

Mobile Operating System Market Share Worldwide

- April 2019. 2019. Statcounter. Retrieved from

http://gs.statcounter.com/os-marketshare/mobile/worldwide

Kayethri D, Dharunya R, Harini M,

DETECTION USING DEEP LEARNING

TECHNIQUES= Computer Science & Engineering:

An International Journal (CSEIJ), Vol 12, No 6,

December 2022 DOI:10.5121/cseij.2022.12614 145

A. Chaudhuri, K. Mandaviya, P. Badelia, and S. K.

Ghosh,

Studies in Fuzziness and Soft Computing, vol. 352,

Springer Verlag, 2017, pp. 9-41. doi: 10.1007/978-

- 319-50252-6 2.

Ariefsyahnakri

DOKUMEN CETAK PORTABEL

MENGGUNAKAN TESSERACT DAN

OPENCV= Diterima pada 20 Februari 2022;

diterbitkan pada 31 Desember 2022.

Ali Firdaus, M. Syamsu Kurnia, Tia Shafera, Wahyu

Istalama Firdaus.

Recognition (OCR) Pada Masa Pandemi Covid-19=

J urnal JUPITER, Vol. 13, No. 2, Bulan Oktober,

Tahun 2021 Hal. 188 - 194.

N Venkata Rao and D. Ascssastry,

Character Recognition Technique Algorithms,=

Journal of Theoretical and Applied Information

Technology, vol. 20, no. 2, 2016, [Online].

Available: www.jatit.org

E. H. A. and R. N,

Document Images Through a Novel Pre-Processing

Approach,= Signal & Image Processing: An

International Journal, vol. 6, no. 4, pp. 01-18, Aug.

, doi: 10.5121/sipij.2015.6401.

C. Kanan and G. W. Cottrell,

Does the method matter in image recognition?,=

PLoS ONE, vol. 7, no. 1, Jan. 2012, doi:

1371/journal.pone.0029740.

Gambar 8

Presentase kesalahan pengujian identifikasi pada tulisan cetak

G. Deng,

algorithm,= IEEE Transactions on Image

Processing, vol. 20, no. 5, pp. 1249-1261, May

, doi: 10.1109/TIP.2010.2092441.

J. Yousefi,

Thresholding Algorithm,= 2011, doi:

13140/RG.2.1.4758.9284.

. R. A. Wiryawan and N. R. Rosyid,

Aplikasi Otomatisasi Administrasi Jaringan

Berbasis Website Menggunakan Bahasa

Pemrograman Python,= Simetris J. Tek. Mesin,

Elektro dan Ilmu Komput., vol. 10, no. 2, pp. 741-

, 2019.

Downloads

Published

2024-02-29

Issue

Section

Program Studi S1 Teknik Elektro