Analisis Performansi Sistem Optical Character Recognition (ocr) Pada Dokumen Digital Menggunakan Metode Tesseract

Amalia Nur Rahmawati, Suryo Adhi Wibowo, Unang Sunarya

Abstract

Pada era modern ini, kemampuan teknologi sudah semakin mutakhir. Hampir semua yang dilakukan manusia saat ini menggunakan digital. Optical Character Recognition (OCR) merupakan salah satu teknologi yang digunakan untuk mendeteksi karakter pada suatu gambar menjadi bentuk teks yang dapat dibaca oleh mesin komputer. Penelitian OCR sebelumnya meneliti segmentasi dan penerjemah dokumen menggunakan Tesseract OCR. Metode yang akan digunakan dalam penelitian ini adalah dengan metode Tesseract pada dokumen digital karena cocok untuk digunakan pada sistem OCR untuk deteksi karakter pada suatu objek. Sistem dirancang menggunakan Python. Pengujian dilakukan pada 10 foto dokumen digital. Konfigurasi sistem uji yang digunakan untuk pengujian adalah konfigurasi sistem terbaik berdasarkan parameter performansi yang digunakan yaitu parameter jarak, rotasi, dan opacity. Parameter performansi yang terbaik didapatkan pada jarak 30 cm pada kondisi di luar ruangan sebesar 85,1%, kemudian performansi terbaik rotasi sebesar 85,1%, dan performansi opacity terbaik didapatkan pada jarak 30 cm dengan kondisi di dalam ruangan sebesar 84,5%. Kata kunci : Tesseract, OCR, digital document, image processing

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0