Mengenal Teknologi OCR AI
Kehadiran teknologi artificial intelligence atau yang biasa disebut AI telah meningkatkan kapabilitas teknologi optical character recognition (OCR). Teknologi OCR merupakan teknologi yang memiliki kapabilitas untuk memproses gambar dari sebuah teks dan mengubah teks tersebut sehingga dapat dibaca oleh komputer atau mesin. Teknologi OCR memungkinkan pengubahan dokumen fisik menjadi dokumen digital secara instan. Perkembangan terbaru dengan teknologi AI telah memperkuat kegunaan teknologi OCR berkat akurasi yang lebih tinggi dan kecepatan yang lebih tinggi. Dengan teknologi AI, hasil teknologi OCR yang dulunya perlu pengawasan manusia kini tidak diperlukan lagi.
Sebelum adanya teknologi OCR mengubah dokumen fisik menjadi digital merupakan upaya manual yang mengabiskan banyak waktu. Seseorang harus mengetik ulang setiap dokumen secara manual. Kini dengan teknologi OCR, konversi menjadi lebih cepat dengan ketepatan yang lebih besar. Setelah OCR mengubah Salinan cetak menjadi digital, pengguna dapat mengedit format dan dengan mudah mencari dokumen tersebut. Kini ditambah dengan teknologi AI dan Machine Learning, konversi teks menjadi lebih akurat dengan pemeriksaan kesalahan yang mungkin terjadi selama proses konversi. AI juga dapat menafsirkan tulisan tangan dengan lebih baik, membuka peluang untuk mendigitalkan lebih banyak dokumen. Adapun berbagai jenis dokumen yang dapat dikonversi oleh teknologi OCR AI antara lain ID card, buku bank, invoice, form aplikasi, dokumen claim asuransi, dan sebagainya.
Bagaimana cara kerja teknologi AI OCR?
Sistem OCR AI merupakan kombinasi perangkat keras dan lunak. Tujuan sistem ini adalah mengkonversi teks dokumen fisik dan menerjemahkan karakter di dalam dokumen tersebut menjadi kode yang kemudian digunakan untuk pemrosesan data. Hal ini dilakukan dalam tiga tahapan yaitu:
- Image Pre-processing – perangkat keras yang biasanya merupakan optical scanner akan memproses dokumen fisik menjadi bentuk gambar. Tujuan dari langkah ini adalah agar mesin akurat dalam rendisinya, tetapi juga untuk menghilangkan distorsi yang tidak diinginkan. Gambar kemudian diubah menjadi versi hitam putih yang kemudian dianalisis untuk area terang (latar belakang) versus area gelap (karakter). Sistem OCR juga dapat mengkategorikan gambar menjadi elemen terpisah jika diperlukan seperti tabel, teks, atau gambar inset.
- Intelligent Character Recognition – Teknologi AI akan menganalisis area gelap gambar untuk mengidentifikasi huruf dan angka. Biasanya, AI menargetkan satu karakter, kata atau blok teks sekaligus menggunakan metode yang disebut pattern recognition dan feature extraction. Setelah mesin mengidentifikasi karakter, mereka diubah kedalam bentuk ASCII yang dapat digunakan untuk manipulasi lebih lanjut.
- Post-processing – Tahap terakhir AI akan memperbaiki error yang terdapat pada hasil. Salah satu metode yang digunakan adalah melatih AI pada untuk menemukan leksikon kata-kata tertentu. Batasi AI pada kata atau format tersebut untuk memastikan tidak ada interpretasi yang berada di luar leksikon.
Sumber: