Apa Itu OCR? Berikut Pengertian, Manfaat dan Cara Kerjanya

3 min read

apa itu ocr

Perkembangan teknologi yang pesat memungkinkan manusia untuk melakukan berbagai macam tugas dengan mudah, termasuk mengubah dokumen tertulis menjadi teks komputer. OCR adalah salah satu solusi yang sebenarnya sudah lama ada untuk mengatasi hal ini. Lantas, apa itu OCR?

Apa itu OCR?

Seperti yang sudah kamu baca sebelumnya, OCR yang merupakan singkatan dari Optical Character Recognition adalah teknologi untuk memindai (scan) dokumen tertulis yang awalnya berbentuk hardcopy menjadi softcopy.

Mungkin selama ini kamu sudah pernah melihat kegunaan teknologi pindai ini, namun tidak pernah benar-benar menyadarinya.

Salah satu contohnya adalah ketika kamu mendaftar sebuah aplikasi yang membutuhkan foto KTP, sebut saja aplikasi pinjol (pinjaman online).

Nah, setelah aplikasi pinjol tersebut menerima foto KTP-mu, ia dapat langsung mengisi data pribadimu tanpa harus mengetik lagi. Ini adalah salah satu dari sekian manfaat OCR yang selalu berkembang setiap waktunya.

Awalnya untuk Membantu Orang Tunanetra

Sebelum membahas mengenai apa saja manfaat OCR itu, kamu mungkin tertarik dengan bagaimana sebenarnya teknologi ini berkembang.

Bentuk paling awal dari optical character recognition dapat ditelisik pada tahun 1914. Sebuah alat buatan Emanuel Goldberg memiliki kemampuan untuk membantu tunanetra dengan cara menerjemahkan dokumen tertulis menjadi kode morse.

Setelah mengalami perkembangan yang tidak singkat, program ini dapat mentransfer dokumen tertulis menjadi data digital menggunakan bantuan sensor cahaya. Yang lebih canggihnya lagi, saat ini software kecerdasan buatan atau AI juga dapat menjadi alat OCR.

Makanya foto kartu KTP yang kamu unggah di aplikasi pinjol dapat terbaca tanpa perlu menggunakan alat tambahan lainnya.

Manfaat OCR

Setelah paham apa itu OCR dan sejarah singkatnya, tentu saja teknologi ini tercipta bukan tanpa alasan.

Saat awal penemuannya, OCR adalah alat untuk membantu kaum tunanetra yang terasa makin relevan pada zaman serba digital ini. Selain itu, kamu juga tahu manfaat praktisnya yakni untuk keperluan pengisian data.

Namun dari lingkup yang lebih besar, program dapat membantu perusahaan untuk mengubah dokumen tertulis mereka menjadi softcopy. Dokumen yang sudah menjadi softcopy memudahkan perusahaan untuk mencari dan menyunting dokumen tertentu jika memang diperlukan.

Selain itu, akses dokumen berbentuk softcopy juga jadi lebih mudah berkat adanya internet maupun jaringan area lokal atau LAN. Softcopy juga tentu saja dapat menghemat tempat sehingga perusahaan tidak perlu mengalokasikan kantor mereka untuk gudang.

Tidak hanya menghemat tempat, dokumen yang sudah menjadi softcopy tentu akan aman dari berbagai gangguan fisik seperti hilang, terbakar, terendam air, dan lain sebagainya.

Di lingkungan bandara, OCR dapat membantu petugas untuk menginput data paspor. Dari segi lalu lintas, kamera pengawas lalu lintas yang memiliki fitur optical character recognition dapat mengidentifikasi nomor plat kendaraan secara instan.

Dengan teknologi ini, petugas polisi tidak perlu membaca satu persatu plat yang ada jika misalnya melakukan pencarian kendaraan curian.

Meski memiliki beragam manfaat, tetapi masih banyak keterbatasan yang membuat teknologi ini masih mengalami inovasi sampai sekarang.

Bagaimana Cara Kerjanya?

Untuk mengetahui kenapa teknologi pindai ini masih memiliki sejumlah kekurangan, kamu harus paham bagaimana cara kerja OCR terlebih dulu.

OCR memiliki dua komponen, yakni hardware dan software. Pertama-tama, pengguna alat ini mengarahkan hardware (biasanya menyerupai pulpen) pada dokumen tertulis seperti menggunakan highlighter atau stabilo. Dengan gestur ini, sensor cahaya pada hardware dapat memindai apa yang ada di depannya.

Selanjutnya, informasi yang diterima oleh hardware akan diubah menjadi data digital oleh software OCR, bahkan bisa sampai menyesuaikan ukuran tulisan dan formatnya.

Namun perkembangan teknologi memungkinkan program dapat membaca data hanya menggunakan foto. Lantas, apa cara kerja OCR itu jadi berbeda? Tentu saja berbeda.

Jika menggunakan foto sebagai sumber data, alat pindai ini harus melakukan beberapa penyesuaian gambar yang tidak sedikit tahap-tahapnya.

Tahap pertama adalah memastikan gambar yang diambil rata. Jika masih belum masuk kriteria, program akan mengubah kemiringan gambar. Proses ini memiliki sebutan deskewing.

Berbeda dengan deskewing, rotation juga bertujuan untuk membuat gambar menjadi lurus. Hanya saja, rotation memutar gambar secara dua dimensi, sedangkan deskewing secara tiga dimensi.

Beberapa program juga dapat menyesuaikan pencahayaan foto demi memudahkan pemindaian, apalagi jika foto yang diterima OCR terlalu gelap. Program ini akan meninggikan kecerahaannya secara otomatis.

Setelah penyesuaian foto, program memisahkan gambar dengan kata-kata yang akan ia pindai. Akhirnya, data digital pun terbentuk.

Terlepas dari cara kerjanya yang sudah banyak penyesuaian, program ini memiliki keterbatasan dalam segi keakuratan. Hal yang menjadi salah satu masalah OCR itu adalah sulit untuk membedakan karakter yang mirip. Sebagai contoh, huruf “i”, “l”, dan angka “1”.

Alhasil, tidak jarang OCR mengalami typo yang ujung-ujungnya membuat pengguna harus memeriksa ulang data-data hasil pindaian untuk meminimalisir kesalahan.

Seringkali orang-orang yang menggunakan teknologi justru merasa lebih kelimpungan karena harus memeriksa dokumen yang tidak sedikit jumlahnya.

Solusi untuk kendala ini adalah dengan menerapkan software tambahan yang bernama IDP.

Apa itu IDP?

IDP yang mungkin sering kamu dengar adalah sebuah lembaga pendidikan yang bekerja sama dengan Australia dan Selandia Baru. Namun dalam kasus ini, IDP memiliki arti yang berbeda. Setelah paham apa itu OCR, kamu juga harus paham cara kerja IDP.

IDP adalah singkatan dari Intelligent Document Processing, yakni sebuah software yang bertujuan untuk meningkatkan keakuratan OCR.

Software ini memanfaatkan salah satu bentuk kecerdasan buatan (AI), yakni machine learning. Dengan menggunakan machine learning, IDP dapat mempelajari dokumen-dokumen yang pernah ia pindai sebelumnya.

Tidak hanya mempelajari dokumen, IDP juga dapat menerima database yang telah dipelajari oleh software lain sebelumnya. IDP lalu menggunakan “ilmu” yang mereka simpan untuk bisa menebak jenis dokumen apa yang mereka baca. 

Sebagai contoh, OCR mungkin membaca dokumen yang dominan dengan kata-kata, tetapi juga membaca angka yang ada di tengah satu kata. Setelah mendapatkan hasil pemindaian berupa data digital, IDP memperbaiki masalah tersebut dengan susunan kata yang paling mendekati.

Hal yang sama juga IDP terapkan dengan data yang dominan angka namun ada huruf yang tersisip di dalamnya. Tidak hanya itu, IDP juga dapat memperbaiki typo. Semuanya dapat tercapai dengan prinsip IDP yang selalu beradaptasi ketika ada data baru yang ia terima.

Meski begitu, IDP bukan semata-mata program ajaib yang dapat menjawab segala kebutuhan kamu. Layaknya seorang pegawai dengan spesialisasi masing-masing, IDP adalah sebuah program dengan prinsip serupa.

IDP yang sering jadi permintaan untuk pembacaan data KTP karena memang proses pemindaian ini cukup penting berbagai aplikasi ponsel.

Tertarik untuk Mencoba OCR?

Berbagai pihak sudah merasakan manfaat OCR, terutama untuk bidang administrasi data. Di zaman yang serba pintar ini, sudah semestinya kamu juga menerapkan teknologi ini di berbagai kesempatan.

Semoga dengan membaca artikel ini kamu sudah tahu apa itu OCR dan cara kerja program ini.


Temukan berbagai informasi seputar keuangan dan teknologi hanya di Finfini.