Bagaimanakah kerja OCR? Dijelaskan dengan cara yang mudah dan mudah difahami
Dalam artikel ini, kami menerangkan bagaimana OCR berfungsi. OCR bermaksud "Pengiktirafan Karakter Optik" dan hanya dirujuk dalam bahasa Jerman sebagai pengiktirafan teks. Ini bermakna komputer boleh mengiktiraf teks pada imej yang diimbas menggunakan OCR dan kemudian mengubahnya menjadi dokumen teks mudah.
Inilah cara kerja OCR
Bayangkan anda menerima persembahan kertas daripada rakan sekerja. Anda kini mahu mengeditnya di PC kerana anda tidak suka petikan individu. Jadi imbangkan dan pergi ke program OCR anda. Sekarang perkara berikut berlaku:
- Perisian pertama kali melakukan analisis susun atur yang dipanggil. Untuk melakukan ini, dia melihat susun atur halaman dan memisahkan imej dari teks. Dia juga mencatatkan kedudukan mereka pada halaman. Kemudian bilangan perenggan dikira dan elemen individu seperti nombor halaman disimpan.
- Sekarang datang bahagian yang sukar. Perisian ini melihat blok teks individu dan memecahkannya ke dalam ayat. Ayat-ayat tersebut kemudian dibahagikan kepada kata-kata individu dan kata-kata ke dalam huruf.
- Perisian OCR mengandungi corak huruf dan aksara. Program ini sekarang membandingkan huruf yang diimbas dengan corak-corak ini. Sekiranya mereka sama 99%, algoritma itu memutuskan bahawa ia mungkin mempunyai surat itu. Ia sangat tepat kerana ia dapat membandingkan banyak corak dalam masa yang singkat. Dengan cara ini dia berjaya membezakan antara "8" dan "B".
- Oleh itu, huruf dan aksara diiktiraf secara beransur-ansur. Kemudian mereka digabungkan semula sebagai kata-kata dan meletakkan semula di tempat mereka dalam hukuman itu. Sebaik sahaja perisian selesai, semuanya disimpan dalam dokumen biasa, yang kemudiannya anda boleh edit. Selesai!
Adakah anda ingin menguji pengetahuan perisian anda? Mengambil bahagian dalam kuiz perisian besar kami!