Sains

Apa itu ocr? »Definisi dan maknanya

Anonim

OCR adalah pengecaman watak optik atau juga dikenali dalam bahasa Sepanyol sebagai pengecaman watak optik. OCR adalah perisian yang memungkinkan pengecaman teks, menghasilkan gambar untuk mengubahnya menjadi berturut-turut watak, dan kemudian menyimpannya dalam format tertentu yang dapat digunakan dalam program penyuntingan teks tersebut. Dengan kata lain, berkat teknologi baru ini, segala jenis teks atau dokumen, termasuk fail PDF, kertas yang diimbas atau bahkan gambar yang diambil dari kamera digital, dapat diubah menjadi data untuk kemungkinan dapat diedit.

Perisian ini berfungsi seperti berikut, pertama menganalisis setiap bahagian gambar dokumen yang dimaksudkan; sebarkan halaman dalam bentuk kepingan seperti jadual, gambar, blok teks antara lain; maka garis-garis diedarkan dalam perkataan untuk kemudian menjadi watak; dan kerana watak-watak telah ditunjukkan, perisian membuat perbandingan dengan sekumpulan gambar corak. Ini berkembang mengikut siri hipotesis mengenai apa yang dimaksudkan oleh setiap watak; dan berdasarkan hipotesis-hipotesis ini, ia menganalisis pelbagai variasi garis pemisah menjadi kata dan kata menjadi watak. Dan setelah sejumlah besar analisis dan pemprosesan hipotesis, program ini akhirnya menyajikan teks yang sudah diakui dan diubah dengan format baru.

Harus diingat bahawa hari ini terdapat sejumlah program yang ditawarkan pasar komputer berdasarkan OCR seperti OmniPage, Abbyy Fine Reader atau READiris. YY yang memiliki kemampuan, tidak hanya menganalisis dan mengenali teks seperti itu, tetapi juga mengenali format dan gaya, tetapi dengan batasan tertentu, sehingga mengharuskan teks tersebut, setelah dianalisis, diedit untuk membuat penyesuaian yang memerlukan.