Kako mogu odabrati najbolji softver za OCR?

Softver za optičko prepoznavanje znakova (OCR), softver je dizajniran za prevođenje slika teksta u stvarni tekst koji računalo može pročitati. Općenito se koristi nakon što je slika skenirana u računalo, iako se mogu koristiti i drugi oblici unosa. OCR softver najbolje funkcionira na tekstu koji je već utipkan, bilo u slučajevima kada je izvorni ispis izgubljen, ili u skeniranim listovima ukucanim na pisaćem stroju. Međutim, dobar softver može također moći prevesti rukom pisani tekst, iako je stopa pogreške u ovoj vrsti pretvorbe mnogo veća.

Stvarni izraz OCR softver pomalo je pogrešan, jer većina modernih verzija zapravo ne koristi optičko prepoznavanje znakova, već zapravo koristi digitalno prepoznavanje znakova. To je zato što su se prije nekoliko godina polja učinkovito spojila, a oba su polja usvojila atraktivniji izraz optičko prepoznavanje znakova. OCR softver je mnogo napredovao posljednjih godina, s modernim programima znatno boljim od svojih prethodnika u prepoznavanju teksta.

Zapravo, rani softver za OCR zahtijevao je obuku programa o određenom fontu prije nego što se mogao precizno unijeti. Slično tome, prilikom unosa rukopisa, program bi trebao biti obučen, što je proces koji bi mogao biti nevjerojatno dugotrajan. Međutim, metode su se poboljšale, a inteligentniji sustavi sada su norma. Metode koje se koriste sada su relativno statične, samo malo istraživanja ide u razvoj potpuno novih metoda, a većina istraživanja ide u usavršavanje postojećih postupaka kako bi bili sve točniji. Rane verzije softvera korištene su u širokom rasponu aplikacija, s velikim korporacijama koje su ih koristile za čitanje otisaka kreditnih kartica 1950-ih, a Poštanska služba Sjedinjenih Američkih Država koristila ih je za sortiranje pošte od sredine 1960-ih.

Prije deset godina bilo je teško odabrati dio softvera za OCR, jer su mnogi programi bili prilično loši u određenim zadacima, a razumno dobri u drugim. Međutim, ovih dana teren je uvelike poravnat. Stope točnosti u bilo kojem dobrom softveru za prevođenje upisanih latiničnih slova su iznad 99%. Međutim, kada je riječ o unosu rukopisa ili složenijih slova, OCR softver još uvijek ima relativno visok raspon.

Cijena OCR softvera također uvelike varira, često u odnosu na stope točnosti kojima se može pohvaliti. Može se pronaći prilična količina besplatnog softvera koji je prikladan za unos tiskanih materijala, a može se pronaći i neki koji je relativno dobar u otkrivanju rukopisa, posebno uz određenu obuku. Skuplji softverski paketi, kao što je paket OmniPage, koji košta oko 100 američkih dolara (USD) za kućnu verziju i oko 450 dolara za profesionalnu verziju, mogu se pohvaliti impresivnim nizom značajki i općenito većim stopama uspjeha.
Nažalost, još uvijek ne postoji savršeni OCR softver, tako da odabir programa za kupnju još uvijek može biti u velikoj mjeri frustrirajući proces. Čak će i najbolji programi vjerojatno imati poteškoća s rukopisom, a pogreške će se neizbježno provući, čak i na niskim razinama. Uglavnom, odabir programa za kupnju svodi se na dodatne značajke: višejezičnu podršku, skeniranje jednim dodirom i integraciju konverzije, automatsku pretvorbu PDF-a i prepoznavanje cijele riječi u specijaliziranim disciplinama kao što su pravna i medicinska područja.