U pravilu, kada se radi o programima za prepoznavanje skeniranog teksta (OCR, optičko prepoznavanje znakova), većina korisnika pamti jedini proizvod - ABBYY FineReader, koji je nesumnjivo vodeći među takvim softverom u Rusiji i jedan od lidera na svijetu.
Ipak, FineReader nije jedino takvo rješenje: postoje besplatni programi za prepoznavanje teksta, internetske usluge za iste svrhe, a takve funkcije su prisutne i kod nekih poznatih programa koji već mogu biti instalirani na vašem računalu , Pokušat ću pisati o svemu tome u ovom članku. Svi smatrani programi rade u sustavu Windows 7, 8 i XP.
Voditelj prepoznavanja teksta - ABBYY Finereader
O programu FineReader (izgovara se kao Fine Reader), vjerojatno većina vas. Ovaj program je najbolji ili jedan od najboljih za kvalitetno prepoznavanje teksta na ruskom. Program se plaća i cijena licence za kućnu uporabu je nešto manje od 2000 rubalja. Također možete preuzeti probnu verziju FineReadera ili koristiti online prepoznavanje teksta u ABBYY Fine Reader Online (više stranica se može prepoznati besplatno, a zatim - uz naknadu). Sve je dostupno na službenoj web stranici programera. http://www.abbyy.ru.
Instaliranje probne verzije FineReadera nije uzrokovalo nikakve probleme. Softver se može integrirati s Microsoft Office i Windows Explorerom kako bi se olakšalo pokretanje prepoznavanja. Od ograničenja besplatne verzije - 15 dana korištenja i sposobnost prepoznavanja ne više od 50 stranica.
Snimak zaslona za testiranje programa prepoznavanja
Budući da nemam skener, koristio sam snimku s niskokvalitetne kamere telefona, u kojoj sam malo promijenio kontrast, kako bih provjerio. Kvaliteta nije dobra, da vidimo tko to može podnijeti.
Izbornik FineReader
FineReader može dobiti grafičku sliku teksta izravno iz skenera, od grafičkih datoteka ili kamere. U mom slučaju, bilo je dovoljno otvoriti slikovnu datoteku. Bio sam zadovoljan rezultatom - samo nekoliko pogrešaka. Odmah ću reći da je to najbolji rezultat svih testiranih programa kada radite s ovim uzorkom - slična kvaliteta prepoznavanja bila je samo na besplatnoj online usluzi Free Online OCR (ali u ovom pregledu govorimo samo o softveru, a ne prepoznavanju na mreži).
Rezultat prepoznavanja teksta u FineReaderu
Iskreno, za ćirilične tekstove, FineReader vjerojatno nema konkurenata.Prednosti programa su ne samo kvaliteta prepoznavanja teksta, već i široka funkcionalnost, podrška oblikovanjem, stručni izvoz u mnoge formate, uključujući Word docx, pdf i druge značajke. Dakle, ako je OCR zadatak neprestano susrećete, nemojte požaliti relativno malu količinu novca i isplatit ćete: uštedjet ćete veliku količinu vremena kako biste brzo dobili visokokvalitetni rezultat FineReadera. Usput, ne oglašavam ništa - stvarno mislim da oni koji trebaju prepoznati više od desetak stranica trebali bi razmisliti o kupnji takvog softvera.
CuneiForm je besplatan program prepoznavanja teksta.
Po mom mišljenju, drugi najpopularniji OCR program u Rusiji je besplatni CuneiForm, koji se može preuzeti s službene web stranice. http://cognitiveforms.ru/products/cuneiform/.
Instaliranje programa je također vrlo jednostavno, ne pokušava instalirati bilo koji softver treće strane (kao i puno slobodnog softvera). Sučelje je sažeto i jasno. U nekim slučajevima, najlakši način za korištenje čarobnjaka, što je prvi od ikona na izborniku.
Uz uzorak koji sam koristio u FineReaderu, program se nije borio, ili, preciznije, dao je nešto loše čitljivo i ulomke riječi.Drugi pokušaj napravljen je sa snimkom zaslona teksta sa stranice ovog programa, koji je, međutim, trebao biti povećan (treba skenirati rezolucijom od 200dpi i više, ne pročitajte snimke zaslona s širinama linije fonta 1-2 piksela). Ovdje je to učinila dobro (dio teksta nije prepoznat, jer je izabran samo ruski).
CuneiForm prepoznavanje teksta
Dakle, možemo pretpostaviti da je CuneiForm nešto što biste trebali pokušati, pogotovo ako imate visokokvalitetne skenirane stranice i želite ih besplatno prepoznati.
Microsoft OneNote - program koji možda već imate
U Microsoft Officeu, počevši od verzije 2007 i završava s trenutnom, 2013, postoji program za bilježenje - OneNote. Ona također ima značajke prepoznavanja teksta. Da biste ga koristili, jednostavno zalijepite skeniranu ili neku drugu sliku teksta u bilješku, desnom tipkom miša kliknite na njega i upotrijebite kontekstni izbornik. Napominjem da je zadano priznanje postavljeno na engleski.
Prepoznavanje u Microsoft OneNoteu
Ne mogu reći da je tekst savršeno prepoznat, ali, koliko ja mogu reći, nešto je bolje čak i nego u CuneiFormu.Osim toga, program je, kao što je već spomenuto, da je sa znatnom vjerojatnošću već instaliran na vašem računalu. Iako, naravno, njegova upotreba u slučaju potrebe za radom s velikim brojem skeniranih dokumenata nije vjerojatno prikladna, već je pogodna za brzo prepoznavanje posjetnica.
OmniPage Ultimate, OmniPage 18 - mora biti nešto jako cool
Ne znam koliko je dobar OmniPage softver za prepoznavanje teksta: nema probnih verzija, ne želim je skinuti negdje. No, ako je njegova cijena opravdana i koštat će oko 5.000 rubalja u verziji za pojedinačnu upotrebu, a ne Ultimate, onda bi to trebalo biti nešto impresivno. Stranica programa: http://www.nuance.com/for-individuals/by-product/omnipage/index.htm
Cijena softvera OmniPage
Ako pročitate značajke i recenzije, uključujući i one na ruskim jezicima, napominju da OmniPage zaista pruža visoku kvalitetu i preciznu prepoznatljivost, uključujući i ruski jezik, relativno je lako rastaviti ne najkvalitetnije skenove i pruža niz dodatnih alata. Od nedostataka, to nije najprikladniji, pogotovo za novajlijeg korisnika, sučelje. U svakom slučaju, na zapadnom tržištu, OmniPage je izravni konkurent FineReadera i na engleskom jeziku koji se bore upravo među sobom, pa stoga mislim da bi program trebao biti dostojan.
To nisu svi programi ovog tipa, postoje i razne mogućnosti za male besplatne programe, ali tijekom eksperimentiranja s njima pronašao sam dva glavna nedostatka karakteristična za njih: nedostatak ćirilice ili različiti, ne baš korisni softver u instalacijskom kompletu pa su se odlučili da ih ne spominju ovdje.