Abbyy FineReader 5.0 Pro: Elektronické oko

  • 1
Vypůjčili jste si jinak nedostupná skripta a nechce se vám je kopírovat, protože by to bylo příliš nákladné? Skenovaná kopie by na vašem pevném disku zabírala mnoho místa? Převeďte si tištěný text do textového souboru!

To, že počítače budou běžně schopny rozpoznávat tištěný či psaný text, bylo ještě před dvaceti lety považováno za utopii. Dnes stačí vlastnit osobní počítač, skener a příslušný software. Existuje řada aplikací, které převod tištěného textu zpět do digitální podoby umožňují – liší se od sebe užívanými principy rozpoznávání znaků, podporou různých znakových sad a také cenou. Jednou z aplikací určených pro domácí i firemní použití je FineReader 5.0 ve verzi „Pro“, který existuje i v lokalizované podobě. Produkt obsahuje podporu rozpoznávání pro 121 různých jazyků a jejich znakových sad. Kromě standardních evropských jazyků jsou podporovány exotické jazyky, např. tatarština, avarština, kazachština; také některé programovací jazyky – např. Basic, C/C++, Cobol, Fortran, Java a Pascal. Pro část jazyků je k dispozici plná podpora, tj. včetně kontroly pravopisu – mezi tyto jazyky patří i čeština a slovenština.

 

InstalaceFineRead 

Redakce měla k dispozici pouze zkušební verzi - ta umožňuje volbu jen mezi ruským a anglickým jazykovým rozhraním. Oproti prodejní verzi je navíc omezena na třicet spuštění nebo stejný počet hodin nepřetržité práce. Jinak jsou všechny funkce programu zachovány. Instalace samotná probíhá bez komplikací a trvá jen několik minut. Po výběru jazyka, ve kterém bude aplikace komunikovat, a zadání několika identifikačních údajů je uživatel vyzván, aby zvolil rozsah instalace – plnou, minimální či uživatelskou. 

 

Jak to pracuje

Předpokladem pro práci s tímto programem je, že máte ke svému počítači připojen skener nebo již máte k dispozici předem naskenované texty. Jako vstupní zařízení lze použít prakticky libovolný skener, který je plně kompatibilní se standardem TWAIN. FineReader  akceptuje skenovaný text ve formátech BMP, PCX, DCX, JPEG, PNG a TIFF - komprese: nepakovaný, CCITT Group 3, CCITT Group 3 FAX (2D), CCITT Group 4 a PackBits.

 

Vlastní práce s touto aplikací je velmi snadná a intuitivní. Po naskenování textu, případně po otevření grafického souboru obsahujícího naskenovaný text je nutné označit oblasti, ve kterých se má program o rozpoznání textu pokusit. Pak již stačí stisknout tlačítko „Read“, čímž začne vlastní proces rozpoznávání znaků. Délka této operace je závislá na kvalitě, množství a formátování zvoleného textu. Rozpoznaný text je možné nechat zkontrolovat prostřednictvím vestavěné funkce pro kontrolu pravopisu – ta odhalí většinu chyb, ke kterým při rozpoznávání znaků došlo. Uživatel má na výběr z celé řady výstupních formátů, ve kterých lze převedený text uložit. K dispozici jsou filtry pro Microsoft Word 95, Microsoft Word 97, Microsoft Word 2000, Rich Text Format, Text, Unicode Text, Microsoft Excel 95, Microsoft Excel 97, Microsoft Excel 2000, HTML, Unicode HTML, DBF, CSV a PDF. U výstupních formátů RTF, DOC a HTML je možné zvolit, zda ve výsledném souboru bude zachováno stejné formátování jako u skenované předlohy či nikoliv.

 

FineReader

V našem testu jsme jako předlohu použili část titulní strany MF Dnes, ze které jsme vybrali část textu. Výsledek byl překvapující – celý text byl převeden bez chyby, aplikace pouze vyznačila znaky u kterých neproběhlo rozpoznání se stoprocentní jistotou. Následné vložení převedeného textu do textového editoru Word proběhlo též bez problémů, a to jak při zachování formátování dle předlohy, tak i při uložení hladkého textu. Při převodu jsme také zaregistrovali jen jeden nedostatek: ne vždy dokáže zcela přesně rozpoznat navazující text v případě složitého vícesloupcového formátování – např. na novinových stránkách.

 

Závěr

Pokud potřebujete často převádět tištěný text zpět do datové podoby, je aplikace FineReader 5.0 s velkou pravděpodobností to, co hledáte. Vzhledem k vysoké schopnosti a kvalitě rozpoznávání znaků a relativně nízké ceně je tento produkt ideálním řešením pro domácí i firemní použití. Cena za licenci pro jeden počítač činí přibližně 4200 korun včetně DPH. Program je dodáván i v síťové verzi pod označením FineReader 5.0 Office – tato verze umožňuje např. distribuované zpracování dokumentů po síti, síťovou správu licencí, podporu více procesorů a rozpoznávání čárových kódů. Pro provoz programu doporučuje výrobce počítač s procesorem Pentium na frekvenci minimálně 133 MHz, alespoň 32 MB RAM a přibližně 70 MB volného prostoru na pevném disku. Podporovanou platformou operačního systému jsou Windows 95, 98, 2000 a Windows NT 4.0/SP3.