Diskuze

Jak se počítač naučil číst milion knížek ročně

Rozpoznávání textu (OCR) patří pro počítače stále mezi obtížné problémy. Ze začátku šlo číst jen jeden typ písma, dnes už se počítače vrhají na knihovny. Projekt Google Books přelouská denně asi 3000 knížek.
Litujeme, ale tato diskuse byla uzavřena a již do ní nelze vkládat nové příspěvky.
Děkujeme za pochopení.

Roman

24. 11. 2007 17:20
hmm

zajímavá mašinka ten scanner na obrázku...

0 0
možnosti
JJ

asdf

24. 11. 2007 15:25
diky

vyborne napsany clanek ktery  dusledne prozkoumava tematiku. vyjimka na iDnes. dekuji autorovi!

0 0
možnosti

FK

24. 11. 2007 15:03
OCR

Zajimavy clanek co se tyce historie, diky za nej. V dnesni dobe pocitacu skutecne neni problem rozpoznavat pismena pokud znate vzory. Mozna by se sluselo rict, ze rozpoznavani podle podobnosti vzoru je ten nejhloupejsi zpusob ktery se da pouzit. Vetsina uspesnych softwaru pouziva topologicke rozpoznavani .... OCR tak jak je zde popisovano se da rozpoznat s uspesnosti pres 99% zvlast s pouzitim pridavneho slovnikoveho a jazykoveho checku. Daleko zajimavejsi je rozpoznavani rucne psaneho textu :-) tam je situace daleko horsi ....

0 0
možnosti

funtom

24. 11. 2007 10:28
Skenování knih v ČR

No, článek je hezký, jen bych chtěl touto cestou poprosit autora, aby třeba ve volném pokračování popsal trochu tuto záležitost z českého prostředí. Pokud vím, tak ve strahovské knihovně se skenováním zabývali již před několika lety - snad ho realizovala nějaká fa z Berouna. Další skenování přibylo po povodních v r. 2002, kdy bylo zaplaveno několik archivů. Spolupracují tyto projekty s Googlem?

Předem děkuji.

0 0
možnosti
PKT

Pavel Kasík - Technet.cz

24. 11. 2007 10:57
Re: Skenování knih v ČR

Díky. Do knihovny se chceme podívat již delší dobu, snad bude vaše povzbuzení ta poslední potřebná kapka :-)

0 0
možnosti
M

Montrealer

24. 11. 2007 7:25
Není pravda, že...

Pět let po konci druhé světové války pracoval americký kryptoanalytik David Shepard na rozlomení kódu z japonského šifrovacího stroje Purple.

Takzvaný japonský Purpurový kód (Purple code) byl tajně rozluštěn

předním americkým kryptografem židovského původu Williamem Friedmannem již před vstupem USA do války v roce 1941. Američané tedy znali japonské záměry už před japonským útokem na Pearl Harbour. Proč tam tedy Japonci Američany překvapili, toť otázka, která od té doby zaměstnává přední vojenské historiky.

0 0
možnosti
PV

Alcator

24. 11. 2007 0:19
A samozřejmě nejnovější fígl opomenut

Jasně, nejdůležitější je popsat, jak to probíhalo před sto lety; za to o nejnovějším fíglu, který využívá "Human computing", ani zmínky. Chjo.

PROČ JE MF DNES TAKOVÁ BŘEČKA???

Nejnovější fígl: propojení rozpoznávání s "protispamovou" ochranou webových formulářů: Je nascanována kniha, scan je rozřezán na jednotlivá slova (mezery mezi slovy stačí). Uživatelům, kteří chtějí např. anonymně přispět do diskuze na nějakém frekventovaném serveru (resp. jednom z mnoha), je kromě políček pro jméno a text zobrazena dvojice slov z nascanované stránky s výzvou, aby do chlívečku opsali obě slova. Jedno slovo už systém "zná" (z dřívějška), druhé chce poznat. Člověk nemá problém poznat, o jaká dvě slova jde, a obě napíše (neví, které z nich systém zná a které ne); a systém při každém takovém použití získá přepis jednoho slova; pro vyloučení překlepů a schválností je každé slovo nabídnuto desítkám lidí, a jejich odpovědi jsou porovnávány.

To ani nemluvím o tom, že autor zapomněl uvést zkratku ICR...

0 0
možnosti