Konec opisování nečitelného textu. Od robota vás rozeznají podle myši

  • 98
Jedno kliknutí myší spolu s nezaměnitelným lidským pohybem kurzoru bude stačit k identifikaci. Nástroj Captcha, který automatizované programy odhaluje podle neschopnosti rozeznat deformovaný text, přestává být účinný a více než počítače otravuje lidi. Ale úplně se opisování písmenek nezbavíme.

Na webu se nepohybují jen lidé, ale také roboti. Nemají sice mechanické prsty ani kamery místo očí, jde totiž vlastně o počítačové programy, ale přesto jim brouzdání nedělá problémy. Stahují data, registrují si přezdívky, zakládají účty a rozesílají reklamy na všechny strany. Zastavit je dokáže jednoduchý úkol: opište text z obrázku.

Zatímco lidé bez větších problémů přečtou pokroucený text, počítačům to dělalo problém, zvládly to sotva v deseti procentech případů. Ale jak se roboti ve čtení zlepšovali, stoupala i jejich úspěšnost. Text proto musel být čím dál složitější, zamotanější. Brzy se z nástroje Captcha stala past nejen na roboty, ale i na lidi. Schválně, jak se vám čtou tyto obrázky?

Několik různých typů CAPTCHA obrázků. Počítače jsou v jejich řešení čím dál lepší, a tak se čitelnost snižuje a snižuje - i lidé mají s novými CAPTCHA obrázky problém.

reCAPTCHA bez CAPTCHy

Nešlo by to bez čtení? Google, který koupil oblíbený systém reCAPTCHA, nyní přišel s příjemnou inovací. Stačí kliknout na odškrtávátko „Nejsem robot“ a žádné opisování není nutné.

Jednoduché zaškrtávací polííčko skrývá skript, který posoudí, zda jste nebo nejste bot.

Identifikace člověka totiž v nové reCAPTCHA probíhá už od chvíle, kdy na stránku zavítáte. Skript na pozadí sleduje, jak pohybujete myší a jestli se chováte jako člověk, nebo jestli je váš pohyb po stránce nepřirozený.

Přepisováním textu pomůže uživatel k rozpoznání čísel popisných na Mapách Google.

Opisování textu ovšem nezmizelo docela. V případě, že získá skript podezření, že je kliknutí falešné, objeví se stará známá reCAPTCHA, která čerpá data především z čísel popisných zachycených na Google Street View. Můžete se tak utěšovat, že vaše zdržení nebylo úplně zbytečné, pomohli jste nepatrně zpřesnit mapy. 

Google má ohromné množství obrazových materiálů, mimo jiné například nasnímané miliony knih (Google Books) a miliony kilometrů silnic (Google Street View). Zde tedy bere písmenka pro systém CAPTCHA. Vybírá právě takové fotografie, se kterými má počítač problém, protože si algoritmus OCR (optické rozpoznávání znaků) není jistý výsledkem. Takovéto strojově obtížně nápisy pak ukazuje lidem - pokud se více lidí shodne na znacích nápisu, může si být Google celkem jistý, že jde o správnou interpretaci, a algoritmus se může něčemu přiučit.

Jak funguje detekce lidí

Obrana nové reCAPTCHy proti robotům je vícestupňová. Nejprve jde o samotné zaškrtávací políčko, které je renderované skriptem a některým robotům se nezobrazuje (jednoduše proto, že někteří roboti si stránky nevykreslují).

Skript však dělá mnohem více. Sleduje pohyb myši po obrazovce, operační systém, verzi prohlížeče, možná (spekulujeme) i historii stránky nebo přihlášení do různých služeb, cookies apod. Pokud vše vypadá na reálného uživatele (a Google má hodně uživatelů na to, aby mohl toto rozpoznání spolehlivě natrénovat), objeví se po krátkém zpracování dat na straně serveru potvrzení o úspěšném složení testu „ne-robotismu“.

Mobilní uživatelé mají smůlu v tom smyslu, že skript nemůže sledovat jejich pohyb myší. Dostanou ale na výběr mezi několika zvířátky, mezi kterými budou hledat ta odpovídající obrázku.

Nový systém mohou vývojáři zdarma použít na svých stránkách. Zatím jej nasadil např. WordPress a Snapchat. Bude zajímavé sledovat, jak se přizpůsobí autoři spamovacích botů. Nejspíš je budou muset vybavit (alespoň simulovanou) myší a nějakými důvěrohodnými nervovými tiky.

Aktualizace: Do článku jsme doplnili ilustrace, vysvětlili mobilní verzi a přidali odkaz pro vývojáře.