Česká firma pomáhá Europolu rozpoznat tváře zločinců a teroristů

  • 14
Pražská firma Eyedea Recognition uspěla u evropského policejního úřadu Europol. Její software pro strojové rozpoznávání tváří nyní pomáhá s bojem proti zločinu. Zeptali jsme se zakladatele firmy, jak program funguje. To, co dnes zvládne počítač, by prý nedokázala ani armáda analytiků.

Europol si pro svoji práci zvolil software pro rozpoznávání tváří od české firmy Eyedea Recognition. „Software Eyedentity úspěšně využíváme při vyšetřování případů organizované trestné činnosti a v boji proti terorismu v členských státech EU,“ uvedl nejmenovaný pracovník Evropského úřadu boje proti terorismu (European Counter Terrorism Centre).

Jádro softwaru Eyedentity, které testoval a nyní nasadil Europol, je založeno na pokročilých metodách strojového učení (tzv. machine learning) a hlubokých neuronových sítích. „Metody strojového učení patří do oblasti umělé inteligence. Tyto metody samy automaticky nalézají nejvhodnější způsoby vyhodnocení tváří na základě desítek milionů příkladů,“ říká hlavní inženýr projektu Radek Svoboda. Problematikou rozpoznávání tváří a metodami strojového učení se výzkumný tým zabývá již více než deset let. Nasazení systému Eyedentity zvažují údajně také bezpečnostní složky Česku.

Vlevo zdrojový (dotazovací) obrázek, vpravo snímek v databázi identit, který počítač vyhodnotil jako nejpodobnější. Na ilustračním snímku Salah Abdeslam, obviněný z účasti na pařížských útocích v listopadu 2015.

Počítač je už v rozpoznávání identit lepší, než lidé

Firma Eyedea Recognition vznikla v roce 2006 jako pokračování projektů (tzv. univerzitní spin-off) výzkumníků z Centra strojového vnímání na Katedře kybernetiky FEL-ČVUT. Dnes sídlí v prostorách benediktinského kláštera Emauzy, kde jsme také požádali zakladatele společnosti Martina Urbana o krátký rozhovor a demonstraci technologií strojové analýzy obrazu.

Kdy jste začali s vývojem softwaru pro rozpoznávání obličejů?
Celý ten software se skládá z více komponent a na některých jsme pracovali už od začátků firmy. Na detekci obličejů, tedy nalezení obličeje v obraze, děláme nejdéle, to jsme vlastně začínali ještě jako studenti. Pak nás jeden klient požádal, jestli bychom přidali odhadování věku a pohlaví, tak jsme zapracovali tyto analytiky.

Se základním rozpoznáváním identity jsme napřed pracovali jen proto, abychom poznali stejného člověka v rámci jednoho videa. A potom jsme najednou zjistili, že do projektu, který by uměl rozpoznávat identitu, nám už chybí jenom poslední část, že většinu už máme hotovou. Dříve se nám do rozpoznávání identity nechtělo, protože takový software už v té době vyvíjely velké firmy.

Čím to je, že jste se i v takové konkurenci prosadili?
Dlouhodobě jsme dělali v oblasti rozpoznávání obličejů. A pak to, co zpočátku vypadalo neskutečně obtížně, najednou nebyl takový problém, už jsme nebyli nováčci, už jsme měli vybudovanou většinu stavby.

Jádro, na kterém běží rozpoznávání identity, vychází z relativně nových technologií, a vědělo se, že by to mohlo dobře fungovat.

Čím se váš přístup liší od konkurence, co jsou vaše silné stránky?
Jsme menší, máme méně peněz a je nás méně. Tohle my umíme obrátit ve výhodu. (smích) Zaměřili jsme se na trochu jiný problém než naše konkurence. Od začátku jsme se učili pracovat s fotkami s velmi malým rozlišením. Ještě nedávno se rozpoznávání obličejů používalo třeba u pasových fotografií, které mají docela dobré rozlišení. My jsme pracovali se snímky z pouličních kamer s mnohem menším rozlišením.

Jak je možné, že i z tak malého rozlišení poznáte konkrétního člověka?
Čím je fotka kvalitnější, tím lépe to rozpoznání funguje. Počítač ale i u jedné malé fotky seřadí databázi tisíců nebo milionů identit fotek podle podobnosti k té dotazovací fotce. V databázi by také ideálně mělo být více fotek jednoho člověka, což zpřesňuje identifikaci, protože se pak podobné dvojice porovnávají navzájem a hledají maximální souhlas.

Identifikace může probíhat i u videa. Není to ale automat, je to jen nástroj, který upozorňuje na podobnosti. Bez tohoto nástroje to prakticky nejde, protože není možné, aby si člověk pamatoval statisíce tváří v databázi a naživo je ve videu rozpoznával. Jde o výrazné zefektivnění práce.

Software by mohl fungovat i v reálném čase naživo, ale někdo by musel všechny ty podobnosti ručně ověřovat, což je v praxi nemožné i při nízké míře falešných poplachů. U tak vzácných situací, jako je třeba náhodné zachycení teroristy na kameře, by to znamenalo desetitisíce falešných poplachů. Proto tam musí být i další údaje.

Můžete upřesnit něco ohledně toho, jak vás Europol vybíral? Účastnili jste se nějaké soutěže?
Lidé z Europolu se s námi setkali na jedné odborné konferenci, náš produkt několik měsíců testovali a poté se rozhodli k zakoupení licence.

Co je u tak velkého projektu nejtěžší?
Normálně děláme knihovny (programové moduly využitelné v dalších programech, pozn. red.), které si kupují další firmy a ty pak vytvářejí konečný produkt. Tohle je jeden z mála našich programů, kdy jsme vyvíjeli nejen ty knihovny, ale celý produkt od začátku až do konce. Výsledkem je tedy v podstatě instalační DVD, které si nainstalují klienti u sebe, a veškerá data nebo analyzované fotografie tak zůstávají u nich.

Jsou počítače při rozpoznávání obličejů lepší, nebo horší než lidé?
My odlišujeme detekci obličejů a identifikaci obličejů. V identifikaci obličejů jsou lidé dobří, ale jen u těch lidí, které velmi dobře znají, třeba u rodinných příslušníků nebo herců. Ty umějí lidé poznat i z těžkých úhlů. Lidé ale mají problém porovnat dvě fotky cizích lidí a říci, zda je to stejný člověk, nebo ne. V tom jsou už lidé horší než dnešní počítačové programy. Počítač dokáže velmi rychle porovnat dva miliony fotek vůči sobě navzájem, to by člověk prostě nedokázal.

Pracujete se strojovým učením neuronových sítí. Tam už jde často spíše o kuchařinu než o klasické programování, že?
V tuhle chvíli potřebujeme sestavovat velké sady vzorových dat. Máme lidi, kteří tráví čas čištěním dat a tvorbou vzorků, ze kterých se pak počítač učí. Získat dobrá data ve velkém množství je často opravdu těžké. Časově je nejnáročnější příprava a uspořádání dat k dalšímu zpracování.

A pak zkoušíme různé věci buď na pevně vybudované síti, nebo měníme parametry té sítě. Jsou třeba neuronové sítě, kde je stovka různých parametrů, se kterými si člověk může hrát, zkouší se, jak změna parametru ovlivní úspěšnost. Ale nedá se říci, že by tam mohlo dojít k nějakému průlomu, že někdo změní jeden parametr a najednou objeví dvakrát lepší úspěšnost. Ale za rok už to může být zase jinak.