Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu

Cestuje v noci, je podezřelý. Tajný program najde teroristy i novináře

aktualizováno 
Tajný program Skynet americké tajné služby NSA údajně slouží k identifikaci podezřelých osob na základě jejich chování. Analytici NSA sledují data o mobilních telefonech obyvatel Pákistánu. Podle datového odborníka jsou však v uniklých prezentacích evidentní chyby, které mohly vést k mylným důkazům proti nevinným lidem.

Tajná služba NSA (Národní bezpečnostní agentura) spadá pod ministerstvo obrany USA

Americká bezpilotní letadla provedla od roku 2004 v Pákistánu 422 útoků na nejrůznější cíle, při kterých zemřelo podle odhadů 2 500 až 4 000 lidí - z toho až 965 civilistů. Naznačují to alespoň data od The Bureau of Investigative Journalism, neziskové organizace, která už od roku 2010 mapuje podobné útoky schválené vládou USA.

Podrobnosti o Skynet

Na základě čeho jsou vybírány cíle, označené k likvidaci jako “extremisté”, mohl napovědět už citát Michaela Haydena, bývalého ředitele NSA a CIA: “Zabíjíme lidi na základě metadat.” Minulý rok odhalená přísně tajná prezentace NSA pak přiblížila, jak probíhá určování, kdo je terorista a kdo ne, a nyní podle vyjádření experta vychází najevo, že zvolená metoda má vážné chyby, které mohou vést ke smrti řady nevinných lidí.

Jedná se o další z utajovaných programů NSA, tentokrát nazvaný Skynet. Filmovým fanouškům ihned připomene počítačový systém z filmové série Terminátor, který rozpoutal celosvětovou jadernou válku s cílem vyhladit lidstvo. Reálný Skynet je poněkud odlišný a silně specializovaný. Byl vytvořen s cílem rozpoznat teroristy na základě jejich strojově měřitelného chování.

Jak funguje vyhledávání teroristů podle velkých dat

Případ Snowden

O programu Skynet se svět dozvěděl v květnu 2015 díky prezentaci NSA (zřejmě z roku 2011 - 2012), kterou vynesl Edward Snowden a po ověření ji publikoval bezpečnostní magazín Intercept. Název dokumentu - Detekce kurýrů pomocí strojové analýzy - dobře vystihuje podstatu tohoto projektu. NSA zde využívá tzv. metadata, tedy informace o hovorech z mobilních telefonů, nikoli obsah těchto hovorů.

Analytikové z několika týmů NSA v prezentaci ukazují, jak z informací o hovorech obyvatel Pákistánu dokážou detekovat kurýry (míněno “pomocníky teroristů”). Při hledání podezřelých vzorců chování (tzv. selektorů) vycházeli z chování známých teroristů či jejich pomocníků a zpětně analyzovali jejich chování. Pak zkusili tyto selektory použít k odhalení známých teroristů a byli podle svých slov “velmi úspěšní”. Princip detekce se podobá fungování anti-spamového filtru. Ten se na základě každého označeného spamu učí, jaké aspekty má nevyžádaná pošta, a na základě těchto aspektů pak označuje podobné zprávy jako spam.

Jsou příliš optimističtí, varuje statistik

V této souvislosti ovšem datový vědec Patrick Ball varuje, že posouzení vlastní úspěšnosti probíhalo velmi povrchně. Analytici NSA vybrali sedm známých kurýrů a na šesti z nich svůj algoritmus pro identifikaci podezřelých vzorců chování vytrénovali.

Pak vybrali náhodných sto tisíc Pákistánců (země má téměř 200milionovou populaci) a nechali algoritmus, aby vyhledal podezřelé osoby. A byl mezi nimi byl i sedmý kurýr. To je ale podle Balla chybný postup, který účinnost metody značně zkresluje a nadsazuje. „Je to značně nevědecký závěr,“ řekl pro Ars Technica.

Ballovi se nelíbí zejména výše zmíněný způsob, jakým se algoritmus učí: „Když používají stejné záznamy na učení i na testování, dostanou naprosto nesmyslné výsledky (míněno velmi příznivé výsledky, pozn. red.). Obvykle se model trénuje na části dat a jiná část dat se schová až na testování. Bez tohoto oddělení je jakékoli posuzování účinnosti směšně optimistické.“

Program Skynet umí z GSM metadat vyvodit „styl života“, síť kontaktů a cestovatelské návyky.

Program Skynet umí z GSM metadat vyvodit „styl života“, síť kontaktů a cestovatelské návyky.

V době, kdy byla prezentace vytvořena (2011 - 2012) bylo v Pakistánu přibližně 120 milionů aktivních mobilních telefonů, a NSA měla přístup k záznamům téměř poloviny z nich. K analýze takového množství dat nelze přistupovat ručně, a tak NSA zvolila techniku regresního učení (tzv. „random forest“, tedy „náhodný les“). Podle George Danezise, profesora University College London specializujícího se na bezpečnost, jde o vhodně vybranou metodu: „A trochu si ji inovovali, různým rozhodovacím stromům dávají různou váhu.“

Co když někdo uvízne v sítu?

Ball se obává, že agentura se tak může odvolávat na vysoké pravděpodobnosti úspěšné identifikace, i když v reálu jsou tyto pravděpodobnosti nižší. Ani nejoptimističtější odhad falešných poplachů (0,008% chybovost a poloviční úplnost) ovšem není při miliónech sledovaných Pakistánců příliš pozitivní. Znamená stovky až tisíce lidí, které by systém označil za teroristy a případně - spekuluje Ars Technica - za cíle dronového náletu.

Algoritmus se učí, jak odlišit náhodně vybraného Pakistánce (celkem sto tisíc) od předvybraného teroristy/kurýra. Poté se algoritmus pokusil své poznatky zužitkovat a tyto teroristy na základě naučených selektorů najít.

Algoritmus se učí, jak odlišit náhodně vybraného Pakistánce (celkem sto tisíc) od předvybraného teroristy/kurýra. Poté se algoritmus pokusil své poznatky zužitkovat a tyto teroristy na základě naučených selektorů najít.

Jak NSA testovala výsledky: při 50 % spolehlivosti (miss rate, tedy když identifikuje jen polovinu kurýrů) prý má jen 0,008% šanci, že někoho jako kurýra označí mylně.

Jak NSA testovala výsledky: při 50 % spolehlivosti (miss rate, tedy když identifikuje jen polovinu kurýrů) prý má jen 0,008% šanci, že někoho jako kurýra označí mylně.

Pro příklad zřejmě chybně identifikovaného teroristy z Pakistánu není potřeba chodit daleko: v samotné prezentaci NSA ukazují analytikové fotografii člověka, kterého algoritmus označil jako „nejpodezřelejšího“ z terorismu.

Nejvyšší skóre „podezřelosti“ získal novinář Ahmad Zaidan ze stanice Al-Džazíra, který často cestuje do oblastí, kde operují ozbrojené skupiny.

Nejvyšší skóre „podezřelosti“ získal novinář Ahmad Zaidan ze stanice Al-Džazíra, který často cestuje do oblastí, kde operují ozbrojené skupiny.

Je jím Ahmad Muaffaq Zaidan, reportér Al Džazíry a šéf její kanceláře v Islámábádu. Prezentace NSA jej na základě jeho cest po Pakistánu označila jako „člena Al-Káidy“ a „člena Muslimského bratrstva“. Takové obvinění katarská stanice Al Džazíra odmítá: „Na základě toho, komu náš zaměstnanec telefonoval, kdo telefonoval jemu a kde se tyto hovory odehrály, jej Skynet označil za člena teroristických organizací. (...) Takové obvinění by bylo směšné, kdyby nebylo zároveň velmi vážné. Jestli takto vypadá činnost americké zpravodajské služby, tak se není čemu divit, že je tolik civilistů zabito nálety dronů.“ Také organizace CPJ.org zabývající se ochranou novinářů vyjádřila své znepokojení nad takovouto kriminalizací „legitimní práce respektovaného novináře“.

Uniklá prezentace NSA mluví pouze o testování programu Skynet, nikoli o jeho konkrétních použitích. Nelze tedy odhadnout, jakým způsobem byl či nebyl tento program využit ke sledování či vytipování cílů v Pakistánu. Spolu s ostatními sledovacími programy NSA ovšem tato demostrace práce s velkými daty ukazuje, jakým způsobem se může nejen NSA, ale i jakákoli jiná tajná organizace, dopouštět těžko ověřitelných omylů.







Hlavní zprávy

Najdete na iDNES.cz



mobilní verze
© 1999–2016 MAFRA, a. s., a dodavatelé Profimedia, Reuters, ČTK, AP. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s., zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s., se sídlem
Karla Engliše 519/11, 150 00 Praha 5, IČ: 45313351, zapsaná v obchodním rejstříku vedeném Městským soudem v Praze, oddíl B, vložka 1328. Vydavatelství MAFRA, a. s., je součástí koncernu AGROFERT ovládaného Ing. Andrejem Babišem.