Klávesové zkratky na tomto webu - základní­
Přeskočit hlavičku portálu


Cestuje v noci, je podezřelý. Tajný program najde teroristy i novináře

aktualizováno 
Tajný program Skynet americké tajné služby NSA údajně slouží k identifikaci podezřelých osob na základě jejich chování. Analytici NSA sledují data o mobilních telefonech obyvatel Pákistánu. Podle datového odborníka jsou však v uniklých prezentacích evidentní chyby, které mohly vést k mylným důkazům proti nevinným lidem.

Tajná služba NSA (Národní bezpečnostní agentura) spadá pod ministerstvo obrany USA

Americká bezpilotní letadla provedla od roku 2004 v Pákistánu 422 útoků na nejrůznější cíle, při kterých zemřelo podle odhadů 2 500 až 4 000 lidí - z toho až 965 civilistů. Naznačují to alespoň data od The Bureau of Investigative Journalism, neziskové organizace, která už od roku 2010 mapuje podobné útoky schválené vládou USA.

Podrobnosti o Skynet

Na základě čeho jsou vybírány cíle, označené k likvidaci jako “extremisté”, mohl napovědět už citát Michaela Haydena, bývalého ředitele NSA a CIA: “Zabíjíme lidi na základě metadat.” Minulý rok odhalená přísně tajná prezentace NSA pak přiblížila, jak probíhá určování, kdo je terorista a kdo ne, a nyní podle vyjádření experta vychází najevo, že zvolená metoda má vážné chyby, které mohou vést ke smrti řady nevinných lidí.

Jedná se o další z utajovaných programů NSA, tentokrát nazvaný Skynet. Filmovým fanouškům ihned připomene počítačový systém z filmové série Terminátor, který rozpoutal celosvětovou jadernou válku s cílem vyhladit lidstvo. Reálný Skynet je poněkud odlišný a silně specializovaný. Byl vytvořen s cílem rozpoznat teroristy na základě jejich strojově měřitelného chování.

Jak funguje vyhledávání teroristů podle velkých dat

Případ Snowden

O programu Skynet se svět dozvěděl v květnu 2015 díky prezentaci NSA (zřejmě z roku 2011 - 2012), kterou vynesl Edward Snowden a po ověření ji publikoval bezpečnostní magazín Intercept. Název dokumentu - Detekce kurýrů pomocí strojové analýzy - dobře vystihuje podstatu tohoto projektu. NSA zde využívá tzv. metadata, tedy informace o hovorech z mobilních telefonů, nikoli obsah těchto hovorů.

Analytikové z několika týmů NSA v prezentaci ukazují, jak z informací o hovorech obyvatel Pákistánu dokážou detekovat kurýry (míněno “pomocníky teroristů”). Při hledání podezřelých vzorců chování (tzv. selektorů) vycházeli z chování známých teroristů či jejich pomocníků a zpětně analyzovali jejich chování. Pak zkusili tyto selektory použít k odhalení známých teroristů a byli podle svých slov “velmi úspěšní”. Princip detekce se podobá fungování anti-spamového filtru. Ten se na základě každého označeného spamu učí, jaké aspekty má nevyžádaná pošta, a na základě těchto aspektů pak označuje podobné zprávy jako spam.

Jsou příliš optimističtí, varuje statistik

V této souvislosti ovšem datový vědec Patrick Ball varuje, že posouzení vlastní úspěšnosti probíhalo velmi povrchně. Analytici NSA vybrali sedm známých kurýrů a na šesti z nich svůj algoritmus pro identifikaci podezřelých vzorců chování vytrénovali.

Pak vybrali náhodných sto tisíc Pákistánců (země má téměř 200milionovou populaci) a nechali algoritmus, aby vyhledal podezřelé osoby. A byl mezi nimi byl i sedmý kurýr. To je ale podle Balla chybný postup, který účinnost metody značně zkresluje a nadsazuje. „Je to značně nevědecký závěr,“ řekl pro Ars Technica.

Ballovi se nelíbí zejména výše zmíněný způsob, jakým se algoritmus učí: „Když používají stejné záznamy na učení i na testování, dostanou naprosto nesmyslné výsledky (míněno velmi příznivé výsledky, pozn. red.). Obvykle se model trénuje na části dat a jiná část dat se schová až na testování. Bez tohoto oddělení je jakékoli posuzování účinnosti směšně optimistické.“

Program Skynet dokáže z GSM metadat vyvodit „styl života“, síť kontaktů a...

Program Skynet umí z GSM metadat vyvodit „styl života“, síť kontaktů a cestovatelské návyky.

V době, kdy byla prezentace vytvořena (2011 - 2012) bylo v Pakistánu přibližně 120 milionů aktivních mobilních telefonů, a NSA měla přístup k záznamům téměř poloviny z nich. K analýze takového množství dat nelze přistupovat ručně, a tak NSA zvolila techniku regresního učení (tzv. „random forest“, tedy „náhodný les“). Podle George Danezise, profesora University College London specializujícího se na bezpečnost, jde o vhodně vybranou metodu: „A trochu si ji inovovali, různým rozhodovacím stromům dávají různou váhu.“

Co když někdo uvízne v sítu?

Ball se obává, že agentura se tak může odvolávat na vysoké pravděpodobnosti úspěšné identifikace, i když v reálu jsou tyto pravděpodobnosti nižší. Ani nejoptimističtější odhad falešných poplachů (0,008% chybovost a poloviční úplnost) ovšem není při miliónech sledovaných Pakistánců příliš pozitivní. Znamená stovky až tisíce lidí, které by systém označil za teroristy a případně - spekuluje Ars Technica - za cíle dronového náletu.

Algoritmus se učí, jak odlišit náhodně vybraného Pakistánce (celkem sto tisíc)...

Algoritmus se učí, jak odlišit náhodně vybraného Pakistánce (celkem sto tisíc) od předvybraného teroristy/kurýra. Poté se algoritmus pokusil své poznatky zužitkovat a tyto teroristy na základě naučených selektorů najít.

Jak NSA testovala výsledky: při 50 % spolehlivosti (miss rate, tedy když...

Jak NSA testovala výsledky: při 50 % spolehlivosti (miss rate, tedy když identifikuje jen polovinu kurýrů) prý má jen 0,008% šanci, že někoho jako kurýra označí mylně.

Pro příklad zřejmě chybně identifikovaného teroristy z Pakistánu není potřeba chodit daleko: v samotné prezentaci NSA ukazují analytikové fotografii člověka, kterého algoritmus označil jako „nejpodezřelejšího“ z terorismu.

Nejvyšší skóre „podezřelosti“ získal novinář Ahmad Zaidan ze stanice...

Nejvyšší skóre „podezřelosti“ získal novinář Ahmad Zaidan ze stanice Al-Džazíra, který často cestuje do oblastí, kde operují ozbrojené skupiny.

Je jím Ahmad Muaffaq Zaidan, reportér Al Džazíry a šéf její kanceláře v Islámábádu. Prezentace NSA jej na základě jeho cest po Pakistánu označila jako „člena Al-Káidy“ a „člena Muslimského bratrstva“. Takové obvinění katarská stanice Al Džazíra odmítá: „Na základě toho, komu náš zaměstnanec telefonoval, kdo telefonoval jemu a kde se tyto hovory odehrály, jej Skynet označil za člena teroristických organizací. (...) Takové obvinění by bylo směšné, kdyby nebylo zároveň velmi vážné. Jestli takto vypadá činnost americké zpravodajské služby, tak se není čemu divit, že je tolik civilistů zabito nálety dronů.“ Také organizace CPJ.org zabývající se ochranou novinářů vyjádřila své znepokojení nad takovouto kriminalizací „legitimní práce respektovaného novináře“.

Uniklá prezentace NSA mluví pouze o testování programu Skynet, nikoli o jeho konkrétních použitích. Nelze tedy odhadnout, jakým způsobem byl či nebyl tento program využit ke sledování či vytipování cílů v Pakistánu. Spolu s ostatními sledovacími programy NSA ovšem tato demostrace práce s velkými daty ukazuje, jakým způsobem se může nejen NSA, ale i jakákoli jiná tajná organizace, dopouštět těžko ověřitelných omylů.



Nejčtenější

Ve dveřích se ohlédl a usmál. Na co nezapomene česká prokurátorka v Haagu

Anna Richterová v době, kdy pracovala pro tribunál v Den Haagu. Snímek je z...

Prokurátorka Anna Richterová je jedinou Češkou, která pracovala u mezinárodního tribunálu pro vyšetřování zločinů v...

Kennedyho sestru Rosemary zničili ambiciozní rodiče lobotomií

Kennedyho sestru zničili ambiciozní rodiče lobotomií

13. září 1918 se narodila Rosemary Kennedyová, sestra prezidenta Johna Fitzgeralda Kennedyho. Od dětství s ní byly...



Zelená Sahara, o hodinu delší den a rozpad Afriky. Co čeká naši planetu?

Budoucnost

Na základě současných poznatků dokážou vědci odhadnout, co se stane v daleké budoucnosti. Připravili jsme pro vás výběr...

Díru do ISS mohli navrtat Američané, tvrdila ruská média

Mezinárodní kosmická stanice ISS.

Američtí astronauti jsou podle ruské agentury Roskosmos nejpravděpodobnějšími viníky incidentu na ISS, při němž na...

Lákavá návnada. Jak se ruská agentka přibližovala k Trumpovi

Marija Butinová (19. 7. 2018)

Vyšetřování vlivu Moskvy na poslední americké volby se dostalo k zajímavému odhalení. Ruská agentka se podle něj...

Další z rubriky

Po čtyřech letech Google zařízne Inbox, populární alternativu Gmailu

První spuštění webové verze Inbox by Gmail

Od roku 2014 mohli uživatelé služby Gmail k vyřizování e-mailů využívat alternativní rozhraní, poněkud odlehčenou...

Až deset tisíc skladeb. Spotify zvyšuje limit na stahování

Spotify

Spotify zvýšilo limit skladeb, které si lze z jednoho účtu stáhnout, na deset tisíc. Platí pro pět zařízení, a celkem...

Apple usnadní policii získat uživatelská data. Zřídí speciální portál

Zákazníci vstupují do prodejny Apple, New York (30. 7. 2018).

Ve Spojených státech pokračují diskuze o tom, jaká data schraňují firmy o uživatelích a jak je může policie získat....

Najdete na iDNES.cz