Stalo se vám někdy, že ačkoli se někdo z vašeho okolí snažil sebevíc, neskryl před vámi smutek nebo zlost? Lidská intuice je v mezilidských vztazích jednou z nejsilnějších zbraní a většinou se na ni spoléháme, aniž víme, jak funguje.
Strojové učení se za poslední desetiletí neustále zlepšuje a dnes počítače dokážou dříve nepředstavitelné. Rozpoznávání emocí ovšem zůstává pro vývojáře z oboru umělé inteligence jednou z největších překážek.
Výzkumníci z prestižní technologické univerzity The Massachusetts Institute of Technology (MIT) učinili letos další krok vstříc vnímavému počítači, i když bezchybný detektor citů zůstává stále v nedohlednu. Lidské emoce jsou jako křížovka, které se můžete naučit luštit. Pojďme se podívat na to, jak algoritmy postupují, a co vše jim můžeme dát do nápovědy a pomoci jim tak k tajence.
Empatický stroj
Média a sociální sítě mohou vzbuzovat pocit, že strojové učení se začíná rozmáhat až v posledních letech. Vědnímu podoboru „vnímavá výpočetní technika“ (affective computing) je přitom už 23 let. Alespoň pokud za jeho počátek stanovíme publikaci stejnojmenného článku profesorky Rosalind Picardové z MIT.
Od té doby pracuje stejně jako nespočet dalších vědců po celém světě na empatickém počítači. Proč? Vnímavý software by měl široké pole využití, od psychologie a výzkumu přes policejní a vojenské účely až po reklamu a marketing.
Oblastí, jak emoce zkoumat, je celá řada, všechny ovšem fungují podobně: monitorovat určitým způsobem subjekt, přetavit pozorování na data a v nich hledat vzorce a podobnosti. O které oblasti jde?
1. Vzhled
Pro nás je to klíčová kategorie. Ze svraštěného čela poznáte vztek nebo zmatení, z vytřeštěných očí překvapení a tak dále. Slavný psycholog Paul Ekman sestavil šestici emocí, které máme podle něj všichni stejné, nezávisle na rase či původu: štěstí, smutek, strach, hněv, znechucení a překvapení.
Na základě studií stanovil, že každou z těchto emocí prozradí pohyby mimických svalů. Pro hlavní šestici stanovil tabulku Kódovací systém pohybů tváře (FACS), ve které ke každé z emocí přiřazuje pohyb určitých svalů. Ačkoli se setkal v průběhu desetiletí s kritikou, modifikace tzv. Ekmanovy metody, kterou můžete znát ze seriálu Anatomie lži, počítače využívají. Pomáhá totiž přetransformovat abstraktní věc (emoci) na zachytitelná data (pohyby tváře).
Navzdory délce vývoje je software na detekci emocí z výrazů tváře stále v plenkách. Například při snaze zavést jej na letištních kontrolách pro odhalení teroristů se jeho úspěšnost přirovnávala k hodu mincí. Z vizuálních informací má ovšem počítač k dispozici i jiné, jako je postoj či gestikulace. Pokrčení ramen může signalizovat zmatení, máchání rukou hněv a podobně. Nejpreferovanější metodou po zachycení těchto signálů je 3D modelování.
2. Řeč
Z vlastní zkušenosti možná dobře víte, jak se mění hlas při strachu, vzteku nebo radosti. Podle toho, jak se cítíme, mluvíme rychleji, hlasitěji nebo nervózněji. Slova mohou prozradit více než obličej a počítače se při analýze lidské řeči mohou zaměřit na následující faktory:
- Frekvence. Jak kolísá v průběhu řeči, v jakém rozmezí výšky tónu mluvíte či jak klesáte na konci vět.
- Rychlost. Kolik slov řeknete za určitý časový úsek, jak pracujete s pauzami nebo jak se mění vaše rychlost mluvy.
- Kvalita řeči. Jak v průběhu řeči dýcháte nebo jak dbáte na výslovnost.
3. Fyziologické měření
Vzhled a zvuk mohou počítače monitorovat i bez přímého zapojení pozorovaného člověka. Výcvikem a dostatečným sebeovládáním se můžete naučit projevy omezit a nedávat vaše emoce najevo. Se souhlasem dotyčného ovšem může počítač využít i další signály, které vaše tělo vydává. Představitelem této metodiky je známý polygraf (detektor lži), který se spoléhá na následující faktory:
- Srdeční frekvence. Kolísající tep či puls prozradí například strach nebo překvapení.
- Galvanické napětí kůže. Naše potní žlázy jsou řízeny nervovým systémem a pocení se spojuje s naším prožíváním. Aktivita žláz se měří většinou dvěma elektrodami chloridu stříbrného, mezi nimiž je malé napětí.
- Elektromyografie obličeje. Toto měření zachycuje elektrickou aktivitu mimických svalů, když pracují. Zatímco viditelné stahy koutku rtů se lze naučit potlačit, eliminovat i jejich sebemenší aktivitu je mnohem obtížnější.
- Další. Emoce se mohou projevovat i změnami dýchání, srdečního tlaku, hladiny hormonů nebo na oční zornici.
Polygraf není spolehlivým důkazním materiálem, protože ani on není neomylný. Jednak jsou výše zmíněné projevy individuální pro každého z nás, a také tyto „zrady“ našeho těla se můžeme naučit ovlivnit. A to je stejné pro lež nebo prožívání emocí.
Chytře se adaptující „experti“
Vracíme se tak ke kořenu problému - abstrakci emocí. Každý z nás je prožívá různě, dává je jinak najevo a dokonce ani emoce jednoho člověka nejsou vždy stejné. Smutek projevíte jinak ráno a večer, před matkou či šéfem, unavení či vyspalí. Lidé mezi sebou většinou instinktivně emoci vytuší, nezávisle na těchto faktorech, ale naučit rozlišovat tyto odchylky stroj, je velmi obtížné.
Čtečka emocí usnadní autistům život |
Výzkumníci z MIT nyní tvrdí, že zdokonalili systém na rozpoznávání emocí, který využívá pouze obrazu a zvuku a lze navíc použít univerzálně na různé skupiny lidí. „Pokud chcete sociálně inteligentní roboty, musíte je naučit přirozeně reagovat na naše nálady a emoce, stejně jako lidé. Náš způsob je navíc nenápadný či neinvazivní, chcete-li,“ říká Oggi Rudovic, spoluautor studie.
Na softwaru pracuje společně s profesorkou Picardovou, která před 23 lety zahájila zrod moderního zkoumání této oblasti. Vyvinuli skupinu neurálních sítí, které nazvali Experti. Každý Expert vyhodnocuje určitou skupinu signálů (mimika, výška hlasu) a určuje dva atributy: jaká emoce je (na škále od negativní po pozitivní) a jaká je její intenzita. Specializovaný algoritmus následně určí, který z Expertů má největší pravděpodobnost uspět.
Tomuto systému poskytli k naučení videa devíti lidí. Následně mu dávali k dispozici pouze části videí dalších žen a mužů a zkoumali, kolik dat je potřeba k tomu, aby systém přesně odhadl emoce u jiných lidí, než na kterých se učil. Vědci byli sami překvapeni - k rozpoznání emoce stačilo počítači 5 - 10 procent dat.
„Adaptace - to je ten klíč,“ komentuje význam Rudovic. „Představte si model, který rozpoznává projevy tváře u jedné skupiny lidí, ale u jiné selhává, protože se projevuje jinak. Našemu modelu stačí jen malé množství dat, aby si vedl stejně dobře u dříve neviděných subjektů.“
Dobrý pomocník, nebo Orwellova dystopie?
K vylepšení systému proto výzkumníci potřebují zejména jedno: data. Tedy videa, obrazy či nahrávky lidí. Zde se vědci pouštějí, zejména s ohledem na dnešní dobu, na tenký led zisku informací. Naznačují, že by data mohli získávat z programů, které by běžící na pozadí mobilu či počítače sbíraly informace například z videokonverzací.
Velký bratr vidí, když jdete na červenou. Sledování v Číně neuniknete |
Potenciální výhody a využití empatického počítače tak ředí náznaky Velkého bratra stejně jako hrozba zneužití. Jakkoli je do dokonalé detekce emocí počítači daleko, za podobné stroje by kupříkladu korporace platily zlatem. Měření reakcí spotřebitelů na reklamy je snem každého marketéra.
Jestli a kdy se dočkáme podobného androida, jako ve sci-fi snímku Ex Machina, stále nevíme. V jedné z klíčových oblastí, rozpoznávání emocí, jsme díky vědcům z MIT o krůček blíž. Zůstává však otázkou, zda by se podobně jako ve filmu Ex Machina z vnímavé výpočetní techniky nestala vnímavá vypočítavá technika.