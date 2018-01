Každý jednotlivý volič je individuální a rozhoduje se víceméně samostatně. Při pohledu na mapu výsledků si ovšem pozorovatel všimne toho, že hlasy nejsou rozprostřeny rovnoměrně. Jsou oblasti, ve kterých nadprůměrně bodoval Jiří Drahoš, a místa, kde naopak místní voliči výrazně preferovali současného prezidenta Miloše Zemana. Napadlo nás proto podívat se i na další ukazatele, které dokládají regionální odlišnosti.

Statistiky okresů umožňují analýzu souvislostí Okresy jsou jednotka vhodná pro celkový přehled. Podrobná mapa okrskových výsledků ovšem ukazuje, že okresy rozhodně nejsou jednolitá masa.

Samozřejmě, že na základě sociodemografických dat a výsledků voleb na úrovni okresů (kam pro zjednodušení počítáme i hlavní město) nelze vyvozovat kauzální vztah. Rozdělení není černobílé. Proto chceme ukázat povolební mapu tak, jak ji možná neznáte. Ne dvoubarevnou, ale v plné škále barev. Druhá mapa pak ukazuje data o daném okrese ze statistického úřadu.

V následující příloze můžete sami najít různé souvislosti mezi tím, jak lidé volili v různých regionech. Můžete přepínat mezi statistickými ukazateli (nezaměstnanost, vzdělání, naděje dožití apod.), mezi hlasy pro Miloše Zemana a Jiřího Drahoše v druhém kole nebo mezi sloupcovým a bodovým grafem.

Interaktivní mapy a grafy - najděte souvislosti

Interaktivní mapy a graf ukazují souvislosti mezi výsledky voleb a statistikami:

(Zdroj dat: Český statistický úřad, MapaExekuci.cz, Volby.iDNES.cz)

Jak vyhledávat souvislosti na mapě Stručný návod k využití naší interaktivní přílohy Označením regionu na mapě nebo v grafu se stejný region zároveň automaticky označí i všude jinde. Na počítači stačí najet myší, na mobilu klepnout.

Můžete přepínat mezi dvanácti různými statistickými ukazateli.

První mapa odpovídá vybranému statistickému ukazateli.

Druhá mapa zobrazuje podíl hlasů vybraného kandidáta.

Sloupcový graf zobrazuje vybraný statistický ukazatel. Barva sloupce odpovídá podílu hlasů vybraného kandidáta.

Můžete si také přepnout na bodový X-Y graf, který zobrazí na ploše všechny regiony. Vodorovná osa pak odpovídá hlasům, svislá osa vybranému ukazateli.

Textový popisek zobrazuje přesná data pro vybraný region.

Souvislost mezi vzděláním a volbou prezidenta

Podívejme se třeba na souvislost mezi volbou prezidenta a vzděláním. Vzhledem k tomu, že se jeden z kandidátů prezentoval jako akademik, můžeme formulovat hypotézu: vysokoškolsky vzdělání lidé volili častěji Jiřího Drahoše... Ale s takovými závěry pomalu.

Takovou hypotézu totiž nemůžeme na našich datech ověřit. Nemáme data o tom, jak hlasovali jednotliví voliči. Taková data nemá nikdo, ačkoli některé průzkumy se to snaží obejít tím, že se po volbách zeptali velkého množství voličů. Naše data na úrovni okresů nám nicméně mohou pomoci ověřit jinou hypotézu: v regionech s vyšším podílem vysokoškoláků získal Jiří Drahoš více hlasů, než v regionech, kde je procento vysokoškoláků nižší.

Tuto hypotézu si můžete ověřit v následující interaktivní grafice. Konkrétní hodnoty regionů se zobrazí po označení na mapě nebo v grafu:

Z mapy je zřejmé, že tyto dvě veličiny spolu souvisejí. Tmavá místa na mapě s podílem vysokoškoláků korespondují do značné s tmavými místy na mapě Drahošových volebních výsledků.

Jak moc korespondují? Pro měření toho, jak spolu dvě řady čísel souvisejí, má statistika pomůcku zvanou korelace.

Souvislost mezi hlasy pro Drahoše a podílem vysokoškoláků

Korelační koeficient Stručné vysvětlení toho, co to znamená, když spolu řady korelují Abychom si názorně ukázali, jak lze posuzovat souvislost mezi dvěma řadami čísel nebo dvěma různými parametry stejné „populace“, podíváme se na jednoduchý fiktivní příklad. Máme tabulku se šesti fiktivními osobami. Pokud informace o těchto osobách naneseme na dvourozměrný graf, vidíme, že některé informace spolu souvisí, zatímco jiné nikoli. Míru korelace měříme Pearsonovým korelačním koeficientem. Ukázkové korelace mezi hodnotami: váha a výška spolu v našem příkladu souvisí velmi silně (ρ=0,81), tedy obecně platí „čím vyšší člověk, tím vyšší váha“. Příjem a výška spolu nesouvisí vůbec (ρ=0,03) a mezi příjmem a věkem je středně velká opačná souvislost (ρ=-0,59), tedy „čím starší člověk, tím nižší příjem“. Všimněte si, že ani vysoká korelace neznamená stoprocentní závislost jedné veličiny na druhé. (Rozklikněte pro zobrazení) Nelze jednoznačně říci, jaká korelace už je „silná“ a jaká je naopak slabá, záleží na kontextu, na typu měření a na dalších faktorech. Také proto se nechceme zaměřit na jediné číslo. Zvláště když - jak už jsme zdůraznili - korelace sama o sobě neznamená, že jedna z hodnot má přímý vliv na druhou hodnotu. Třeba v příkladech výše: zatímco souvislost váhy s výškou je celkem logická, souvislost příjmu s věkem může být zcela náhodná nebo způsobená dalšími faktory.

V námi shromážděných datech o okresech se můžete podívat například na tyto souvislosti:

Ekonomické Zeman uspěl v regionech zatížených exekucí

Relativně vysokou míru souvislosti jsme našli mezi výsledky voleb a ekonomickými ukazateli v okresech, což ostatně není nijak překvapivé, protože ekonomika s politikou úzce souvisí.

Jednou z nejlépe pochopitelných metrik ekonomické prosperity regionu je míra nezaměstnanosti. Ukazuje se, že v regionech, které se potýkají s vyšší mírou nezaměstnanosti, měl ve volbách větší úspěch obhajující prezident Zeman. Jiří Drahoš naopak lépe uspěl tam, kde je zaměstnanost vyšší.

Podobně (ale slaběji) souvisel s úspěchem Miloše Zemana v regionu i podíl obyvatel daného regiony v exekuci. Data jsme získali z MapaExekuci.cz:

V obou případech je opět potřeba dodat, že z těchto grafů nelze automaticky vyvozovat, že nezaměstnaní lidé volí častěji Zemana. Díváme se zde na regiony, nikoli na konkrétní voliče.

Budoucnost Drahoš bodoval v okresech s vyšší nadějí dožití

Celkem zajímavá je souvislost s celkem neznámou statistickou informací, tzv. „nadějí dožití“. Český statistický úřad takto označuje střední délku života. Udává průměrný počet let, který má před sebou narozený jedinec, pokud by zůstaly zachovány úmrtnostní poměry, které byly patrné ve sledovaném období a v dané lokalitě. Je tedy jasné, že nejde o exaktní číslo, ale o výslednici řady faktorů.

Nicméně právě s touto metrikou koreluje úspěch Jiřího Drahoše v daném regionu nejlépe. Proč, to je obtížné spekulovat. Může to souviset s kvalitou lékařské péče nebo vyšší životní úrovní.

Další statistická veličina, která souvisí s budoucností, je přírůstek či úbytek obyvatel. Také zde platí, že Drahoš měl procentuálně větší úspěch u voličů v regionech, ve kterých přibývá obyvatel, než v regionech, kde obyvatel ubývá.

Obě tyto metriky mohou do určité míry souviset s optimismem či naopak pesimismem v daném regionu. Ale i zde platí naše připomínka, že tato data neměří rozhodnutí konkrétních voličů, ale pouze souvislosti mezi regiony.

Migrace Regiony s méně cizinci daly přednost Zemanovi

Jedním z témat prezidentských voleb se stala tzv. „otázka migrace“. Statistiky počtu cizinců ukazují, že jich nejvíce žije v Praze (14 tisíc cizinců na sto tisíc obyvatel) a nejméně v Opavě (967 cizinců na sto tisíc obyvatel). V regionech s vyšším podílem cizinců se v prezidentských volbách obecně lépe dařilo Jiřímu Drahošovi, zatímco v regionech, kde žije cizinců méně, bodoval častěji celkový vítěz voleb Miloš Zeman.

To lze interpretovat několika způsoby, například tak, že v regionech, kde žije více cizinců, není migrace vnímána jako téma natolik výrazné či negativní, jako v regionech, kde na cizince nejsou tak zvyklí. Taková interpretace jde ovšem nad rámec toho, co lze vyčíst z uvedených dat, a k ověření by bylo potřeba podrobnější studium motivace voličů.

Žádná souvislost Náboženství a svatby

Jinde naopak souvislost neexistovala, přestože by se jistě našel narativ, který by takovou souvislost očekával. Třeba mezi náboženským vyznáním a volebními výsledky prezidentských voleb nebyla na úrovni okresů žádná souvislost. Stejně tak množství sňatků na sto tisíc obyvatel neukazovalo tím či oním směrem.

Data, která jsme použili, jsou čtenářům k dispozici. Pokud najdete chybu v datech či grafech, dejte nám vědět v komentářích, rádi chybu opravíme. Stejně tak se těšíme na to, jakých souvislostí si za použití našeho „korelovátka“ všimnete. A pamatujte - v žádné skupině voličů nejsou souvislosti stoprocentní. Statistika někdy může svádět ke zjednodušování na základě jednoznačných čísel. Což by byla škoda, zvláště, když je vykreslený obraz tak pestrý a oba kandidáti zaujali značně různorodé skupiny obyvatel Česka.

Aktualizace: Doplnili jsme poznámku o metodice.