Co se vyplatí sledovat. Začátečníkův průvodce (datovou) epidemií

  13:30
Řada běžně uváděných ukazatelů o vývoji pandemie covid-19 není pro přesné posouzení jejího skutečného průběhu nejvhodnější, argumentuje statistik Karel Helman. Jak ale sám píše, velkou část těch opravdu zajímavých nemáme jako veřejnost k dispozici.
Valí se na vás záplava dat o pandemii? Nechejte si poradit, co sledovat

Valí se na vás záplava dat o pandemii? Nechejte si poradit, co sledovat | foto: Reuters

V první polovině března se na nás začala valit vlna čísel v souvislosti s onemocněním covid-19 nejen v České republice. Pro člověka, který si chtěl vytvořit dobrý přehled o stavu a časovém průběhu nákazy (nejen) v České republice, se jednalo o velmi složitou situaci. Informační hodnota výrazné většiny čísel, která dominovala veřejnému prostoru, pokud jde o stav a časový průběh nákazy, byla totiž téměř nulová.

Pro aspoň základní možnost dobře se zorientovat v dostupné hromadě čísel je nutné výborně porozumět vlivu testovací strategie na všechny existující ukazatele, které jsou založeny na prokázaných počtech případů nákazy. „Testovací strategií“ je jednoduše řečeno způsob výběru lidí, u kterých se provádí test na přítomnost viru SARS-CoV-2, původce onemocnění covid-19.

V (ne)dokonalém světě

Představme si nejprve hypotetickou „optimální“ situaci, v níž bychom dokázali (například v České republice) otestovat každý den všechny obyvatele. V takovém případě bychom měli každý den dokonalou a přesnou informaci o stavu nákazy. Pokud bychom informace o stavu nákazy v jednotlivých dnech „poskládali“ v čase za sebou, získali bychom také dokonalou a přesnou informaci o časovém vývoji nákazy.

Měli bychom také dokonalou a přesnou znalost o všech vlastnostech onemocnění, jako jsou například smrtnost, smrtnost pro různé věkové skupiny, smrtnost pro obézní, podíl hospitalizovaných mezi všemi nemocnými, podíl lidí s vážným průběhem nemoci mezi všemi nemocnými a podobně. Lze se přitom domnívat, že z hlediska vývoje v čase by některé ukazatele (třeba podíl hospitalizovaných mezi všemi nemocnými) zůstávaly neměnné (konstantní), protože v čase jsou zřejmě přibližně neměnné i „vlastnosti“ onemocnění.

Ve skutečnosti jsme ale v každém časovém okamžiku (tedy každý den) zhruba od počátku března, pokud jde o situaci v České republice, měli pouze informace založené na lidech, kteří byli testováni. Z tohoto důvodu je třeba všechny ukazatele sledované v reálném čase (tj. každý den) chápat jako odhad „opravdových“ neznámých vlastností onemocnění. Takže správně bychom za všech okolností měli například důsledně hovořit o „odhadu smrtnosti“ a tak dále.

Všechny tyto v reálném čase sledovatelné ukazatele (i mnou doporučovaný  denní podíl lidí s prokázaným onemocněním, jak jsem zdůrazňoval již ve svém prvním článku) jsou rozhodujícím způsobem ovlivněny testovací strategií.

Představme si některé extrémní (a samozřejmě zcela nelogické a iracionální) testovací strategie:

  • žádné testy: pokud by nebyly prováděny žádné testy, všechny v reálném čase sledované ukazatele by byly nulové. O vážnosti průběhu nákazy bychom získali informace až s odstupem času na základě (případně) zvýšeného počtu zemřelých, například v porovnání s „průměrnými“ počty zemřelých z minulých let.
  • testováni pouze mladí a zdraví lidé, sportovci: počet lidí s vážným průběhem onemocnění by byl nulový nebo téměř nulový. Smrtnost (pozor, ve skutečnosti by se jednalo o odhad smrtnosti) by byla dost možná nulová, protože nikdo, u koho by bylo onemocnění prokázáno, by nezemřel.
  • testováni pouze lidé, kteří již před provedením testu byli hospitalizováni v nemocnici: všichni nemocní by měli vážný průběh nemoci. Smrtnost (přesně řečeno odhadovaná smrtnost) by byla velmi vysoká.
  • testovány pouze děti do 14 let: všichni, u nichž by bylo prokázáno onemocnění covid-19, by byli ve věku do 14 let. Mezi lidmi s prokázaným onemocněním by nebyl nikdo starší. Smrtnost (zase přesněji řečeno její odhad) by byla nulová. O vážnosti průběhu nákazy bychom získali informace až s odstupem času na základě (případně) zvýšeného počtu zemřelých, například v porovnání s „průměrnými“ počty zemřelých z minulých let.
  • testováni pouze lidé ve věku 85+: všichni, u nichž by bylo prokázáno onemocnění covid-19, by byli ve věku 85 let a více. Mezi lidmi s prokázaným onemocněním by nebyl nikdo mladší. Smrtnost (odhad smrtnosti) by byla velmi vysoká, protože s vyšším věkem jsou spojené různé zdravotní problémy, které zvyšují riziko vážného průběhu onemocnění covid-19.

Všechny ukazatele vypočtené v reálném čase na základě výše uvedených testovacích strategií by byly pouhými odhady „opravdových“ (neznámých) vlastností nemoci covid-19. Ve všech případech by se navíc pochopitelně jednalo o odhady velmi, velmi, velmi chybné.

Jak to bylo doopravdy?

Detailní informace o tom, jaká byla a je testovací strategie v České republice, bohužel nemáme. I s ohledem na pozitivní vývoj denního podílu lidí s prokázaným onemocněním, který – orientačně řečeno – začal klesat někdy v druhé polovině března, můžeme předpokládat, že zvolená skutečně použitá testovací strategie byla racionální a velmi vzdálená všem výše uvedeným teoretickým extrémům. Všechny ukazatele sledované v reálném čase na základě testovací strategie uplatňované v České republice jsou proto „lepšími“ odhady „opravdových“ neznámých vlastností onemocnění covid-19 než odhady při výše uvedených teoretických testovacích strategiích.

Na to, jakým způsobem se v České republice vyvíjela/měnila testovací strategie, můžeme usuzovat například na základě průběhu denního podílu hospitalizovaných mezi (v daný den) všemi aktuálně známými lidmi s prokázaným onemocněním covid-19.

Graf zobrazuje denní podíl pozitivních testů na přítomnost viru SARS-CoV-2 (oranžově) a podíl hospitalizovaných osob mezi všemi (v daný den) osobami s aktuálně prokázaným onemocněním.

Pokud předpokládáme, že („opravdové“, neznámé) vlastnosti nákazy jsou v čase neměnné, lze pozorovaný přibližně konstantní podíl hospitalizovaných (který je odhadem neznámého skutečného podílu hospitalizovaných) chápat jako indikátor v čase přibližně neměnné testovací strategie.

Konkrétně můžeme graf číst takto: zhruba od 24. března (možná ale už od 17. března) do konce dubna byla v Česku používaná testovací strategie stále zhruba stejná (podíl hospitalizovaných se držel blízko cca 9,5 až 10 %). Na začátku, zhruba do 17. března, bylo testování zaměřeno relativně více na lidi vracející se ze zahraničí, zejména z rizikových oblastí jako třeba Lombardie.

Protože na začátku března bylo již onemocnění covid-19 v Lombardii velmi rozšířeno, objevily se i velmi vysoké denní podíly lidí s prokázaným onemocněním (extrémem je hodnota z 1. března, kdy mezi jedenácti provedenými testy byly tři výsledky pozitivní, takže denní podíl pozitivních byl 27,27 procenta). V době, kdy byla testovací strategie relativně více zaměřena na lidi vracející se ze zahraničí (často se jednalo o sportovce), byl podíl hospitalizovaných velmi nízký – zhruba do 16. března.

Detailní informace ovšem nemáme. Nevíme například, jakou část hospitalizovaných tvořili lidé hospitalizovaní kvůli onemocnění covid-19 a jakou část tvořili lidé, kteří byli hospitalizováni z jiných důvodů a až později u nich bylo prokázáno onemocnění covid-19. Na základě grafu výše ale můžeme usuzovat, že k první výrazné změně testovací strategie v České republice došlo zhruba okolo poloviny března.

Ke druhé výrazné změně testovací strategie pak došlo zavedením tzv. „chytré karantény“ na počátku května. Je možné, že s tím je spojený pokles podílu hospitalizovaných, který začal zhruba na začátku května – mezi lidmi s prokázaným onemocněním se v důsledku změny testovací strategie začali relativně více objevovat lidé bez vážného průběhu onemocnění.

Můžeme tedy usuzovat, že hodnoty denního podílu pozitivních byly (mezi sebou) velmi dobře srovnatelné zhruba od poloviny března do konce dubna. Dříve a později je srovnatelnost hodnot denního podílu pozitivních omezená kvůli rozdílné testovací strategii.

Pro začátečníka: co sledovat, co nesledovat

Víme, že v Česku ukazatel „počet zemřelých v souvislosti s covid-19“ představuje „počet zemřelých, u kterých bylo prokázáno onemocnění covid-19“. Bez ohledu na to, zda bylo onemocnění způsobené novým koronavirem hlavní, či vedlejší příčinou úmrtí. Metodika je bohužel taková, že by byl zahrnut i člověk pozitivně testovaný na covid-19, kterého by třeba porazilo auto.

Bohužel, vzhledem k tomu, jaké nástroje mají dnes zdravotní statistici k dispozici, jedná se zřejmě o „maximum“ možného. Interpretovat takovýto údaj jako „oběti covid-19“ je však, mírně řečeno, nesmírně zavádějící.

Přesto ale je kumulativní (celkový) počet zemřelých zřejmě jediným ukazatelem, který má smysl sledovat, pokud jde o kumulativní počty. Všechny ostatní kumulativní ukazatele, indikátory vypočítané na základě kumulativních údajů či různé grafy a mapy založené na kumulativních číslech doporučuji začátečníkovi, který by chtěl získat dobrý přehled o stavu a časovém vývoji nákazy, zcela ignorovat.

Pokud by se „statistický začátečník“ zajímal o aktuální míru (vážnost) a časový vývoj nákazy (ať už v Česku, či v zahraničí) v reálném čase, doporučuji zcela ignorovat veškerá absolutní čísla, protože ta jsou (kromě testovací strategie) rozhodujícím způsobem ovlivněna také počtem prováděných testů. Informační hodnota čísel o denních počtech lidí s prokázanou nákazou, neznáme-li počet prováděných testů, je velmi nízká.

Kdybych mohl vybírat zcela bez omezení a žili bychom v „ideálním světě“, doporučil bych sledovat několik následujících ukazatelů:

  1. denní podíl lidí s prokázaným onemocněním, nejlépe doplněný například takzvaným „klouzavým průměrem“ počítaným třeba na základě sedmi po sobě jdoucích hodnot (takovým výpočtem dojde k „odstranění“ náhodných výkyvů a lze lépe sledovat vývojové tendence); na základě tohoto ukazatele lze sledovat vývoj míry/vážnosti nákazy v čase
  2. denní podíl hospitalizovaných mezi (v daný den) všemi aktuálně známými lidmi s prokázaným onemocněním covid-19; na základě vývoje tohoto ukazatele si lze udělat obrázek o uplatňované testovací strategii
  3. podíl obsazených JIP lůžek (ARO a JIP pro dospělé)
  4. podíl obsazených JIP lůžek (ARO a JIP pro dospělé) lidmi s prokázaným onemocněním covid-19
  5. podíl obsazenosti ventilátorů
  6. podíl obsazenosti ventilátorů lidmi s prokázaným onemocněním covid-19

Všechny tyto ukazatele lze sledovat v reálném čase, tedy každý den. Žádný z nich není (na rozdíl od absolutních ukazatelů) zatížen počtem provedených testů. Všechny jsou zatíženy zvolenou testovací strategií.

Bohužel, v praxi může veřejnost sledovat z těchto údajů pouze jediný, a to ukazatel 1., tedy podíl pozitivně testovaných v daný den. Ten nebyl sice dlouho vůbec akcentován, ale je k dispozici na stránkách ministerstva zdravotnictví.

Denní vývoj poměru (v procentech) počtu lidí s nově prokázaným onemocněním a celkového počtu provedených testů (včetně opakovaných testů u stejné osoby) v daném dni
DatumDenní vývoj poměru (v %)
03.03.20202,56
04.03.20200
05.03.20203,95
06.03.20209,91
07.03.20203,63
08.03.20204,26
09.03.20202,26
10.03.202015,15
11.03.20206,77
12.03.20204,1
13.03.20202,96
14.03.20204,87
15.03.202010,6
16.03.20206,44
17.03.20205,18
18.03.20206,26
19.03.20209,07
20.03.20205,85
21.03.20208,4
22.03.20206,33
23.03.20205,5
24.03.20206,04
25.03.20207,09
26.03.20205,59
27.03.20206,96
28.03.20206,2
29.03.20205,62
30.03.20203,57
31.03.20204,61
01.04.20204,61
02.04.20204,03
03.04.20204,49
04.04.20204,83
05.04.20202,39
06.04.20203,65
07.04.20202,39
08.04.20203,48
09.04.20203,14
10.04.20202,86
11.04.20203,48
12.04.20202,74
13.04.20202,12
14.04.20201,33
15.04.20201,89
16.04.20201,57
17.04.20201,4
18.04.20201,87
19.04.20202,28
20.04.20202,35
21.04.20201,59
22.04.20201,12
23.04.20200,7
24.04.20201,21
25.04.20201,78
26.04.20201,54
27.04.20200,53
28.04.20200,67
29.04.20201,02
30.04.20201,39
01.05.20201,25
02.05.20200,46
03.05.20200,67
04.05.20200,5
05.05.20200,82
06.05.20200,96
07.05.20200,75
08.05.20201,01
09.05.20200,48
10.05.20200,69
11.05.20200,68
12.05.20200,51
13.05.20200,62
14.05.20201,19
15.05.20200,81
16.05.20201,17
17.05.20200,57
18.05.20201,49
19.05.20200,73
20.05.20200,98
21.05.20200,45
22.05.20200,76
23.05.20201,53
24.05.20201,8
25.05.20200,63
26.05.20200,66
27.05.20200,53
28.05.20200,9
29.05.20200,92
30.05.20200,97
31.05.20201,81
01.06.20200,67

Ukazatel 2. (denní podíl hospitalizovaných mezi všemi v daný den aktuálně známými lidmi s prokázanou nákazou), pokud je mi známo, se dnes stále nikde neuvádí. Data pro ukazatele 3.–6., tedy údaje o vytížení zdravotnického systému intenzivní péče, nejsou bohužel veřejnosti v přehledné, ucelené podobě dostupná. Víme pouze to, co jsme se dozvěděli z prezentací na tiskových konferencích ministerstva.

Je to škoda, protože se jedná o klíčové ukazatele vytíženosti zdravotnického systému. Možný kolaps zdravotnického systému v důsledku (možného) přetížení zdravotnických zařízení nemocnými s onemocněním covid-19 byl přitom hlavním argumentem pro zavádění bezprecedentních vládních opatření.

Mezinárodní srovnání

Pro mezinárodní srovnání začátečníkovi doporučuji, pokud jde o ukazatele pozorovatelné v reálném čase (každý den), zcela ignorovat veškerá absolutní čísla i veškerá relativní čísla přepočtená na milion obyvatel, protože nezohledňují množství provedených testů. Pro mezinárodní srovnání vážnosti nákazy lze použít pouze denní podíl lidí s prokázaným onemocněním, a to ještě za nutného předpokladu o aspoň přibližně srovnatelné testovací strategii ve srovnávaných zemích.

Nelze porovnávat ani odhady smrtnosti mezi jednotlivými zeměmi – uváděné rozdílné odhady smrtnosti jsou spíše odrazem rozdílné testovací strategie než něčeho jiného. Samozřejmě, „opravdová“ (neznámá) smrtnost může být vyšší v zemích (přesněji v oblastech – třeba v Lombardii), kde v důsledku extrémního rozšíření nákazy došlo ke kolapsu zdravotnického systému.

Pro orientační porovnávání vážnosti nákazy v různých zemích doporučuji začátečníkovi webové stránky projektu Euromomo. Pro dobré porozumění informaci v grafech pro jednotlivé země není potřeba detailně rozumět výpočtům, na základě kterých byly grafy pro jednotlivé země sestaveny. Vysoké hodnoty („výkyv“ křivky v grafu směrem nahoru) ukazují pro danou zemi „neobvykle vysoké“ („nadnormální“) počty zemřelých. Nízké hodnoty („výkyv“ křivky v grafu směrem dolů) ukazují „neobvykle nízké“ („podnormální“) počty zemřelých.

Očima statistika

Statistik Karel Helman pro Technet napsal několik článků o šíření viru SARS-CoV-2. V prvním se věnoval přehledu nejvážnějších chyb, kterých se při prezentaci dat dopouštěla média.

V druhém se zamýšlel nad možná nejobtížnějším aspektem snahy o porozumění pandemii, tedy hledání přičinných vztahů, především mezi zavedenými opatřeními a průběhem šíření nákazy.

Třetí článek pak poukázal na to, že není jasné, proč, na základě jakých kritérií, se ve veřejném prostoru tak často hovořilo o „epidemii onemocnění covid-19“ v České republice.

Jedná se přitom o informace o všech zemřelých v daném období bez ohledu na příčinu úmrtí. Křivky umožňují orientační porovnání jak mezi zeměmi, tak posouzení velikosti výkyvů v křivkách s podobnými výkyvy v minulosti. Vzhledem ke způsobu výpočtu hodnot zakreslených v křivkách pro jednotlivé země nemají bohužel prezentované hodnoty jednoduchou věcnou interpretaci a porovnání situací v různých zemích je tak orientační. Ještě lepším nástrojem pro mezinárodní srovnání by bylo grafické zachycení relativního počtu „nadnormálních úmrtí“. Bohužel v současnosti nevím o zdroji, kde by byly takovéto grafy dostupné v tak ucelené a přehledné podobě a v takovém rozsahu z hlediska množství srovnávaných zemí, jako křivky v rámci projektu Euromomo.

V grafech projektu Euromomo je pozorovatelných mnoho zajímavých skutečností. Jak víme kupříkladu z mého třetího článku, od roku 2011 byl v České republice nejvíce nadprůměrným týdnem z hlediska počtu zemřelých 10. týden roku 2018 (29 % nad průměrem zemřelých v 10. týdnu v letech 2011–2019). Zhruba ve stejném období lze pozorovat podobné výkyvy například v křivce pro Rakousko, Belgii, Francii, Německo a Nizozemsko. Jednalo se možná o silnou chřipkovou epidemii, která zasáhla jiné země (Španělsko, Velká Británie, Portugalsko) o něco dříve – již na přelomu let 2017 a 2018. Neobvyklý výkyv počtu zemřelých směrem nahoru je pozorovatelný v případě některých zemí také na přelomu let 2016 a 2017.

Výkyvy počtu zemřelých směrem nahoru okolo 13. až 15. týdne roku 2020 zejména ve Španělsku a v Anglii, ale třeba také v Nizozemsku, Belgii a Francii, jsou neporovnatelné s jinými událostmi zaznamenanými v křivkách projektu Euromomo (tedy od začátku roku 2015). V těchto zemích tak v daných týdnech podle dostupných údajů zemřelo výrazně nadnormální množství lidí.

Celkové týdenní počty úmrtí v zemích zahrnutých do projektu Euromomo od začátku roku 2016 až do května 2020. Zdaleka největší počty mrtvých byly ve 14. týdnu roku 2020, kdy běžná hodnota byla překročena přibližně o35 tisíc.

Můžeme si také všimnout, že v některých zemích, kde byly zaznamenány neobvykle vysoké počty zemřelých, byly v následujících týdnech zaznamenány neobvykle nízké počty zemřelých. Tato skutečnost by mohla souviset s tím, že onemocnění covid-19 je nebezpečné především pro lidi, kteří jsou ve vážném zdravotním stavu. Je tedy možné, že v těch zemích, kde byly počty zemřelých skutečně velmi neobvykle vysoké, uvidíme nejspíše v následujících týdnech křivky klesat. A to buď výrazně po kratší dobu, nebo méně výrazně zato po delší dobu. 

Autor působí jako odborný asistent na Katedře statistiky a pravděpodobnosti Vysoké školy ekonomické v Praze.

Autor:
  • Nejčtenější

Kam pro filmy bez Ulož.to? Přinášíme další várku streamovacích služeb do TV

v diskusi je 125 příspěvků

26. března 2024

S vhodnou aplikací na vás mohou v televizoru na stisk tlačítka čekat tisíce filmů, seriálů nebo...

Z jaderné triády zbyly Britům už jen ponorky. A ty musejí posílit

v diskusi je 76 příspěvků

27. března 2024

Jadernou triádu tvoří strategické bombardéry s jadernými zbraněmi, mezikontinentální balistické...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 41 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Rusko zastavilo odlet na ISS s první Běloruskou, letět měla i Američanka

v diskusi je 50 příspěvků

21. března 2024  10:23,  aktualizováno  14:26

Ve čtvrtek 21. března se necelých deset minut před půl třetí odpoledne měla vydat na Mezinárodní...

{NADPIS reklamního článku dlouhý přes dva řádky}

{POPISEK reklamního článku, také dlouhý přes dva a možná dokonce až tři řádky, končící na tři tečky...}

Načapali jsme otesánka, který se velkého sousta nezalekne. Boeing 747-400F

v diskusi je 8 příspěvků

21. března 2024

Poté, co na Letiště Václava Havla Praha přestaly v barvách Qatar Airways létat nákladní Boeingy...

Dočasná raketa se po téměř 70 letech loučí. Bude startovat naposledy

v diskusi jsou 4 příspěvky

28. března 2024  15:36,  aktualizováno  19:54

Tento čtvrtek stojí na startovací rampě mysu Canaveral poslední potomek raket Thor, nosič Delta IV...

Američané odepsali modul, který je vrátil po půl století na Měsíc

v diskusi je 20 příspěvků

28. března 2024,  aktualizováno  11:41

Od začátku letošního roku je na Měsíci a kolem něj poměrně rušno. Vedle řady sond, které zamířily...

Hlučínsko patří nám. Před 100 lety byl podepsán definitivní protokol o hranici

v diskusi je 41 příspěvků

28. března 2024

Před 100 lety definitivně skončily tahanice o československo-německé hranice. 28. března 1924 byl...

Úspěšný let prototypu XB-1 vrací do hry cestování nadzvukovou rychlostí

v diskusi je 34 příspěvků

27. března 2024  17:17

Po více než dvaceti letech, od ukončení provozu letounu Concorde, se možná opět dočkáme nadzvukové...

Prodej byt 2 + 1, 83m2, Benátky nad Jizerou, Benátky nad Jizerou I
Prodej byt 2 + 1, 83m2, Benátky nad Jizerou, Benátky nad Jizerou I

Dr. Nováka, Benátky nad Jizerou - Benátky nad Jizerou I, okres Mladá Boleslav
3 990 000 Kč

Rána pro britskou monarchii. Princezna Kate má rakovinu, chodí na chemoterapii

Britská princezna z Walesu Kate (42) se léčí s rakovinou. Oznámila to sama ve videu na sociálních sítích poté, co se...

Smoljak nechtěl Sobotu v Jáchymovi. Zničil jsi nám film, řekl mu

Příběh naivního vesnického mladíka Františka, který získá v Praze díky kondiciogramu nejen pracovní místo, ale i...

Rejžo, jdu do naha! Balzerová vzpomínala na nahou scénu v Zlatých úhořích

Eliška Balzerová (74) v 7 pádech Honzy Dědka přiznala, že dodnes neví, ve který den se narodila. Kromě toho, že...

Pliveme vám do piva. Centrum Málagy zaplavily nenávistné vzkazy turistům

Mezi turisticky oblíbené destinace se dlouhá léta řadí i španělská Málaga. Přístavní město na jihu země láká na...

Kam pro filmy bez Ulož.to? Přinášíme další várku streamovacích služeb do TV

S vhodnou aplikací na vás mohou v televizoru na stisk tlačítka čekat tisíce filmů, seriálů nebo divadelních...