Koronavirus v ČR: Pár pozorování

V tomto příspěvku se podívám blíže na některá veřejně dostupná data o šíření nemoci COVID-19 v České republice ve srovnání s dalšími, zejména evropskými zeměmi. Předesílám, že nejsem epidemilog a nemám přírodovědecké vzdělání. Pouze mi baví takříkají "hrát si" s daty. Veškeré grafy v tomto příspvěku byly vygenrovány uvnitř jednoho skriptu uvnitř souboru Jupyter na platformě Google Colaboratory. Tento skript je dostupný zde a může si jej spustit a upravit každý, kdo má připojení k internetu a otevře si jej v prohlížeči (viz instrukce v samotném souboru).

Největší pozornost budu věnovat údajům o počtu potvrzených případů a jejich vývoji v čase. Často se opakuje, že tento údaj není příliš vypovídající, že je třeba vždy také zohlednit počet testů, resp. počet testů ve vztahu k počtu obyvatel. Já se osobně domnívám, že ani informace o počtech testů na obyvatele mnoho neřeší. Aby něco vypovídala, museli bychom současně zohlednit, (a) v kolika případech bylo testování založeného na oznámených či zjištěných symptomech, (b) v kolika se jednalo o jedince vytipované trasováním a na čem bylo toto trasování založeno a (c) v kolika případech se jednalo o preventivní "plošné" testování např. celého sociálního zařízení. Tvrdím, že bez této informace lze čísla o počtu testů na obyvatele mezi zeměmi jen těžko srovnávat, a je zde otázka, zda nám tedy dají hodnověrnější obrázek o aktuální situaci v dané zemi než údaj o počtu potvrzených případů a jeho vývoj v čase samotný.

Dále je třeba poznamenat, že se zde zaměřuji pouze na potvrzené případy nemoci COVID-19, a nikoli na promořenost populace virem SARS-CoV-2, která je patrně řádově vyšší. Odhaduje se například, že v čínském Wuchanu je nyní virem promořeno kolem 85% populace, tj. cca. pět a půl milionu osob. Potvrzené případy COVID-19 z toho představují méně než 1.5 %. Tolik na začátek.

3000 potvrzených případů na konci března, aneb realitistický scénař se vyplnil

V pondělí 23.3. vystoupil na tiskové konferenci vysílané krom jiného Českou televizí (záznam zde) ředitel Ústavu zdravotnických informací a statistiky v ČR Ladislav Dušek, aby seznámil veřejnost s aktuálním vývojem epidemie koronaviru v ČR a naznačil předpokládaný budoucí vývoj. K předchozímu dni ČR hlásila 1120 případů. Při pohledu na tehdy dostupná data srovnávající vývoj v ČR s dalšími zeměmi Dušek tehdy krom jiného prohlásil, že "Česká republika má před sebou velký otazník, kudy půjde, a všichni si přejeme, aby to nebyl italský scénář..., aby to nebyl španělský scénař, který nevyhnutelně jde italskou cestou. (...)". Dušek dále pokračoval představením tzv. Realistického scénáře vývoje, který počítá na konci dubna s kumulativním počtem 15 000 potvrzených případů. V této souvislosti také konkrétně řekl:

Hodně se mluví o konci března..., tak tam by to mělo být asi 3 000 podle tohoto scénaře.

To bylo 23. března, tj. více než týden před koncem března, v situaci, kdy v ČR byl potvrzen přibližně třetinový počet případů. Dnes již víme, že tento odhad byl poměrně přesný: K 31. březnu ČR evidovala 3308 případů. Zdá se tedy, že lidé na těch správných místech skutečně pracují s kvalitními předpoklady.

Mě tato tisková konference tehdy přiměla k tomu, abych na svém FB profilu zveřejnil vlastní amatérské grafy a modely vývoje epidemie, neboť mi přišlo, že by mohly některým lidem pomoci vidět, že se situace v ČR nevyvíjí až tak špatně, jak ji líčí některá média. Můj jednoduchý model exponenciálního růstu tehdy počítal s cca. 5000 potvrzenými případy na konci března. Zdůrazňoval jsem u něj, že i to je zcela jiná míra nárůstu (resp. denního procentuálního přírůstku), než kterou jsme mohli pozorovat v Itálii, Španělsku, Německu či Spojených státech. Vývoj v posledních dnech toto pozorování potvrdil, když jsem podle nově dostupných dat průběžně snižoval predikci počtu potvrzených případů ve svém modelu. Postupně mi to přivedlo k závěru, že by mohlo být užitečné některá má amatárská pozorovní shrnout v ucelené formě.

Jižní Korea a kulminace

Začněme od konce. Na světě už je dnes několik zemí, kde již současná epidemie kulminovala. Na prvním místě Čína, kde si však současně musíme klást otázku, za jakou cenu, a zda máme kvalitní data. Vývoj v Číně byl velice názorně zdokumentován v tomto odborném článku, který byl následně výrazně zpolurizován v článku od Tomase Pueyoa na serveru medium.com (zde).

Vedle Číny je tu však nyní také Jižní Korea. Na jejím případě je zvláště zajímavé, že zde nákaza kulminovala již cca. při 7500 potvrzených případů. Této hodnoty Jižní Korea dosáhla nějakých 20 dní poté, co registrovala prvních 100 potvrzených případů. Data z posledních dnů naznačují, že se ke kulminaci epidemie snad blíží i Itálie, avšak to po více než dvojnásobné době (viz Obr. 1).

Obr. 1: Srovnání vývoje v Jižní Koreji (A), Itálii (B) a srovnání vývoje v těchto zemích a v ČR (C).

Dostupná data naznačují, že situace v ČR má snad i díky zavedeným opatřením o něco blíže ke korejskému scénáři, byť rozsah testování v ČR je výrazně menší.

area pop popdens gdpcap
Korea, South 98480 51.71M 507 31246
Czech Republic 78866 10.65M 134 40585

Tab. 1: Srovnání Jižní Koreje a ČR co se týče plochy v km2 (area), velikosti populace (pop), hustoty zalidnění (popdens) a hdp na obyvatele v USD (gdpcap).

Srovnání ČR a Jižní Koreji v Tab. 1 především ukazuje, že ČR představuje zemi s menší hustotou zalidnění, a tedy snad i s horšími podmínkami pro šíření nákazy. Kontrolovat epidemii v hustěji zalidněné zemi, jako je Jižní Korea, je podle všeho o něco náročnější. Přesto se to doposud daří. Zásadní podíl na tom nepochybně hrálo masivní testování, které šlo ruku v ruce s důkladným trasováním. Vyhodnotit vliv těchto faktorů však překračuje možnosti tohoto příspěvku.

Smrtnost s ohledem na počet případů

V diskuzích o budoucím vývoji v ČR se občas objevuje argument, že to nemusí dlouho trvat, a že až budeme mít větší počet potvrzených případů, situace u nás může být podobná situaci v Itálii či ve Španělsku. V Itálii doposud zemřelo více než 10% potvrzených případů, ve Španělsku téměř 9% procent. Velkou roli v takto vysokých číslech nepochybně hrají přeplněné nemocnice. Neměli bychom však kvůli tomu přehlédnout, že ve srovnání s ČR či Německem tyto země vykazovaly vysokou smrtnost již v okamžiku, kdy měly 1000, 2000 či 10000 případů (viz Obr. 2). Situace v ČR se zatím ukazuje o něco málo horší než v Německu, ale ne nějak zásadně.

Obr. 2: Smrtnost v procentech podle počtu potvrzených případů ve čtyřech evropských zemích.

Růsty počtu potvrzených případů

Další užitečné informace se můžeme dozvědět srovnáme-li, jak se počty potvrzených případů a počty úmrtí vyvíjely napříč zeměmi v čase. Zde volím dvě nejpostiženější země z jihu Evropy, ČR a Německo reprezentující střední Evropu a Dánsko a Švédsko pro severní Evropu (Obr. 3). 0 na ose x je první den, kdy tyto země zaznamenaly > 100 potvrzených případů. Pro všechny tyto země máme také data dostupná přinejmenším o tři dny dále než v případě ČR, což může být ilustrativní.

Obr. 3: Potvrzené případy nákazy a úmrtí v šesti evropských zemích.

Zdá se, že situace u nás se zatím vyvíjí vcelku podobně jako v Dánsku nebo ve Švédsku (dvě země, které se zásadně liší v zavedených opatřeních). Původně vývoj u nás kopíroval i vývoj v Německu. Nyní se zdá, že sledujeme o něco mírnější trajektorii. Pokud by křivka u nás kopírovala německý vývoj, tak jak se zdálo před čtrnácti dny, měli bychom dnes cca. 20,000 potvrzených případů, to se však nestalo.

Model vývoje se stabilním denním přírůstkem (tj. prostý exponenciální růst)

Nyní si porovnejme vývoj v těchto zemích samostatně a predikujme tři dny dopředu pomocí jednoduchého exponenciálního růstu aproximovaného na základě dat pro každou zemi zvlášť.

Obr. 4: Model vývoje v šesti evropských zemích.

Vidíme zde vcelku zřetelně, že na země v našem výběru tento model již moc nesedí. Aby optimalizační algortimus pomocí jednoho koeficientu přírustku zachytil celý proces, zpravidla nadhodnocuje začátek - neumí zohlednit, že růst se v určité době zpomalil. K zachycení tohoto je potřeba věnovat pozornost jednotlivým zemím samostatně s ohledem na zavedená opatření a jejich opožděné projevy v počtu potvrzených případů. Přesně to je cílem následující sekce pro případ ČR.

Model vývoje v ČR - pohled zpět

Obr. 5: Model vývoje v ČR.

Graf na obrázku 5 ukazuje dohromady několik informací. Souvislá modrá čára zachycuje počty potvrzených případů v ČR od prvního dne, kdy jejich počet překročil 100, až do 31.3.

Oranžová přerušovaná čára představuje extrapolaci exponenciální růstu potvrzených případů na základě dat, která byla k dispozici v pátek 20.3. (tedy případy potvrzené do půlnoci ze čtvrtka na pátek). V tento okamžik to pro ČR nevypadalo příliš příznivě, počítal k 31.3. s téměř 10000 případy. Laická veřejnost mohla propadala depresi, že ač platí karanténa, situace se dále zhoršuje. Odborníci s napětím očekávali, jak budou vypadat data z víkendu, odkdy bylo možné očekávat projev zavedených opatření.

Zelená přerušovaná čára představuje ten samý model, avšak s tím rozdílem, že vychází z dat, která byla dostupná v pondělí 23.3. (tj. ve stejný den, kdy Dušek prezentoval data a odhady svého pracoviště uvedené výše). Vidíme, že data z pátku, soboty a neděle původní odhad zkorigovala na přibližně dvě pětiny. Tato data naznačila, že se nám tu s cca. pětidenním zpožděním začínají projevovat opatření, z nichž nejrazantnější vstoupilo do hry o půlnoci z neděle na pondělí z 15. na 16.3. (viz svislé čáry).

Možný vývoj reálného počtu nakažených v populaci se zde snažím naznačit pomocí souvislé červené čáry. Ta bere počet potvrzených případů ze soboty 21.3. (995 osob) a bere tento počet jako reálný počet nakažených v populaci o pět dní dříve, tj. 16.3.. Zde se pak opět aplikuje exponenciální růst, avšak tentokrát s polovičním přírůstkem, než se kterým počítal plůvodní model z pátku 20.3. (tedy předtím, než lze očekávat projevy zavedených opatření). Jinými slovy, pracuji zde s předpokladem, že zavedená opatření snížila denní přírůstek na polovinu. Model zachycený touto červenou čarou jsem v této podobě generoval v pondělí 23.3. Vidíme, že s ohledem na současný vývoj se zdá být stále vcelku hodnověrný.

Podíl seniorů mezi nakaženými

Ministerstvo zdravotnictví před několika dny zveřejnilo Otevřené datové sady k probíhající epidemii. Tato data obsahují řadu cenných informací, které na globální úrovni seženeme jen těžko. S těmito daty se také velice snadno pracuje, neboť jsou dostupná také v intuitivně strukturovaných souborech json. Jsou zde data pro vývoj počtu testů v čase , ale především datová sada nazvaná Přehled osob s prokázanou nákazou dle hlášení krajských hygienických stanic. Tato sada je unikátní v tom, že pro každý potvrzený případ uvádí i dodatečné demografické informace, především věk. Můžeme se tedy podívat, jak se vyvíjí počet nakažených seniorů.

K 31. březnu je mezi nakaženými 15.647% osob ve věku vyšším než 65 let. (Na výše zmíněné tiskové konferenci Dušek mluvil o tom, že cílem je udržet se právě kolem této hodnoty.) Je bohužel pravdou, že toto procento je v denních přírůstcích z posledních dní vyšší. Na druhou stranu je pravda, že je to celkově stále nižšší procento než celkové zastoupení osob v tomto věku v rámci populace, které činí 19.6% (viz Obr. 6).

Obr. 6: Podíl osob starších 65 let (vlevo) a starších 50 let (vpravo) mezi denními přírůstky.

Na obrázku 6 vpravo vidíme v podstatě totéž, avšak s pohledem na osoby starší 50 let. Červená horizontální čára ukazuje podíl těchto osob mezi potvrzenými případy v Itálii. Vidíme zde, že se jedná o úplně jiné hodnoty.

Prozatimní závěry

Zde si dovolím tento příspěvek prozatím uzavřít. Pokud vás můj pohled na věc zajímá, podívejte se, zda jsem nepublikoval nějaký aktuálnější příspěvek. Dost možná se bude jednat pouze o aktualizaci tohoto s ohledem na nejnovější data.

Jaké jsou tedy ve stručnosti mé závěry?

Stále si kladu za úkol podívat se detailněji na rozdíly v testování napříč evropskými zeměmi. Uvnitř skriptu, na který odkazuji výše, již k tomuto něco mám. Obávám se ale, že bych na tom strávil příliš mnoho času, a tak to prozatím odkládám.