HYDE PARK

Wiarygodność statystyk covidowych

23/10/2020

915 Wyświetlenia

0 Komentarze

3 minut czytania

Ostatnio uwagę moją zwrócił artykuł autorstwa Davida Mackie w portalu „Sign of the Times”, przedstawiający prostą analizę efektywności niedoskonałej metody do testowania rzadkich przypadków. Wyniki są ciekawe, szczególnie w kontekście covidowym.

Ostatnio uwagę moją zwrócił w artykuł autorstwa Davida Mackie w portalu „Sign of the Times” (sott), przedstawiający prostą analizę efektywności niedoskonałej metody do testowania rzadkich (i nie całkiem rzadkich) przypadków. Zastosowana tam matematyka jest na poziomie szkoły podstawowej, jednak wyniki są co najmniej ciekawe szczególnie jeśli przyłożyć je do epidemii covidowej.

Korzystając z przedstawionej metody dokonałem następujących założeń:

populacja: 100 000 osób; częstość występowania infekcji: 1%; wiarygodność testu: 95% (uzyskana z prawdopodobieństwa osoby zdrowej zdiagnozowanej jako chora, równego 5%). Prawdopodobieństwo wyniku fałszywie negatywnego (to znaczy osoby chorej zdiagnozowanej jako zdrowa, założone jako zero).

Dało to następujące wyniki:

ilość osób zainfekowanych: 1000, (100 000 x 1%)

ilość osób zdrowych: 99 000, (100 000 – 1000)

fałszywe pozytywne wyniki testu: 4 950 osób (99 000 x 5%)

rzeczywiste prawdopodobieństwo infekcji przy pozytywnym wyniku testu: 16,81%, (1000/(4950+1000).

Tak więc przy wiarygodności testu na poziomie 95%, czyli dość dużej, rzeczywiste prawdopodobieństwo infekcji wyniesie zaledwie ok 17%.

Przedstawione formuły obliczeniowe wpisałem w arkusz kalkulacyjny i sprawdziłem wynik dla oficjalnych danych z epidemii w Polsce na 19 października 2 020:

liczba przetestowanych osób: 3 850 148; liczba zakażeń 165 951,

daje to:

liczba osób zdrowych: 3 684 197, fałszywe pozytywne wyniki: 3 684 197 x 5% = 184 210

rzeczywiste prawdopodobieństwo zakażenia: 47,39% (165 951/(184 210+165 951))

Niestety oficjalne dane nie podają wiarygodności testów, więc zmuszony byłem uczynić założenie 95%. W rzeczywistości może być gorzej.

W praktyce należało powtórzyć iterację korygując liczbę zakażeń i korzystając z obliczonego prawdopodobieństwa 47.39%. Da to nową, bardziej realistyczną liczbę zakażeń równą 78 649 i nowe prawdopodobieństwo infekcji przy pozytywnym wyniku testu, równe 29,43%.

Jest to bardzo ciekawy wynik i jest on skutkiem tego, że przy stosunkowo rzadkim występowaniu zakażeń liczba osób zdrowych jest wielokrotnie większa i daje to dużą ilość fałszywych pozytywnych wyników przy niedoskonałej metodzie testowania.

Należałoby zadać pytanie decydentom odpowiedzialnym za obostrzenia związane z epidemią, czy zatrudniają kompetentnych doradców z podstawową znajomością matematyki. Bo o to, że sami mają taką umiejętność – historyków, prawników i specjalistów od politologii, raczej bym nie podejrzewał.

Bogdan Goczyński

P.S. 24.10.2020. po opublikowaniu postu zdałem sobie sprawę z niedoskonałości moich obliczeń opartych na oficjalnych danych i nieścisłych założeniach. Dlatego spróbowałem zastosować opisaną metodę w sposób bardziej precyzyjny i zobaczyć wyniki przy założonych częstości infekcji i wiarygodności testu. Wpisałem zatem w arkusz kalkulacyjny częstość infekcji równą zero i wiarygodność testu równą 95,69% a więc nieco lepszą od użytej wcześniej. Wynik jest nadzwyczaj ciekawy. Testy pokażą 165,941 zakażeń czyli praktycznie tyle, ile zakażeń zostało podane oficjalnie. Jednak będą to wyniki fałszywie pozytywne.