Risolvere il mistero del grafico dentellato del COVID

Il mistero del grafico dentellato del COVID' risolto

Ridurre la risoluzione dei dati alla giusta risoluzione con pandas

DreamShaper_v7_un_monitor_del_computer_che_mostra_un_grafico_con_una_linea_blu_sdentata (dall'autore & Leonardo AI)

Nel primo anno della pandemia COVID-19, il numero di morti causate dalla malattia è stato oggetto di molte controversie. Tra le questioni sollevate vi era la sottostima iniziale a causa della mancanza di test, la mancanza di registrazione dei decessi al di fuori degli ospedali e la distinzione tra morti per COVID-19 e morti con COVID-19 [1][2].

Inoltre, e per sfortuna di tutti, la pandemia è diventata rapidamente politicizzata. I commentatori di parte hanno approfittato di ogni dato, cercando modi per distorcerlo a proprio vantaggio. Il bias di conferma si è diffuso. Se eri sui social media all’epoca, probabilmente hai visto post che mettevano in discussione la veridicità dei grafici ufficiali.

In questo progetto di Data Science di Successo Rapido, esamineremo un grafico particolare che è apparso sul mio profilo Facebook all’epoca. Il grafico registra le morti per COVID-19 negli Stati Uniti durante il primo anno della pandemia e mostra una natura distintamente seghettata o “a dente di sega”.

Le oscillazioni della curva hanno una frequenza elevata e è dubbio che la malattia si sia sviluppata in questo modo. Mentre alcuni consideravano questo come una prova che i conteggi delle morti per COVID erano chiaramente errati e non potevano essere affidabili, coloro di noi fortunati ad avere competenze in Data Science hanno rapidamente risolto questo mistero esagerato.

Il Dataset

I dati che utilizzeremo sono stati raccolti come parte di “The COVID Tracking Project” su The Atlantic [3]. Include statistiche COVID-19 dal 3 marzo 2020 al 7 marzo 2021. Per ridurre le dimensioni del dataset, ho scaricato i dati solo per lo stato del Texas e li ho salvati come file CSV in questo Gist.

Puoi trovare il dataset originale qui e la licenza per i dati qui.

Installazione delle librerie

Oltre a Python, avremo bisogno della libreria pandas. Puoi installarla usando uno dei seguenti comandi:

conda install pandas

o

pip install pandas