20/06/2020

Cosa succede quando si utilizzano dati non consolidati?

“I dati raccolti sono in continua fase di consolidamento e, come prevedibile in una situazione emergenziale, alcune informazioni sono incomplete”

(da ISS – Sorveglianza integrata COVID-19)

Dal momento che i nuovi casi positivi comunicati ogni giorno risalgono a tamponi ricevuti dai laboratori di diagnosi nei giorni precedenti occorre guardare con molta cautela ai dati quotidianamente diffusi dalla Protezione Civile. D’altra parte anche i dati caricati dalle regioni nella Piattaforma di Sorveglianza Integrata Covid-19 – e utilizzati da ISS per calcolare ad esempio l’incidenza settimanale – subiscono variazioni nei giorni successivi all’elaborazione dei report.

Per la Regione Lombardia – come spiegato in un preciso articolo di Lorenzo Ruffino – è quotidianamente disponibile il dato relativo al numero di tamponi positivi distribuiti in base al giorno in cui i laboratori di analisi hanno ricevuto i tamponi e tale dato è allineato con quello che viene regolarmente comunicato dalla Regione Lombardia a ISS.

I grafici seguenti offrono un confronto tra i dati pubblicati settimanalmente da ISS nei report, quelli della Protezione Civile e i dati più consolidati a disposizione sulla dashboard ArcGIS di Regione Lombardia. Se eventuali indici calcolati a partire dai dati forniti dalla Protezione Civile possono risultare imprecisi, i grafici mostrano come gli indici calcolati dall’ISS dovrebbero essere sempre considerati un limite inferiore. In altri termini quando ad esempio si afferma che l’incidenza di una data settimana è stata pari a X casi ogni 100mila abitanti, sarebbe più corretto affermare che l’incidenza è stata almeno X, in quanto nelle settimane successive i dati potrebbero crescere, anche sensibilmente.


Uno storico dei dati di Regione Lombardia è disponibile sul prezioso GitHub di OnData.