Emergenza Covid: ecco come ottenere l'indice Rt in tempo reale

Termometro COVID - 26 Novembre 2020 7 minuti

Un metodo di calcolo supera i problemi del ritardo medio di tre settimane e l'intervallo di credibilità, garantendo maggiore rapidità di intervento. Il Dipartimento Malattie infettive e Servizio di informatica dell'Istituto superiore di Sanità sarebbe disposto a collaborare?

di Stefano Terna

Seguici su:

Google News

Instagram

In preparazione al Natale, vorrei proporre un calendario dell’Avvento dove dentro ogni sportellino c’è l’indice Rt del giorno. E che ci permetta prima, ma soprattutto durante e dopo le feste di monitorare la situazione in tempo reale.

Grafico 1. L'indice Rt del Covid-19 in Italia

Fonte: elaborazione di Stefano Terna per Mondo Economico su dati Protezione civile e ISS fino al 25 novembre 2020

Il grafico mostra i valori dell’indice Rt calcolati quotidianamente sui dati della Protezione Civile (dati Covid-19 Italia, Rotezione civile, github), raffrontato con i valori pubblicati settimanalmente dall’Istituto Superiore di Sanità (ISS). Il calcolo in tempo reale segue le metodologie consolidate descritte qui: Real Time Bayesian Estimation of the Epidemic Potential of Emerging Infectious Diseases, Luı´s M. A. Bettencourt, Ruy M. Ribeiro, paper e A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics, Anne Cori, Neil M. Ferguson, Christophe Fraser, and Simon Cauchemez, paper and supplementary data). I dettagli tecnici del calcolo, le analisi e i sorgenti sono disponibili pubblicamente su Github a questo link.

In ogni epidemia l’indice Rt è il numero di riproduzione effettivo, o numero di riproduzione real-time (Numero di riproduzione netto al tempo t, Wikipedia). Ci dice quante persone diventano infette al tempo t, per ciascuna già infetta in quel momento.

I pregi dell'indice Rt

Rispetto alla curva dei contagi, l’indice Rt ha due grandi pregi: dipende poco dalla quantità di tamponi che facciamo e reagisce molto rapidamente ai cambiamenti del nostro comportamento sociale. Questo lo rende uno strumento prezioso per agire tempestivamente e monitorare l’efficacia delle misure di contenimento, come spiegato dall’Istituto Superiore di Sanità (FAQ sul calcolo del Rt, Istituto Superiore di Sanità, link).

Analogamente, ci permetterebbe di essere più rapidi con il rilassamento delle misure, come illustrato già ad aprile da Gabriel Leung (Lockdown Can’t Last Forever. Here’s How to Lift It, Gabriel Leung, University of Hong Kong, New York Times), epidemiologo all’Università di Hong Kong. Per esempio, guardando ai risultati (Azienda sanitaria dell’Alto Adige, Risultati dello Screening a livello provinciale per il contenimento del Coronavirus) dei test di massa effettuati dal 20 al 22 novembre potremmo far rientrare subito l’Alto Adige in zona gialla, e poi monitorare la diffusione con l’Rt in tempo reale.

Il procedimento

Andiamo subito a vedere l’Rt per capire la situazione. Con calma e senza fretta: l’ultimo valore disponibile a oggi, pari a 1,18 (95%CI: 0,94 – 1,49), è stato pubblicato il 20 novembre nel bollettino della sorveglianza integrata COVID-19, ed è calcolato come valore medio sul periodo 28 ottobre – 10 novembre. Quindi per tutta questa settimana, fino a venerdì, stiamo discutendo di un valore che ci racconta la situazione media di 3 settimane fa.

Questo ritardo, che ci impedisce di disporre di un Rt real-time, è la somma di due problemi.

Il primo problema: per calcolare l’indice, si dovrebbe conoscere la data in cui ciascun soggetto inizia ad essere contagioso; non essendo disponibile, si utilizza, come migliore approssimazione, la data di inizio sintomi rilevata a posteriori dal medico: per esempio, una persona che ha iniziato ad avere sintomi oggi potrebbe essere contagiosa da 4 giorni ma rilevata tra 6 giorni; questo tempo dipende da molti fattori, tra i quali la pressione sul sistema sanitario; quindi l’ISS scarta i dati più recenti di 8 giorni, il cosiddetto “periodo di consolidamento del dato”.

Il secondo problema: i dati originali contengono fenomeni puntuali, come i focolai, ed errori di rilevazione, come il noto calo dei nuovi positivi il lunedì: per pulire i dati da questo rumore, l’indice Rt viene calcolato come media sui 14 giorni precedenti.

Sommando i due problemi si arriva alle 3 settimane di ritardo.

Il secondo problema, poi, è anche alla base dei tanto discussi intervalli di credibilità: con 95%: 0,94 – 1,49 stiamo dicendo che tra il 28 ottobre e il 10 novembre l’Rt aveva il 95% di probabilità di stare tra 0,94 e 1,49; ma siccome l’indice in quelle due settimane stava scendendo, l’intervallo di credibilità è molto grande semplicemente perché deve tenere conto dei valori iniziali e finali molto diversi nei 14 giorni.

Il metodo di calcolo

Per poter disporre di un Rt real-time e affidabile, ho sviluppato un metodo di calcolo che superi i due problemi riportati, cedendo un po’ di precisione a beneficio della rapidità di intervento.

Il primo problema viene superato approssimando la data in cui un soggetto inizia ad essere contagioso con la data in cui viene rilevato. Il vantaggio è che disponiamo di questo dato aggiornato quotidianamente alle 18. L’approssimazione è prudente, in quanto porta a sottostimare il numero di soggetti contagiosi in un certo momento e quindi eventualmente a sovrastimare l’indice Rt.

Il secondo problema viene superato utilizzando una tecnica di rimozione del rumore che non introduce ritardo, nota come regolarizzazione di Tikhonov (Tikhonov regularization, Wikipedia). Il vantaggio di questa tecnica è che consente di rimuovere gli spike nei nuovi positivi giornalieri, garantendo contemporaneamente che il valore giornaliero dei casi cumulati sia preservato.

Per il resto il calcolo proposto utilizza la stessa metodologia indicata nelle FAQ ⁽⁴⁾dell’ISS, applicando il metodo Markov chain Monte Carlo per la ricerca dell’indice Rt che riproduca in modo ottimale la curva epidemiologica reale entro un intervallo di credibilità misurabile. I risultati del calcolo sono mostrati nel grafico in testa all’articolo.

Qualche conclusione:

l’indice real-time segue e prevede con precisione l’andamento dell’indice ufficiale;
l’intervallo di credibilità, calcolato giorno per giorno, converge a valori molto bassi nel presente;
come atteso, nell’ultimo periodo, l’indice real-time sovrastima lievemente il valore dell’indice ufficiale, per via dell’utilizzo della data di rilevazione come approssimazione della data di inizio della contagiosità;
ad agosto e fino a metà settembre l’indice ufficiale è sensibilmente più basso, in quanto l’ISS rimuove, correttamente, dal conteggio i casi di contagio contratti all’estero, che erano il 27,2% del totale al 18 agosto (Task force COVID-19 del Dipartimento Malattie Infettive e Servizio di Informatica, Istituto Superiore di Sanità. Epidemia COVID-19, Aggiornamento nazionale: 18 agosto 2020), rispetto allo 0,7% al 18 novembre (Task force COVID-19 del Dipartimento Malattie Infettive e Servizio di Informatica, Istituto Superiore di Sanità. Epidemia COVID-19, Aggiornamento nazionale: 18 novembre 2020).

Che cosa si potrebbe migliorare?

Per esempio, si potrebbero conteggiare correttamente i casi di contagio contratti all’estero e si potrebbe stimare l’effetto delle approssimazioni sulla data di inizio contagiosità. Ma per questo ci vorrebbero i dati processati dall’ISS, pubblicati sotto forma di file scaricabili, mentre ad oggi sono disponibili solo nei report e nelle infografiche.

Mi rivolgo pertanto ai colleghi del Dipartimento Malattie Infettive e Servizio di Informatica dell’ISS per ringraziarli per il preziosissimo lavoro che svolgono, per richiedere la pubblicazione dei dati e per offrire la mia disponibilità a un confronto di approfondimento sul calcolo proposto.

I nostri tags:
covid
Domenico Arcuri
Rt Indice
ISS
Dpcm

Stefano Terna

Stefano Terna (Torino 1972). Imprenditore. Fisico. È co-fondatore e amministratore delegato di TomorrowData, società specializzata nello sviluppo e nell'implementazione di algoritmi di IA sia sul cloud che sull'hardware vincolato (il cosiddetto edge computing). È stato lead developer in più di 30 progetti nei settori automotive, bancario, farmaceutico, energetico, telco (freelance, 2008-oggi). Banche e telco security software product manager (SAET IS Srl, 2004-2008). Consulente tecnologico nella business unit servizi finanziari (Accenture, 2000-2004). Ha un dottorato di ricerca in Teoria delle Stringhe (SISSA Trieste, 1996-2000). I suoi interessi di ricerca includono le reti neurali ricorrenti applicate alla previsione e al rilevamento di anomalie di serie temporali multivariate. È stato membro dell'Advisory Board per il Master of Science in Data Analytics della University of Central Florida nel 2016.

Ultimi articoli

Diritti e Libertà

05 Agosto 2025 9 minuti

Una politica di opposizione all'altezza dei tempi: ecologica, sociale e decoloniale

Il movimento Les soulèvements de la terre nasce in Francia nel gennaio 2021 con l'obiettivo di far tornare l’ecologia con i piedi per terra. Le strategie di lotta sociale, legate alla ricerca di una forma di sussistenza diversa da quella imposta, non mirano solo alla difesa dell'ambiente e alla simbiosi con la natura, ma mettono in discussione le basi materiali stesse del capitalismo.

di Claudia Terra

Sostenibilità e futuro

30 Luglio 2025 11 minuti

I professionisti della cultura sono pronti per l'era dell’IA?

La transizione digitale del settore culturale è una delle sfide del PNRR e la rivoluzione dell’IA è destinata ad avere un'influenza sempre maggiore. Come è stata accolta questa tecnologia e quali strategie sono state messe finora in campo a livello istituzionale e privato?

di Maria Caligaris, Rossella Lombardo, Melissa Macaluso