In preparazione al Natale, vorrei proporre un calendario dell’Avvento dove dentro ogni sportellino c’è l’indice Rt del giorno. E che ci permetta prima, ma soprattutto durante e dopo le feste di monitorare la situazione in tempo reale.
Il grafico mostra i valori dell’indice Rt calcolati quotidianamente sui dati della Protezione Civile (dati Covid-19 Italia, Rotezione civile, github), raffrontato con i valori pubblicati settimanalmente dall’Istituto Superiore di Sanità (ISS). Il calcolo in tempo reale segue le metodologie consolidate descritte qui: Real Time Bayesian Estimation of the Epidemic Potential of Emerging Infectious Diseases, Luı´s M. A. Bettencourt, Ruy M. Ribeiro, paper e A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics, Anne Cori, Neil M. Ferguson, Christophe Fraser, and Simon Cauchemez, paper and supplementary data). I dettagli tecnici del calcolo, le analisi e i sorgenti sono disponibili pubblicamente su Github a questo link.
In ogni epidemia l’indice Rt è il numero di riproduzione effettivo, o numero di riproduzione real-time (Numero di riproduzione netto al tempo t, Wikipedia). Ci dice quante persone diventano infette al tempo t, per ciascuna già infetta in quel momento.
I pregi dell'indice Rt
Rispetto alla curva dei contagi, l’indice Rt ha due grandi pregi: dipende poco dalla quantità di tamponi che facciamo e reagisce molto rapidamente ai cambiamenti del nostro comportamento sociale. Questo lo rende uno strumento prezioso per agire tempestivamente e monitorare l’efficacia delle misure di contenimento, come spiegato dall’Istituto Superiore di Sanità (FAQ sul calcolo del Rt, Istituto Superiore di Sanità, link).
Analogamente, ci permetterebbe di essere più rapidi con il rilassamento delle misure, come illustrato già ad aprile da Gabriel Leung (Lockdown Can’t Last Forever. Here’s How to Lift It, Gabriel Leung, University of Hong Kong, New York Times), epidemiologo all’Università di Hong Kong. Per esempio, guardando ai risultati (Azienda sanitaria dell’Alto Adige, Risultati dello Screening a livello provinciale per il contenimento del Coronavirus) dei test di massa effettuati dal 20 al 22 novembre potremmo far rientrare subito l’Alto Adige in zona gialla, e poi monitorare la diffusione con l’Rt in tempo reale.
Il procedimento
Andiamo subito a vedere l’Rt per capire la situazione. Con calma e senza fretta: l’ultimo valore disponibile a oggi, pari a 1,18 (95%CI: 0,94 – 1,49), è stato pubblicato il 20 novembre nel bollettino della sorveglianza integrata COVID-19, ed è calcolato come valore medio sul periodo 28 ottobre – 10 novembre. Quindi per tutta questa settimana, fino a venerdì, stiamo discutendo di un valore che ci racconta la situazione media di 3 settimane fa.
Questo ritardo, che ci impedisce di disporre di un Rt real-time, è la somma di due problemi.
Il primo problema: per calcolare l’indice, si dovrebbe conoscere la data in cui ciascun soggetto inizia ad essere contagioso; non essendo disponibile, si utilizza, come migliore approssimazione, la data di inizio sintomi rilevata a posteriori dal medico: per esempio, una persona che ha iniziato ad avere sintomi oggi potrebbe essere contagiosa da 4 giorni ma rilevata tra 6 giorni; questo tempo dipende da molti fattori, tra i quali la pressione sul sistema sanitario; quindi l’ISS scarta i dati più recenti di 8 giorni, il cosiddetto “periodo di consolidamento del dato”.
Il secondo problema: i dati originali contengono fenomeni puntuali, come i focolai, ed errori di rilevazione, come il noto calo dei nuovi positivi il lunedì: per pulire i dati da questo rumore, l’indice Rt viene calcolato come media sui 14 giorni precedenti.
Sommando i due problemi si arriva alle 3 settimane di ritardo.
Il secondo problema, poi, è anche alla base dei tanto discussi intervalli di credibilità: con 95%: 0,94 – 1,49 stiamo dicendo che tra il 28 ottobre e il 10 novembre l’Rt aveva il 95% di probabilità di stare tra 0,94 e 1,49; ma siccome l’indice in quelle due settimane stava scendendo, l’intervallo di credibilità è molto grande semplicemente perché deve tenere conto dei valori iniziali e finali molto diversi nei 14 giorni.
Il metodo di calcolo
Per poter disporre di un Rt real-time e affidabile, ho sviluppato un metodo di calcolo che superi i due problemi riportati, cedendo un po’ di precisione a beneficio della rapidità di intervento.
Il primo problema viene superato approssimando la data in cui un soggetto inizia ad essere contagioso con la data in cui viene rilevato. Il vantaggio è che disponiamo di questo dato aggiornato quotidianamente alle 18. L’approssimazione è prudente, in quanto porta a sottostimare il numero di soggetti contagiosi in un certo momento e quindi eventualmente a sovrastimare l’indice Rt.
Il secondo problema viene superato utilizzando una tecnica di rimozione del rumore che non introduce ritardo, nota come regolarizzazione di Tikhonov (Tikhonov regularization, Wikipedia). Il vantaggio di questa tecnica è che consente di rimuovere gli spike nei nuovi positivi giornalieri, garantendo contemporaneamente che il valore giornaliero dei casi cumulati sia preservato.
Per il resto il calcolo proposto utilizza la stessa metodologia indicata nelle FAQ (4) dell’ISS, applicando il metodo Markov chain Monte Carlo per la ricerca dell’indice Rt che riproduca in modo ottimale la curva epidemiologica reale entro un intervallo di credibilità misurabile. I risultati del calcolo sono mostrati nel grafico in testa all’articolo.
Qualche conclusione:
- l’indice real-time segue e prevede con precisione l’andamento dell’indice ufficiale;
- l’intervallo di credibilità, calcolato giorno per giorno, converge a valori molto bassi nel presente;
- come atteso, nell’ultimo periodo, l’indice real-time sovrastima lievemente il valore dell’indice ufficiale, per via dell’utilizzo della data di rilevazione come approssimazione della data di inizio della contagiosità;
- ad agosto e fino a metà settembre l’indice ufficiale è sensibilmente più basso, in quanto l’ISS rimuove, correttamente, dal conteggio i casi di contagio contratti all’estero, che erano il 27,2% del totale al 18 agosto (Task force COVID-19 del Dipartimento Malattie Infettive e Servizio di Informatica, Istituto Superiore di Sanità. Epidemia COVID-19, Aggiornamento nazionale: 18 agosto 2020), rispetto allo 0,7% al 18 novembre (Task force COVID-19 del Dipartimento Malattie Infettive e Servizio di Informatica, Istituto Superiore di Sanità. Epidemia COVID-19, Aggiornamento nazionale: 18 novembre 2020).
Che cosa si potrebbe migliorare?
Per esempio, si potrebbero conteggiare correttamente i casi di contagio contratti all’estero e si potrebbe stimare l’effetto delle approssimazioni sulla data di inizio contagiosità. Ma per questo ci vorrebbero i dati processati dall’ISS, pubblicati sotto forma di file scaricabili, mentre ad oggi sono disponibili solo nei report e nelle infografiche.
Mi rivolgo pertanto ai colleghi del Dipartimento Malattie Infettive e Servizio di Informatica dell’ISS per ringraziarli per il preziosissimo lavoro che svolgono, per richiedere la pubblicazione dei dati e per offrire la mia disponibilità a un confronto di approfondimento sul calcolo proposto.
© Riproduzione riservata