Indice Rt, c'è troppa confidenza con l'intervallo

Termometro COVID - 16 Dicembre 2020 6 minuti

I valori stanno salendo da qualche giorno. Mentre, sui calcoli, continua la disputa sulla «forchetta» degli errori con ISS e Fondazione Bruno Kessler.

di Stefano Terna

Seguici su:

Google News

Instagram

Il valore dell’indice Rt in tempo reale calcolato su Mondo Economico continua a salire ormai da qualche giorno: dallo 0,79 di martedì scorso allo 0,86 di oggi (qui i risultati dei nostri conti). Contemporaneamente l’Ansa ha pubblicato con grande enfasi l’Rt di Roberto Battiston, anch’esso crescente oggi a 0,89. Il metodo di Battiston si ripromette di risolvere le discrepanze dei quattro modelli attualmente disponibili inventandone un quinto. In particolare si sottolinea, ricavando il risultato direttamente dai dati, come questo non sia affetto dalla significativa forchetta di errore come nel caso in cui venga determinato usando un modello probabilistico (con buona pace di 257 anni di statistica bayesiana).

Le forchette di errore non sono un problema in sé, anzi, come ci insegnano gli statistici, sono un prezioso strumento per valutare l’affidabilità di un indicatore.

Ma allora, perchè tutti se la prendono con le forchette di errore con cui l’ISS comunica il valore di Rt? Il 15 novembre era intervenuto Giorgio Parisi sull'HuffPost con L'indice Rt è inaffidabile. Poi Roberto Battiston il 20 novembre con Un modo semplice per calcolare R(t) su Scienza in Rete. Infine noi, qui il 26 novembre, dove ponevamo il problema che calcolare un intervallo di confidenza su un periodo di 14 giorni significa mescolare incertezza e trend, come reso evidente da questo grafico che sovrappone i valori assoluti degli intervalli di confidenza e le differenze prime dei valori di Rt pubblicati:

In statistica le “forchette” si chiamano intervalli di confidenza e sono un concetto ben definito: pubblicare l’Rt con intervallo di confidenza al 95%, significa annunciare che l’Rt ha il 95% di possibilità di stare all’interno dell’intervallo.

Prendiamo il dato pubblicato l’11 novembre e relativo al 28 ottobre: Rt a 1,43 con forchetta tra 1,08 e 1,81: nella parte bassa si va verso le zone gialle, nella parte alta ci sono le zone ultra-rosse; quindi il dato diventa sostanzialmente inutile per chi deve prendere le decisioni.

Possibile? È un problema di eccessiva pressione sul sistema sanitario e di dati che arrivano troppo in ritardo? È un problema di algoritmi probabilistici troppo complicati?

No, il calcolo dell’intervallo di confidenza 95% era semplicemente sbagliato, e infatti improvvisamente ISS-FBK cambiano nome, e dopo averlo chiamato “95% CI” per 13 settimane, dal 2 dicembre lo ribattezzano “range” (al fondo dell’articolo trovate una tabellina che riporta lo storico delle pubblicazioni); “confidenza 95%” scompare e rimane “intervallo” (o “range” che fa più fine). Che cosa potrebbe essere questo intervallo, forse un minimo e un massimo? Esatto. FBK ha reso noto, in una nota pubblicata solo il 7 dicembre insieme ai dati, il metodo di calcolo del “range”: a pagina 5 si spiega che i bollettini ISS riportano il minimo e il massimo sui 14 giorni del 95% percentile delle distribuzioni R(t), ovvero, spiega sempre la nota, i range riportati danno conto sia dell’alta variabilità delle stime sui focolai estivi, che dei periodi in cui la trasmissibilità è variata significativamente.

Come dire: leggendo Rt 1,43 con intervallo di confidenza (oggi range) 1,08 - 1,81 non sappiamo se si tratta:

di una grande incertezza nella stima,
di una forte diminuzione dell’Rt,
di un rapido aumento dell’Rt.

Invece di dire che l’Rt stava diminuendo, e di quanto, ISS e FBK hanno preferito dire che eravamo incerti e che forse stava addirittura risalendo.

Mentre avrebbero potuto comunicare al governo e ai cittadini che stava scendendo ad una velocità di circa 0,4 a settimana, con un intervallo di confidenza 95% inferiore a 0,1 e non con una forchetta di 0,73. Ci saremmo anche risparmiati qualche polemica sull’interpretazione degli intervalli di confidenza.

Noi non abbiamo inventato un nuovo metodo, abbiamo posto due problemi e proposto due soluzioni da applicare al metodo consolidato Markov Chain Monte Carlo. Per la seconda necessitavamo dei positivi per data inizio sintomi, finalmente pubblicati dal 7 dicembre.

Stiamo facendo i conti. Stay tuned.

L'evoluzione. Tabella storica delle pubblicazioni dell’indice Rt da parte di ISS (dati rilevati il 13 dicembre 2020)

Data del report	Valore di Rt	Periodo a cui si riferisce l’Rt
9 dicembre 2020	0,82 (range 0,76 – 0,91)	18 novembre – 1 dicembre
2 dicembre 2020	0,91 (range 0,79 – 1,08)	11 – 24 novembre
25 novembre 2020	1,08 (95%CI: 0,91 – 1,25)	04 – 17 novembre
18 novembre 2020	1,18 (95%CI: 0,94 – 1,49)	28 ottobre– 10 novembre
11 novembre 2020	1,43 (95% CI: 1,08 – 1,81)	22 ottobre - 4 novembre
9 novembre 2020	1,72 (95%CI: 1,45 – 1,83)	15 - 28 ottobre
30 ottobre 2020	1,70 (95%CI: 1,49 – 1,85)	08 - 21 ottobre 2020
23 ottobre 2020	1,50 (95%CI: 1,09 -1,75)	01 - 14 ottobre 2020
15 ottobre 2020	1,17 (95%CI: 1,03 - 1,50)	24 settembre - 07 ottobre
9 ottobre 2020	1,06 (95% CI: 0,97 – 1,16)	17 - 30 settembre
2 ottobre 2020	1,01 (95%CI: 0,88 – 1,08)	10-23 settembre
25 settembre 2020	0,95 (95%CI: 0,88 – 1,05)	3 - 16 settembre
18 settembre 2020	0,92 (95% CI: 0.79 – 1.17)	27 agosto al 9 settembre
11 settembre 2020	1.14 (95%CI:0.71 – 1.53)	20 agosto - 2 settembre
4 settembre 2020	1.18 (95%CI:0.86 – 1.43)	13-26 agosto
27 agosto 2020	0.75 (0.52 – 1.24)	6-19 agosto
20 agosto 2020	0.83 (0.67 – 1.06)	30 luglio - 12 agosto
14 agosto 2020	0.96 (0.75 – 1.2)	23 luglio - 5 agosto

Fonte: elaborazione di Stefano Terna per Mondo Economico su dati Protezione civile e ISS

Stefano Terna

Stefano Terna (Torino 1972). Imprenditore. Fisico. È co-fondatore e amministratore delegato di TomorrowData, società specializzata nello sviluppo e nell'implementazione di algoritmi di IA sia sul cloud che sull'hardware vincolato (il cosiddetto edge computing). È stato lead developer in più di 30 progetti nei settori automotive, bancario, farmaceutico, energetico, telco (freelance, 2008-oggi). Banche e telco security software product manager (SAET IS Srl, 2004-2008). Consulente tecnologico nella business unit servizi finanziari (Accenture, 2000-2004). Ha un dottorato di ricerca in Teoria delle Stringhe (SISSA Trieste, 1996-2000). I suoi interessi di ricerca includono le reti neurali ricorrenti applicate alla previsione e al rilevamento di anomalie di serie temporali multivariate. È stato membro dell'Advisory Board per il Master of Science in Data Analytics della University of Central Florida nel 2016.

Ultimi articoli

Diritti e Libertà

05 Agosto 2025 9 minuti

Una politica di opposizione all'altezza dei tempi: ecologica, sociale e decoloniale

Il movimento Les soulèvements de la terre nasce in Francia nel gennaio 2021 con l'obiettivo di far tornare l’ecologia con i piedi per terra. Le strategie di lotta sociale, legate alla ricerca di una forma di sussistenza diversa da quella imposta, non mirano solo alla difesa dell'ambiente e alla simbiosi con la natura, ma mettono in discussione le basi materiali stesse del capitalismo.

di Claudia Terra

Sostenibilità e futuro

30 Luglio 2025 11 minuti

I professionisti della cultura sono pronti per l'era dell’IA?

La transizione digitale del settore culturale è una delle sfide del PNRR e la rivoluzione dell’IA è destinata ad avere un'influenza sempre maggiore. Come è stata accolta questa tecnologia e quali strategie sono state messe finora in campo a livello istituzionale e privato?

di Maria Caligaris, Rossella Lombardo, Melissa Macaluso