[Forum SIS] Modelli SIR e COVID

Roberto Battiston roberto.battiston a unitn.it
Lun 20 Apr 2020 16:17:01 CEST


Cari Colleghi, 

 

      inizio  con piacere a partecipare a questo Forum e ringrazio Giuseppe e Giorgio per avermi invitato. 

 

      Mi inserisco nella discussione partendo da alcuni aspetti che mi interessano particolarmente. La mia nota che Giuseppe ha circolato è scritta in linguaggio estremamente semplice, non è pensata per questa lista di esperti. Però alcuni aspetti metodologici mi interesserebbe approfondirli.

 

      Il primo riguarda la questione  del modello SIR  con beta variabile che viene usato nella vs analisi.  Mi piacerebbe capire il fondamento teorico di questa scelta. Come ho scritto a Giuseppe, ho lavorato nelle scorse settimane variando beta nel tempo, in particolare prima e dopo il lockout, ma non ho trovato traccia di questo approccio in letteratura e alla fine mi sono deciso di variare solo S all’inizio e al lock in, rispettivamente . In altri termini, si può usare un modello con beta variabile e si possono cercare di ottimizzare i parametri, ma non è più un modello SIR tradizionale, nel senso che il significato di beta, come forza dell’ epidemia moltiplicata per il numero di opportunità di contagio, viene ad essere modificato in modo  che  non  mi risulta chiaro. 

 

Modificando S al lockout  senza cambiare beta ottengo due risultati :
il primo che uso un modello SIR classico. Il secondo è che mentre S(0) pre lockout è un numero a tutti gli effetti molto grande ed indefinito, S(lockout)=S’  è un numero che viene derivato come gli altri parametri,  beta e gamma, e disegna una popolazione ridotta all’ interno della quale si esaurisce l’epidemia con le modalità normali, ma solo in un contesto molto più ridotto. S’ risulta circa 300 volte meno della popolazione della regione ( o della nazione).  Questa popolazione S’, tra l’altro, ha un significato molto preciso: è la quantità di persone che vorremmo tracciare e isolare per debellare l’epidemia. Molte di esse sappiamo già chi sono : i parenti che hanno in casa un infetto, il personale sanitario, i lavoratori a rischio. L’informazione interessante è che si tratta di “poche” persone, ma essenziali per il controllo dell’epidemia. 
il secondo che rimango nell’ ambito SIR
 

Operando in questo modo ho ottenuto i risultati fino al 17 aprile che ieri Giuseppe vi ha allegato: essendo un ppt credo sia illeggibile (lo vedo come bin). Lo rimando in pdf (file ALL_Regions.pdf). Da questo panorama vengono a galla già alcuni trend, ad esempio l’andamento dell’ Umbria, da manuale: una popolazione già molto avanti nel rientro dal’ epidemia nella fase post lockdown. Inoltre appare chiaro che abbiamo un problema di qualità di dati in Lombardia

 

Ieri ho affrontato  un altro problema: nei   fit SIR  1/gamma risultava troppo grande  (anche 80-90 giorni). Sappiamo che 1/gamma  deve essere dell’ ordine di 20-30 gg. Per risolvere la questione ho introdotto un parametro di ritardo nei termini SIR che moltiplicano gamma, vale a dire  gamma * I(t)  gamma * I(t-phi), per tenere conto di fattori di ritardo nella certificazione del passaggio tra Infetto a Resistente.  In questo modo i fit sono migliorati molto in tutti i casi in cui il massimo di I(t)  era stato raggiunto e iniziava la discesa.

 

Il nuovo file è allegato (20_aprile_SIR_ALL_REGIONS): i risultati sono molto migliori ed il pattern tra regioni che hanno superato il massimo in I(t) e quelle che ancora non ci sono arrivate è molto chiaro. La tendenza di tutte le regioni è di ottimizzare con beta intorno a 0.15-0.2  e gamma intorno a 20-25. E’ altresì chiara la qualità dei dati forniti dalle diverse regioni: la i dati della Lombardia pongono un grosso problema interpretativo.  

 

Alla luce di quanto condiviso, vorrei chiedervi le seguenti tra cose

 
quali sono i fondamenti teorici dell’approccio con beta (e gamma?) variabile?
come viene calcolato Ro variabile (che di nuovo non è previsto variare nel SIR: quello che può variare è solo Refficace) ?
come tenete conto della qualità del dato fornito dalle varie regioni ?
che sensibilità avete sul parametro  gamma se non introducete un parametro di ritardo ?
 

Cordiali saluti 

 

Roberto Battiston

 

 

 

 

 

 

 

     

-------------- parte successiva --------------
Un allegato HTML è stato rimosso...
URL: <http://www.stat.unipg.it/pipermail/sis/attachments/20200420/31ce28bf/attachment-0001.html>
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome:        ALL_Regions.pdf
Tipo:        application/pdf
Dimensione:  1757799 bytes
Descrizione: non disponibile
URL:         <http://www.stat.unipg.it/pipermail/sis/attachments/20200420/31ce28bf/attachment-0002.pdf>
-------------- parte successiva --------------
Un allegato non testuale è stato rimosso....
Nome:        20_aprile_SIR_ALL_REGIONS[7].pdf
Tipo:        application/pdf
Dimensione:  1655190 bytes
Descrizione: non disponibile
URL:         <http://www.stat.unipg.it/pipermail/sis/attachments/20200420/31ce28bf/attachment-0003.pdf>


Maggiori informazioni sulla lista Sis