Cosi' e' la vita: una sequenza di stati che puo' essere prevista

Cosi' e' la vita: una sequenza di stati che puo' essere prevista

BONETTI, PICCARRETA E LA COAUTRICE SALFORD COSTRUISCONO UN MODELLO PER PREVEDERE LE TRAIETTORIE DI VITA, IN UN ARTICOLO PUBBLICATO SU DEMOGRAPHY

La Sequence analysis (SA) è diventata una delle tecniche più utilizzate e più discusse per descrivere le traiettorie di vita (life course). Per ogni individuo si registrano le attività o stati che sperimenta in un certo periodo e la sua traiettoria di vita è rappresentata come una sequenza finita (una collezione ordinata) di stati.

In Parametric and Nonparametric Analysis of Life Courses: An Application to Family Formation Patterns (Demography, June 2013, Volume 50, Issue 3, pp 881-902 doi: 10.1007/s13524-012-0191-z) Marco Bonetti (Dipartimento di Analisi delle Politiche e Management Pubblico), Raffaella Piccarreta (Dipartimento di Scienze delle Decisioni) e Gaia Salford (Santander Private Banking) si focalizzano sulle donne, e in particolare sulla maternità e sui percorsi di formazione della famiglia (i dati sono estratti dalle Fertility and Family Surveys). Per ogni donna considerano gli stati sperimentati mensilmente tra i 18 e i 30 anni: vivere senza un partner (N), in convivenza – da sposata (M) o non sposata (U) – e avere o non avere almeno un figlio (NC, UC, MC). Solitamente, si osserva la permanenza in uno stato per un certo periodo di tempo (durata dello stato): perciò la sequenza può essere rappresentata come una lista degli stati visitati, v, e della loro durata, t. Per esempio, se una donna è vissuta senza un partner per 22 mesi, ha poi convissuto per 27, ha vissuta nuovamente da single per 31, si è poi sposata ed è rimasta tale per 64 mesi, si ha v = (N,U,N,M) e t = (22,27,31,64).

Gli autori si focalizzano sulla dipendenza delle sequenze da un insieme di covariate categoriche: in particolare gli autori vogliono valutare se si osservano sequenze significativamente diverse per gruppi di donne con diverse caratteristiche socio-demografiche: coorte di nascita, livello di istruzione (anni di istruzione dopo i 15 anni di età), religiosità, e il fatto di avere o non avere genitori separati.

Un possibile approccio è definire un criterio adatto a misurare le differenze tra sequenze, utilizzare una cluster analysis per raggruppare le traiettorie, e prevedere l’appartenenza a un cluster usando modelli di regressione multinomiale. La semplificazione dalle sequenze ai cluster è ragionevole solo se le traiettorie delle donne in uno stesso cluster sono molto simili. In molte applicazioni, questo risultato può essere raggiunto solo aumentando il numero dei cluster: esiste un trade-off tra la necessità di ottenere un numero potenzialmente elevato di cluster molto omogenei e l’opportunità di costruire una variabile dipendente con pochi livelli per evitare stime inaccurate nel modello multinomiale.

Un’altra possibilità è verificare le differenze tra gruppi di sequenze con differenti livelli di una variabile categorica tramite test di ipotesi. Per farlo, si può ricorrere a un’estensione non parametrica dell’analisi di varianza (ANOVA) all’analisi di dissimilarità (ANODI) o allo studio non parametrico dell’intera distribuzione delle dissimilarità inter-sequenze. Un limite di questi approcci è che indicano quali covariate sono statisticamente significative, ma non forniscono una stima quantitativa del loro effetto.

Gli autori introducono un modello parametrico di cambiamento di stato teso a descrivere l’evoluzione delle traiettorie di vita condizionata alle covariate e al fatto di avere osservato un segmento iniziale della traiettoria. Il modello, che rientra nell’ampia famiglia dei modelli di multistate event history, sfrutta pienamente la natura longitudinale dei dati di sequenza e usa modelli di regressione per descrivere il tempo di attesa per la prossima, generica, transizione di stato e le probabilità della transizione, condizionate al fatto che avvenga una transizione.

Più precisamente, si esprime la probabilità di osservare una certa sequenza come la combinazione di distribuzioni discrete di tempi di attesa per le transizioni da uno stato all’altro e di probabilità di transizione (condizionate al fatto che una transizione sia avvenuta). Il tempo di attesa prima della prossima transizione viene espresso come funzione dell’informazione passata, compreso lo stato in cui una donna si trovava prima della transizione. A condizione che una transizione avvenga, si modella poi la probabilità di entrare in uno degli altri stati come una funzione di covariate, che includono anche la durata dello stato precedente e l’età al momento della transizione. Questo approccio consente di descrivere processi che producono eventi ricorrenti (ovvero il ritorno a stati già sperimentati in precedenza).

Il numero di parametri del modello può essere ampio: gli autori propongono l’ANODI per uno screening preliminare delle potenziali covariate, al fine di costruire un modello parametrico iniziale più parsimonioso.

Gli autori propongono anche criteri per valutare i risultati.

Per esplorare se il modello stimato rappresenti un ragionevole processo di generazione di dati, gli autori lo usano per simulare una popolazione artificiale di traiettorie di vita. Le distribuzioni marginali di alcune quantità d’interesse nei dati simulati sono poi confrontate con quelle dei dati osservati.

Come ulteriore disamina dell’interazione tra il modello parametrico e l’ANODI (come procedura di screening), gli autori applicano l’ANODI ai dati generati dal modello per confermare la significatività statistica delle stesse covariate inserite nel modello.



di Raffaella Piccarreta e Marco Bonetti
Bocconi Knowledge newsletter

News

  • I fornitori di cure a lungo termine per gli anziani devono evolversi

    Presentato il 6 Rapporto Osservatorio Long Term Care promosso dal Cergas con Essity  

  • Postdoc Bocconi invitato a una conferenza di alto profilo

    Gianluigi Riva fara' parte di un gruppo di giovani scienziati che parteciperanno nel corso dell'anno a un incontro con alcuni premi Nobel  

Seminari

  Aprile 2024  
Lun Mar Mer Gio Ven Sab Dom
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

Seminari

  • THE FAILURE TO PREVENT FRAUD IN THE UK CORPORATE ENVIRONMENT
    Seminar of Crime Law

    NICHOLAS RYDER - Cardiff University

    Room 1-C3-01, Via Roentgen 1

  • Clare Balboni - Firm Adaptation in Production Networks: Evidence from Extreme Weather Events in Pakistan

    CLARE BALBONI - LSE

    Alberto Alesina Seminar Room 5.e4.sr04, floor 5, Via Roentgen 1