LA REGRESSIONE SPURIA

 


Ragnar Frisch
Un esempio delle difficoltà create dall'assunzione iid è dato da alcuni esempi del cosiddetto problema della correlazione spuria, già ben noto all'atto della creazione della Società di Econometria, come testimonia un articolo di G. U. Yule del 1926 [4].
Yule prese spunto, nel suo studio, dall'alta correlazione (positiva) registrata fra la frazione di matrimoni di rito anglicano(yi), sul totale dei matrimoni, e il tasso di mortalità standardizzato (xi) in Inghilterra negli anni 1866-1911, per un totale di n=46 osservazioni.

La correlazione calcolata, pari a 0.9512, risultava significativa quando si calcolava il testt nella regressione di yi su xi, ossia se si adattava un modello lineare del tipo:

yi=α+βxi+ε, (2)

con le assunzioni associate.
Yule considerava questa relazione positiva del tutto priva di senso: come potevano essere associati il tasso di mortalità con la frazione di matrimoni religiosi? Come poteva un numero minore di matrimoni di rito religioso essere collegato alla minore mortalità? Doveva trattarsi di una relazione spuria che, però, invece di produrre solo facili umorismi, aveva bisogno di trovare una spiegazione scientifica.

Se nel modello di regressione (2) si ipotizza che zt :=(yt : xt)' siano iid, effettivamente si arriva a conclusioni "strane", non suffragate da alcuna spiegazione causale derivante da una teoria socio-economica plausibile.
Oggi è semplice osservare che queste conclusioni sono essenzialmente basate sull'ipotesi - insostenibile - che le osservazioni del vettore zt :=(yt : xt)' siano iid al variare del tempo t. I dati sui matrimoni e sulla mortalità (zt)t=1 T sonola realizzazione di un esperimento sequenziale dove giocano fenomeni socio-economici di lungo periodo (di calo dei matrimoni e miglioramento delle condizioni di vita) che invalidano l'assunzione iid.
La comprensione piena del fenomeno della correlazione spuria è dovuta a Peter Phillips, grazie a un lavoro pubblicato nel 1986 [5]. Sul questo tema ha lavorato anche Granger; si può argomentare che la risposta più completa al problema della regressione spuria sia costituita dalla nozione di cointegrazione, introdotta all'inizio degli anni ottanta da Granger, che gli ha fruttato il premio Nobel. La nozione combina l'aspetto di relazione fra fenomeni e la presenza di trend nelle serie temporali economiche.