Il coefficiente di correlazione tra due valori in una serie temporale è chiamato funzione di autocorrelazione (ACF) Per esempio l’ACF per una serie temporale \(y_t\) è data da:
\(\begin{equation*} \mbox{Corr}(y_{t},y_{t-k}). \Questo valore di k è l’intervallo di tempo considerato ed è chiamato lag. Un’autocorrelazione lag 1 (cioè k = 1 nel caso precedente) è la correlazione tra valori che sono distanti un periodo di tempo. Più in generale, un’autocorrelazione lag k è la correlazione tra valori che distano tra loro k periodi di tempo.
L’ACF è un modo per misurare la relazione lineare tra un’osservazione al tempo t e le osservazioni ai tempi precedenti. Se assumiamo un modello AR(k), allora potremmo voler misurare solo l’associazione tra \(y_t}\ e \(y_{t-k}\ e filtrare l’influenza lineare delle variabili casuali che si trovano nel mezzo (cioè, \(y_{t-1},y_{t-2},\ldots,y_{t-(k-1 )})), che richiede una trasformazione sulle serie temporali. Quindi, calcolando la correlazione delle serie temporali trasformate si ottiene la funzione di autocorrelazione parziale (PACF).
La PACF è molto utile per identificare l’ordine di un modello autoregressivo. In particolare, le autocorrelazioni parziali del campione che sono significativamente diverse da 0 indicano termini ritardati di \(y\) che sono utili predittori di \(y_{t}\). Per aiutare a differenziare tra ACF e PACF, si pensi a loro come analoghi ai valori di \(R^{2}}) e \(R^{2}) parziale come discusso in precedenza.
I metodi grafici per valutare il ritardo di un modello autoregressivo includono l’osservazione dei valori ACF e PACF rispetto al ritardo. In un grafico di ACF rispetto al ritardo, se si vedono grandi valori ACF e un modello non casuale, allora è probabile che i valori siano correlati in serie. In un grafico di PACF rispetto al ritardo, il modello di solito appare casuale, ma grandi valori di PACF a un dato ritardo indicano questo valore come una possibile scelta per l’ordine di un modello autoregressivo. È importante che la scelta dell’ordine abbia senso. Per esempio, supponiamo di avere letture della pressione sanguigna per ogni giorno degli ultimi due anni. Potreste trovare che un modello AR(1) o AR(2) sia appropriato per modellare la pressione sanguigna. Tuttavia, il PACF può indicare un grande valore di autocorrelazione parziale ad un ritardo di 17, ma un ordine così grande per un modello autoregressivo probabilmente non ha molto senso.