Le coefficient de corrélation entre deux valeurs d’une série temporelle est appelé fonction d’autocorrélation (FAC) Par exemple, la FAC d’une série temporelle \(y_t\) est donnée par :
\(\begin{equation*}. \mbox{Corr}(y_{t},y_{t-k}). \end{equation*}\)
Cette valeur de k est l’écart temporel considéré et est appelée le lag. Une autocorrélation lag 1 (c’est-à-dire k = 1 dans ce qui précède) est la corrélation entre des valeurs qui sont séparées par une période de temps. Plus généralement, une autocorrélation lag k est la corrélation entre des valeurs qui sont séparées par k périodes de temps.
L’ACF est un moyen de mesurer la relation linéaire entre une observation au temps t et les observations aux temps précédents. Si nous supposons un modèle AR(k), alors nous pouvons souhaiter mesurer uniquement l’association entre \(y_{t}\) et \(y_{t-k}\) et filtrer l’influence linéaire des variables aléatoires qui se trouvent entre les deux (c’est-à-dire \(y_{t-1},y_{t-2},\ldots,y_{t-(k-1 )}\), ce qui nécessite une transformation sur les séries temporelles. Ensuite, en calculant la corrélation des séries temporelles transformées, on obtient la fonction d’autocorrélation partielle (PACF).
La PACF est surtout utile pour identifier l’ordre d’un modèle autorégressif. Plus précisément, les autocorrélations partielles d’échantillon qui sont significativement différentes de 0 indiquent des termes retardés de \(y\) qui sont des prédicteurs utiles de \(y_{t}\). Pour aider à différencier l’ACF et le PACF, considérez-les comme des analogues des valeurs de \(R^{2}\) et de \(R^{2}\) partielles, comme nous l’avons vu précédemment.
Les approches graphiques pour évaluer le retard d’un modèle autorégressif incluent l’examen des valeurs d’ACF et de PACF en fonction du retard. Dans un tracé de l’ACF en fonction du retard, si vous voyez de grandes valeurs d’ACF et un modèle non aléatoire, alors probablement les valeurs sont corrélées en série. Dans un graphique de PACF en fonction du décalage, le modèle semble généralement aléatoire, mais des valeurs PACF importantes à un décalage donné indiquent cette valeur comme un choix possible pour l’ordre d’un modèle autorégressif. Il est important que le choix de l’ordre ait un sens. Par exemple, supposons que vous ayez des relevés de tension artérielle pour chaque jour des deux dernières années. Vous pouvez trouver qu’un modèle AR(1) ou AR(2) est approprié pour modéliser la pression artérielle. Cependant, le PACF peut indiquer une grande valeur d’autocorrélation partielle à un retard de 17, mais un ordre aussi grand pour un modèle autorégressif n’a probablement pas beaucoup de sens.