時系列における2つの値の相関係数を自己相関関数(ACF)と呼びます。例えば、時系列 \(y_t} のACFは次のように与えられます:
■(\begin{equation*}) \mbox{Corr}(y_{t},y_{t-k}). \end{equation*})
このkの値が考慮される時間差で、ラグと呼ばれます。 ラグ1の自己相関(つまり、上記ではk=1)とは、1時限離れた値同士の相関のことである。 より一般的には、ラグk自己相関は、k個の時間間隔がある値間の相関です。
ACFは、時間tの観測値と以前の時間の観測値との間の線形関係を測定する方法です。 AR(k)モデルを仮定した場合、(y_{t}}と(y_{t-k}}の間の関連性だけを測定し、その間にある確率変数(すなわち、 \(y_{t-1},y_{t-2},\ldots,y_{t-(k-1 )}})の線形影響をフィルタリングしたいことがありますが、そのためには時系列に対する変換が必要です。 そして、変換された時系列の相関を計算することにより、偏自己相関関数(PACF)を求める。
PACFは自己回帰モデルの次数を特定するのに最も有用である。 具体的には、サンプルの偏自己相関が0と有意に異なる場合、(y_{t}) の予測因子として有用な(y_{t}) の項のラグを示す。 ACFとPACFを区別するために、前述した \(R^{2}}) と partial \(R^{2}}) の値のアナログと考える。
自己回帰モデルのラグを評価するグラフ的アプローチには、ラグに対するACFとPACF値を見ることである。 ACF対ラグのプロットで、大きなACF値と非ランダムなパターンが見られる場合は、おそらく値が系列相関しているのでしょう。 PACF対ラグのプロットでは、パターンは通常ランダムに見えますが、与えられたラグでの大きなPACF値は、自己回帰モデルの次数の選択としてこの値を示す可能性があることを示します。 次数の選択が理にかなっていることが重要です。 例えば、過去2年間の毎日の血圧の測定値があるとします。 血圧のモデル化には、AR(1) または AR(2) モデルが適切であることがわかるでしょう。 しかし、PACFは17のラグで大きな偏自己相関値を示すかもしれませんが、自己回帰モデルに対するそのような大きな次数は、おそらくあまり意味をなさないでしょう
。