コレログラムと自己相関【統計入門】

時系列データについて扱う、コレログラムの紹介。コレログラムはデータの周期性を調べるのに便利な方法ですが、初見だとなんのこっちゃ分かりません。この記事では、1から詳しく解説しています。
本日のメニュー
自己相関と自己相関係数コレログラム
統計用語集
統計検定2級公式問題集 対応問題 2019年11月問5, 2017年11月問3[3], 2017年6月問3[3] ご購入はこちら

自己相関・自己相関係数

自己相関:データを単位時間分ずらしたものと、元のデータとの相関
自己相関係数:自己相関の程度を表す。

自分自身との相関を表すため、自己相関。自己相関は、時系列データの周期を調べるのに、役に立ちます。また、ずらす単位時間をラグと言います。

自己相関係数の特徴
  • −1から1をとる
  • 自己相関係数 1:元のデータと完全に一致
  • 自己相関係数 −1:元のデータを完全に打ち消す

いまいちピントこない方は、例で理解しましょう。

例:ある店の利益

この図は、とある店の売り上げを、年ごとにプロットしたものです。縦軸は店の利益(万円)横軸は年(1999〜2018)を表します。ここから自己相関のイメージをしていきましょう。

1年分ずらしたデータとの相関(ラグ1)

3年分ずらしたデータとの相関(ラグ3)

元のデータとラグ3のデータ(赤)が互いに、打ち消し合っているのが、わかります。この時、自己相関係数であると言えます。

6単位時間分ずらしたデータとの相関(ラグ6)

元のデータとラグ6のデータ(赤)が、重なり合っているのが、わかります。この時、自己相関係数であると言えます。

コレログラム

コレログラム:ずらした単位時間(ラグ)と自己相関係数との関係を表した図。

先ほどは、自己相関をラグごとに見ていきましたが、コレログラムでは、異なるラグに対する、自己相関係数をまとめで図示します。

こんな感じ

このコレログラムは、上と同じデータを使用して作成したものです。縦軸には自己相関係数横軸にはラグ数

左から1番目はラグ0の自己相関係数を表しています。ラグ0=元のデータそのものなので、自己相関係数は1になっています。

上の例で、ラグ3の自己相関が負であることを確認しましたが、コレログラムによって、具体的な自己相関係数を知ることができます。ラグ3の自己相関係数は、-0.7ほどで、強い負の相関を持ってることが分かります。

また、ラグ6の自己相関係数は0.5ほどの中程度の正の相関を持っていることが分かります。

コレログラムのここがすごい:データの周期性を調べることができる

コレログラムは、データの周期性を調べるのに便利です。

自己相関が正→データが重なり合う→データが同じような動きを繰り返している→周期性を持つ

上の例では6年周期で利益が上がったり下がったりしていると言えます。

コレログラムの点線:棄却限界値

棄却限界値:自己相関がある値より小さかったら、切り捨てる(相関がないとみなす)

コレログラム中の青い点線は棄却限界値を表します。このコレラグラムでは、自己相関係数の絶対値が0.4以下であった場合、相関はない(無相関)とみなします。これは、相関がある確率が5%以下の範囲です。

統計検定2級公式問題集 対応問題 2019年11月問5, 2017年11月問3[3], 2017年6月問3[3] ご購入はこちら