統計的検定とは?例を用いて解説【統計入門】

この記事では、統計的検定の考え方の基本を紹介しています!
統計学の知識を試すには、統計検定2級がおすすめ! 統計検定2級は、データサイエンスや機械学習で必要な、基礎的な統計学の知識をカバーしています。 ご購入はこちら

統計的検定とは?

統計的検定とは、「仮説が正しいかどうか検証する」ということです。

例えば、「全国の平均身長は150cmである」と仮説を立てます。このとき、それが本当なのか検証するのが、統計的検定です。標本から統計量(標本平均や不偏分散など)を計算することにより、仮説が妥当であるか検証します。

もし標本平均を計算した結果、152cmであったら、全国の平均身長は150cmであるという仮説は、正しい可能性が高くなります。これは、「全国の平均身長は150cm」というのが本当だった場合に、標本平均が150cm周辺になる確率は大きくなるからです。

対して、もし標本平均を計算した結果、170cmであったら、全国の平均身長は150cmであるという仮説は、間違っている可能性が高くなります。これは、「全国の平均身長は150cm」というのが本当だった場合に、標本平均が170cmになる確率は小さくなるからです。

この確率が一定水準より大きいとき、「全国の平均身長は150cmであると仮説」は正しいと判断し、一定水準より小さいとき、「全国の平均身長は150cmであると仮説」は誤っていると判断するのが統計的検定です。

直感的に統計的検定の考え方は、理解できたでしょうか。 ここからは、具体的な統計的検定の手順について、見ていきます。

統計的検定の手順

1.帰無仮説、対立仮説を立てる。

帰無仮説:前提となる仮説 対立仮説:検証する仮説

統計的検定は、帰無仮説は正しい」という前提のもとで始まります。 対立仮説は、名前の通り帰無仮説は正しくない」という仮説です。帰無仮説、対立仮説をそれぞれ1つずつ立て、この2つの仮説のどちらかを採択します。

帰無仮説は(H_0), 対立仮説は(H_1)と表されます。

検定の種類

検定には、対立仮説の立て方によって、3種類あります。 両側検定、片側検定(上側)、片側検定(下側)です。

  • 帰無仮説での統計量ではない」といった対立仮説を立てた場合、両側検定
  • 帰無仮説での統計量より大きい」といった対立仮説を立てた場合、片側検定(上側)
  • 帰無仮説での統計量より小さい」といった対立仮説を立てた場合、片側検定(下側)

どの対立仮説を使うかは、恣意的に決めることができます。例えば「全国の身長はもっと大きいはずだ!」と主張したい場合には、2つ目の片側検定(上側)を対立仮説として使います。

2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。

帰無仮説が正しいと仮定するというのが、ポイントです。

3.有意水準の決定

有意水準帰無仮説を棄却する確率

帰無仮説上で、起こる確率が小さいことが起こったとき、帰無仮説を棄却し、対立仮説を採用します。

このとき、どのくらい確率が小さいとき、帰無仮説を棄却し、対立仮説を採用するのかを決めるのが有意水準(危険率とも言われる)です。

棄却域は、5%や10%が指定されることが多いです。これは帰無仮説上で起こる確率が、5%以下/10%以下であることが起こったとき、帰無仮説を棄却し、対立仮説を採択するということを、意味します。

4.棄却域の決定

棄却域帰無仮説を棄却する範囲。

棄却域は、帰無仮説上での統計量の分布+有意水準によって決定されます。逆に帰無仮説を採用する範囲を受容域と言います。

棄却域や受容域を求めるのは、区間推定で信頼区間を求めるのと、似ています。

5.統計量を求め、棄却域内に入るか検証。

実際に標本から統計量を求め、帰無仮説上でどのくらいの確率で、その統計量になるのか調べます。

統計量が棄却域に入る→対立仮説を採択 統計量が棄却域に入らない→帰無仮説を採択

検定完了!

これで、統計的検定が完了です。下の例題を見て、理解を深めましょう。

統計的検定の流れ

例題:統計的検定

1.帰無仮説、対立仮説を立てる。

これは、既に問題によって与えられています。

2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。

帰無仮説が正しい、つまり \(\mu=150\)であるとき、標本平均\(\overline{X}\)の従う分布は…

統計量が従う分布の調べ方は、区間推定の際と同じです。

(これにピンとこなかった方は、こちらの記事を!)

3.有意水準の決定

有意水準は\(5\)%。

4.棄却域の決定

分布表より統計量の棄却域は...

(\frac{\overline{X}-\mu}{\frac{\sigma}{n}} \leq -1.96, 1.96 \leq \frac{\overline{X}-\mu}{\frac{\sigma}{n}})

・(\overline{X})について解く (\overline{X} \leq \mu - 1.96\frac{\sigma}{n}, \mu + 1.96\frac{\sigma}{n} \leq \overline{X})

・値を代入する ( \overline{X} \leq 149.7256, 150.2744 \leq \overline{X})

棄却域の決定の決定完了!

5.統計量を求め、棄却域内に入るか検証。

標本平均は\(155cm\)。これは棄却域に入るので、帰無仮説(\(\mu=150\))を棄却して、対立仮説(\(\mu \neq 150\))を採択。

統計学の知識を試すには、統計検定2級がおすすめ! 統計検定2級は、データサイエンスや機械学習で必要な、基礎的な統計学の知識をカバーしています。 ご購入はこちら