統計的検定について怪しい方は、この記事を先に読むことをお勧めします。
[blogcard url="https://hikitaro.com/what_is_statistical_test/"]
統計的検定の手順
統計的検定では、まず帰無仮説と対立仮説を定めます。帰無仮説が正しいと仮定し、統計量の分布を調べます。ある確率よりも実際の統計量が得られる確率が小さかったとき、対立仮説を採用。そうでないとき帰無仮説を採用します。
母比率の差とは?
ある二つの母集団(A,B)の母比率(\pi_A, \pi_B)が等しいと言えるのかどうか、標本比率や標本数を使い統計的に検証するのが、この母比率の差の検定です。
1.帰無仮説と対立仮説を立てる。
二つの母比率は等しいというのを前提で、考えていきます。この記事では、両側検定について考えます。
2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。
(\pi_A = \pi_B)のとき、標本比率の差*1の分布は...

3.有意水準の決定
有意水準は5%や10%に設定されることが多いです。帰無仮説上で起こる確率が5%/10%より少ないとき、帰無仮説を棄却し、対立仮説を採択します。
4.棄却域の決定
標本比率の差の分布+有意水準の情報が揃ったとき、棄却域を求めることができます。
5.統計量を求め、棄却域内に入るか検証。
実際に標本から標本平均の差を求め、帰無仮説上でどのくらいの確率で、その統計量になるのか調べます。
検定完了! これで、統計的検定が完了です。下の例題を見て、理解を深めましょう。
例題:母比率の差の検定
共和党 | 民主党 | 標本数 | |
カリフォルニア州 | 40% | 60% | 2000 |
テキサス州 | 70% | 30% | 1500 |
1.帰無仮説と対立仮説を立てる。
2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。
カリフォルニア州の共和党への得票率を(p_A), テキサス州の共和党への得票率を(p_B)とする。
母比率の差がない*2のとき、統計量
$$\frac{p_A - p_B}{\sqrt{\overline{P}(1-\overline{P})(\frac{1}{n_A}+\frac{1}{n_B})}}$$
は標準正規分布に従う。ただし、
$$\overline{p} = \frac{n_Ap_A+n_Bp_B}{n_A+n_B}=0.53$$
3.有意水準の決定
有意水準は、5%.
4.棄却域の決定
分布表より
統計量の棄却域は…
$$\left|\frac{p_A - p_B}{\sqrt{\overline{P}(1-\overline{P})(\frac{1}{n_A}+\frac{1}{n_B})}} \right| > 1.96$$
・(p_A - p_B)について解く
$$|p_A-p_B| > 1.96\sqrt{\overline{P}(1-\overline{P}(\frac{1}{n_A}+\frac{1}{n_B})}$$
・それぞれ値を代入する。
$$|p_A-p_B| > 0.03$$
棄却域の決定の決定完了!
5.統計量を求め、棄却域内に入るか検証。
標本比率の差は、
(p_A - p_B = -0.3)
これは、棄却域内に入る。
よって、帰無仮説を棄却して、対立仮説を採択する。