母比率の差の検定【統計入門】

この記事では、母比率の差の検定の手順を1から説明しています。
この記事を読む前に!

統計的検定について怪しい方は、この記事を先に読むことをお勧めします。

[blogcard url="https://hikitaro.com/what_is_statistical_test/"]

統計検定2級対応問題 2018年11月問15 ご購入はこちら

統計的検定の手順

統計的検定では、まず帰無仮説と対立仮説を定めます。帰無仮説が正しいと仮定し、統計量の分布を調べます。ある確率よりも実際の統計量が得られる確率が小さかったとき、対立仮説を採用。そうでないとき帰無仮説を採用します。

母比率の差とは?

ある二つの母集団(A,B)の母比率(\pi_A, \pi_B)が等しいと言えるのかどうか、標本比率や標本数を使い統計的に検証するのが、この母比率の差の検定です。

1.帰無仮説と対立仮説を立てる。

二つの母比率は等しいというのを前提で、考えていきます。この記事では、両側検定について考えます。

2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。

(\pi_A = \pi_B)のとき、標本比率の差*1の分布は...

説明

3.有意水準の決定

有意水準は5%や10%に設定されることが多いです。帰無仮説上で起こる確率が5%/10%より少ないとき、帰無仮説を棄却し、対立仮説を採択します。

4.棄却域の決定

標本比率の差の分布+有意水準の情報が揃ったとき、棄却域を求めることができます。

5.統計量を求め、棄却域内に入るか検証。

実際に標本から標本平均の差を求め、帰無仮説上でどのくらいの確率で、その統計量になるのか調べます。

検定完了! これで、統計的検定が完了です。下の例題を見て、理解を深めましょう。

例題:母比率の差の検定

1.帰無仮説と対立仮説を立てる。

2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。

カリフォルニア州共和党への得票率を(p_A), テキサス州共和党への得票率を(p_B)とする。

母比率の差がない*2のとき、統計量

$$\frac{p_A - p_B}{\sqrt{\overline{P}(1-\overline{P})(\frac{1}{n_A}+\frac{1}{n_B})}}$$

は標準正規分布に従う。ただし、

$$\overline{p} = \frac{n_Ap_A+n_Bp_B}{n_A+n_B}=0.53$$

3.有意水準の決定

有意水準は、5%.

4.棄却域の決定

分布表より

統計量の棄却域は…

$$\left|\frac{p_A - p_B}{\sqrt{\overline{P}(1-\overline{P})(\frac{1}{n_A}+\frac{1}{n_B})}} \right| > 1.96$$

・(p_A - p_B)について解く

$$|p_A-p_B| > 1.96\sqrt{\overline{P}(1-\overline{P}(\frac{1}{n_A}+\frac{1}{n_B})}$$

・それぞれ値を代入する。

$$|p_A-p_B| > 0.03$$

棄却域の決定の決定完了!

5.統計量を求め、棄却域内に入るか検証。

標本比率の差は、

(p_A - p_B = -0.3)

これは、棄却域内に入る。

よって、帰無仮説を棄却して、対立仮説を採択する。

統計検定2級対応問題 2018年11月問15 ご購入はこちら

*1:p_A-p_B

*2:d=0