母平均の区間推定【統計入門】

この記事では、母平均の区間推定をする方法を3パターンに分けて、紹介しています。
この記事を読む前に!

推定についての知識が怪しい方は、こちらを先に読むことをお勧めします。

[blogcard url="https://hikitaro.com/statistical_inference/"] [blogcard url="https://hikitaro.com/types_of_estimator/"]

統計検定2級対応問題 2019年11月問14[2],2018年6月問10[2], 2016年6月問11[1] ご購入はこちら

区間推定の流れ

標本から推定量を計算し、その推定量の分布を調べ、指定された信頼度によって信頼区間を決定するというのが、区間推定の流れでした。

1.推定量を求める

母平均を推定するのに使う推定量は、不偏性と一致性を兼ね備えた標本平均です。

定量:$$標本平均 \overline{X}=\frac{X_1+...+X_n}{n}$$

2.推定量の分布を知る

標本平均の分布は、母集団の情報や使った標本によって、異なります。

①母分散が既知な場合

標本平均の分散:\(\frac{\sigma^2}{n}\) 標本平均の分布:標本平均を標準化したものが、標準正規分布に従う

母分散である、\(\sigma^2\)を\(n\)で割ったものが、標本平均の分散となります。

証明

標本平均を標準化すると、

$$\frac{\overline{x}- \mu}{\sqrt{\frac{\sigma2}{n}}}=\frac{\overline{x}- \mu}{\frac{\sigma}{\sqrt{n}}}$$

この統計量が標準正規分布に従います。

②母分散が未知で、サンプル数が少ない\((n < 30)\)

標本平均の分散:\(\frac{u^2}{n}\) 標本平均の分布:標本平均を標準化したものが、自由度\((n-1)\)の\(t\)分布に従う

母分散が未知な場合は、標本から不偏分散を求め、これを母分散の代わりとして使います。(不偏分散を使う理由は不偏性、一致性の両方を兼ね備えていて、母分散の推定量(点推定)として適切だから)

母分散の代わりである\(u^2\)を\(n\)で割ったものが、標本平均の分散となります。

標本平均を標準化すると、

$$\frac{\overline{x}- \mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}- \mu}{\frac{u}{\sqrt{n}}}$$

この統計量が自由度\((n-1)\)の\(t\)分布に従います。

③母分散が未知で、サンプル数が多い\((n \geq 30)\)

標本平均の分散:\(\frac{u^2}{n}\) 標本平均の分布:標本平均を標準化したものが、標準正規分布に従う

母分散が未知なので、上と同様に不偏分散を求め、これを母分散の代わりとして使います。

母分散の代わりである(u2)を(n)で割ったものが、標本平均の分散となります。

標本平均を標準化すると、

$$\frac{\overline{x}- \mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}- \mu}{\frac{u}{\sqrt{n}}}$$

サンプルが多い場合、この統計量がt分布ではなく、標準正規分布に従います。

標本平均が従う分布の調べ方まとめ

3.信頼度の指定

信頼度は、90%や95%に指定されることが多いです。

4.信頼区間の決定

標本平均の分布+信頼度の情報がそろったら、信頼区間を決定することができます。信頼区間を求める際には、分布表を使います。

分布表の使い方について、怪しい方はこちら

区間推定完了!

これで、母平均の区間推定が完了です。下の例題を見て、理解を深めましょう。

例題:信頼区間を実際に求めよう!

1.推定量を求める

母平均(全校生徒の平均身長)の推定量として使うのは、標本平均

$$\overline{x} = \frac{160+150+170+145+165}{5} = 158$$

2.推定量の分布を調べる

母分散が未知で、サンプル数が少ないので、標本平均を標準化したものは、自由度\((5-1)=4\)の\(t\)分布に従う。

標準化するために、母分散の代わりに使う不偏分散を求める

$$u2=\frac{(160-158)2+…+(165-158)2}{5-1}=107.5$$

標本平均の分散は

$$\frac{u2}{n}=\frac{107.5}{5}=21.5$$

(分散はこの段階で求める必要はありません)

標準化!

$$\frac{\overline{x}-\mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}-\mu}{\frac{u}{\sqrt{n}}}$$

3.信頼度の指定

信頼度は\(95\)%

4. 信頼区間の決定

分布表より

$$-2.78\leq\frac{\overline{x}-\mu}{\frac{u}{\sqrt{n}}}\leq 2.78$$

これを\(\mu\)について解く。

$$\overline{x}-2.78\frac{u}{\sqrt{n}}\leq\mu\leq\overline{x}+2.78\frac{u}{\sqrt{n}}$$

値を代入する

$$145.10\leq\mu\leq170.89$$

区間推定完了!

信頼区間は 

([145.10,170.89])

(158\pm12.89 ) ←このような表記をする場合もある。

統計検定2級対応問題 2019年11月問14[2],2018年6月問10[2], 2016年6月問11[1] ご購入はこちら