推定についての知識が怪しい方は、こちらを先に読むことをお勧めします。
[blogcard url="https://hikitaro.com/statistical_inference/"] [blogcard url="https://hikitaro.com/types_of_estimator/"]
区間推定の流れ
標本から推定量を計算し、その推定量の分布を調べ、指定された信頼度によって信頼区間を決定するというのが、区間推定の流れでした。
1.推定量を求める
母平均を推定するのに使う推定量は、不偏性と一致性を兼ね備えた標本平均です。
2.推定量の分布を知る
標本平均の分布は、母集団の情報や使った標本によって、異なります。
①母分散が既知な場合
母分散である、\(\sigma^2\)を\(n\)で割ったものが、標本平均の分散となります。
証明

標本平均を標準化すると、
$$\frac{\overline{x}- \mu}{\sqrt{\frac{\sigma2}{n}}}=\frac{\overline{x}- \mu}{\frac{\sigma}{\sqrt{n}}}$$
この統計量が標準正規分布に従います。
②母分散が未知で、サンプル数が少ない\((n < 30)\)
母分散が未知な場合は、標本から不偏分散を求め、これを母分散の代わりとして使います。(不偏分散を使う理由は不偏性、一致性の両方を兼ね備えていて、母分散の推定量(点推定)として適切だから)
母分散の代わりである\(u^2\)を\(n\)で割ったものが、標本平均の分散となります。
標本平均を標準化すると、
$$\frac{\overline{x}- \mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}- \mu}{\frac{u}{\sqrt{n}}}$$
この統計量が自由度\((n-1)\)の\(t\)分布に従います。
③母分散が未知で、サンプル数が多い\((n \geq 30)\)
母分散が未知なので、上と同様に不偏分散を求め、これを母分散の代わりとして使います。
母分散の代わりである(u2)を(n)で割ったものが、標本平均の分散となります。
標本平均を標準化すると、
$$\frac{\overline{x}- \mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}- \mu}{\frac{u}{\sqrt{n}}}$$
サンプルが多い場合、この統計量がt分布ではなく、標準正規分布に従います。

3.信頼度の指定
信頼度は、90%や95%に指定されることが多いです。
4.信頼区間の決定
標本平均の分布+信頼度の情報がそろったら、信頼区間を決定することができます。信頼区間を求める際には、分布表を使います。
分布表の使い方について、怪しい方はこちら
区間推定完了!
これで、母平均の区間推定が完了です。下の例題を見て、理解を深めましょう。
例題:信頼区間を実際に求めよう!
1.推定量を求める
母平均(全校生徒の平均身長)の推定量として使うのは、標本平均。
$$\overline{x} = \frac{160+150+170+145+165}{5} = 158$$
2.推定量の分布を調べる
母分散が未知で、サンプル数が少ないので、標本平均を標準化したものは、自由度\((5-1)=4\)の\(t\)分布に従う。
$$u2=\frac{(160-158)2+…+(165-158)2}{5-1}=107.5$$
標本平均の分散は
$$\frac{u2}{n}=\frac{107.5}{5}=21.5$$
(分散はこの段階で求める必要はありません)
$$\frac{\overline{x}-\mu}{\sqrt{\frac{u2}{n}}}=\frac{\overline{x}-\mu}{\frac{u}{\sqrt{n}}}$$
3.信頼度の指定
信頼度は\(95\)%
4. 信頼区間の決定
分布表より
$$-2.78\leq\frac{\overline{x}-\mu}{\frac{u}{\sqrt{n}}}\leq 2.78$$
これを\(\mu\)について解く。
$$\overline{x}-2.78\frac{u}{\sqrt{n}}\leq\mu\leq\overline{x}+2.78\frac{u}{\sqrt{n}}$$
値を代入する
$$145.10\leq\mu\leq170.89$$
信頼区間は
([145.10,170.89])
(158\pm12.89 ) ←このような表記をする場合もある。