推定についての知識が怪しい方は、こちらを先に読むことをお勧めします。
[blogcard url="https://hikitaro.com/statistical_inference/"] [blogcard url="https://hikitaro.com/types_of_estimator/"]
区間推定の流れ
標本から推定量を計算し、その推定量の分布を調べ、指定された信頼度によって信頼区間を決定するというのが、区間推定の流れでした。
1.推定量を求める
母分散を推定するのに推定するのに使う推定量は、不偏性と一致性を兼ね備えた不偏分散\(u^2\)です。
2.推定量の分布を知る
不偏分散\(u^2\)の分布: 統計量 \(\frac{(n-1)u^2}{\sigma^2}\) は自由度\(n-1\)のカイ2乗分布に従う。 (\(n\):サンプル数, \(\sigma^2\):母分散)
統計量がカイ2乗分布に従う理由
カイ二乗分布というのは、「標準正規分布に従う、確率変数の2乗の和」が従う分布でした。 これを踏まえて不偏分散\(u^2\)を変形してみます。
$$u2 = \frac{(X_1-\overline{X})2+ …+(X_n-\overline{X})2}{n-1}$$ ((n-1)u2 = X_1-\overline{X})2+ …+(X_n-\overline{X})2)
両辺を\(\sigma^2\)で割る
$$\frac{(n-1)u2}{\sigma2} = (\frac{X_1-\overline{X}}{\sigma})2+…+ (\frac{ X_n-\overline{X}}{\sigma})2$$
\(X_1…X_n\)から、\(\overline{X}\)をひいて\(\sigma\)で割る。これは、標準化する際に、母平均の代わりに標本平均を使ったバージョンです。
・標本平均\(\overline{X}\)は母平均\(\mu\)の推定値なので、\(\frac{ X_n-\overline{X}}{\sigma}\)も\(X_n\)を標準化したものであるとみなせる。
・標準化された、\(X_1…X_n\)は標準正規分布に従う。
これより、\(\frac{(n-1)u^2}{\sigma^2}\)は標準正規分布の2乗の和であるので、カイ2乗分布に従います。
自由度\(n-1\)の理由
自由度とは、自由に取れる値の数。
上の統計量には、
$$\frac{X_1+…+X_n}{n}= \overline{X}$$
という縛りがあります。
すると、\(X_1,...,X_{n-1}\)の値が定まった時点で、\(X_n\)の値が決まってしまいます。よって自由に取れる値の数は、\((n-1)\)個です。
3.信頼度の決定
信頼度は、90%や95%に指定されることが多いです。
4.信頼区間の決定
不偏分散の分布+信頼度の情報がそろったら、信頼区間を決定することができます。信頼区間を求める際には、分布表を使います。
分布表の使い方について、怪しい方はこちら
区間推定完了!
これで、母分散の区間推定が完了です。下の例題を見て、理解を深めましょう。
例題:母分散の区間推定!
1.推定量を求める
母分散の推定量として使うのは、不偏分散。
・不偏分散を求めるために、まずは標本平均\(\overline{X}\)を求める。
$$\overline{X}=\frac{300+...+200}{5}250$$
・不偏分散を求める。
$$u2=\frac{(X_1-\overline{X})2+ …+(X_n-\overline{X})2}{n-1}$$ (=\frac{(300-250)2+…+(200-250)2}{5-1}=12500)
2.推定量の分布を調べる
不偏分散\(u^2\)について、統計量\(\frac{(n-1)u^2}{\sigma^2}\)は、自由度\(5-1=4\)のカイ2乗分布に従う。
3.信頼度の指定
信頼度は90%
4.信頼区間の決定
分布表より
$$1.06 \leq \frac{(n-1)u2}{\sigma2} \leq 7.78$$
・(\sigma2)について解く
$$\frac{(n-1)u2}{7.78} \leq \sigma2 \leq \frac{(n-1)u2}{1.06}$$
・値を代入する
$$6426.74 \leq \sigma2 \leq 47169.81$$
信頼区間は
([6426.74,47169.81])