母分散の区間推定【統計入門】

この記事では、母分散の区間推定をする方法を解説しています。
この記事を読む前に!

推定についての知識が怪しい方は、こちらを先に読むことをお勧めします。

[blogcard url="https://hikitaro.com/statistical_inference/"] [blogcard url="https://hikitaro.com/types_of_estimator/"]

統計学の知識を試すには、統計検定2級がおすすめ! 統計検定2級は、データサイエンスや機械学習で必要な、基礎的な統計学の知識をカバーしています。 ご購入はこちら

区間推定の流れ

標本から推定量を計算し、その推定量の分布を調べ、指定された信頼度によって信頼区間を決定するというのが、区間推定の流れでした。

1.推定量を求める

母分散を推定するのに推定するのに使う推定量は、不偏性と一致性を兼ね備えた不偏分散\(u^2\)です。

2.推定量の分布を知る

不偏分散\(u^2\)の分布: 統計量 \(\frac{(n-1)u^2}{\sigma^2}\) は自由度\(n-1\)のカイ2乗分布に従う。 (\(n\):サンプル数, \(\sigma^2\):母分散)

統計量がカイ2乗分布に従う理由

カイ二乗分布というのは、「標準正規分布に従う、確率変数の2乗の和」が従う分布でした。 これを踏まえて不偏分散\(u^2\)を変形してみます。

$$u2 = \frac{(X_1-\overline{X})2+ …+(X_n-\overline{X})2}{n-1}$$ ((n-1)u2 = X_1-\overline{X})2+ …+(X_n-\overline{X})2)

両辺を\(\sigma^2\)で割る

$$\frac{(n-1)u2}{\sigma2} = (\frac{X_1-\overline{X}}{\sigma})2+…+ (\frac{ X_n-\overline{X}}{\sigma})2$$

\(X_1…X_n\)から、\(\overline{X}\)をひいて\(\sigma\)で割る。これは、標準化する際に、母平均の代わりに標本平均を使ったバージョンです。

・標本平均\(\overline{X}\)は母平均\(\mu\)の推定値なので、\(\frac{ X_n-\overline{X}}{\sigma}\)も\(X_n\)を標準化したものであるとみなせる。

・標準化された、\(X_1…X_n\)は標準正規分布に従う。

これより、\(\frac{(n-1)u^2}{\sigma^2}\)は標準正規分布の2乗の和であるので、カイ2乗分布に従います。

自由度\(n-1\)の理由

自由度とは、自由に取れる値の数

上の統計量には、

$$\frac{X_1+…+X_n}{n}= \overline{X}$$

という縛りがあります。

すると、\(X_1,...,X_{n-1}\)の値が定まった時点で、\(X_n\)の値が決まってしまいます。よって自由に取れる値の数は、\((n-1)\)個です。

3.信頼度の決定

信頼度は、90%や95%に指定されることが多いです。

4.信頼区間の決定

不偏分散の分布+信頼度の情報がそろったら、信頼区間を決定することができます。信頼区間を求める際には、分布表を使います。

分布表の使い方について、怪しい方はこちら

区間推定完了!

これで、母分散の区間推定が完了です。下の例題を見て、理解を深めましょう。

例題:母分散の区間推定!

1.推定量を求める

母分散の推定量として使うのは、不偏分散

・不偏分散を求めるために、まずは標本平均\(\overline{X}\)を求める。

$$\overline{X}=\frac{300+...+200}{5}250$$

・不偏分散を求める。

$$u2=\frac{(X_1-\overline{X})2+ …+(X_n-\overline{X})2}{n-1}$$ (=\frac{(300-250)2+…+(200-250)2}{5-1}=12500)

2.推定量の分布を調べる

不偏分散\(u^2\)について、統計量\(\frac{(n-1)u^2}{\sigma^2}\)は、自由度\(5-1=4\)のカイ2乗分布に従う。

3.信頼度の指定

信頼度は90%

4.信頼区間の決定

分布表より

$$1.06 \leq \frac{(n-1)u2}{\sigma2} \leq 7.78$$

・(\sigma2)について解く

$$\frac{(n-1)u2}{7.78} \leq \sigma2 \leq \frac{(n-1)u2}{1.06}$$

・値を代入する

$$6426.74 \leq \sigma2 \leq 47169.81$$

区間推定完了!

信頼区間

([6426.74,47169.81])

統計学の知識を試すには、統計検定2級がおすすめ! 統計検定2級は、データサイエンスや機械学習で必要な、基礎的な統計学の知識をカバーしています。 ご購入はこちら