この記事では、点推定と区間推定の基本的な考え方について、直感的に理解できるよう説明しています!
まずは用語から確認していきます。
点推定と区間推定
推定:標本(標本平均など)から未知な母数(母平均など)を予想すること。
点推定:標本から未知な母数をピンポイントで予想する。
区間推定:標本から未知な母数を幅を持たせて予想する。
推定のイメージ
点推定と区間推定のイメージ
ここからは、例を使って用語を確認していきます!
全国の中学生の身長の平均(母数)を、A中学校のデータ(標本)から推定する。
A中学校の中学生の身長の平均は\(155cm\)であった。(標本平均)1.点推定
A中学校の平均身長が、全国の中学生の平均身長に一致すると推定。
点推定の特徴は、今手元にあるデータが、一番起こりやすい考えることです。A中学校で平均身長が155cmだったのだから、他の中学校でも同じ平均身長になる確率が高いと考えます。
2.区間推定
A中学校の平均身長\(\pm10cm\)の範囲に、全国の中学生の平均身長が入ると推定。
\(145<母平均<165\)
\([145,165]\) \(\leftarrow\)母数が入る区間について、このように書くことが多いです。
区間推定の信頼区間
先ほどの例では、でたらめに区間を決めましたが、実際に区間推定をする際には、区間は確率によって決めらます。
95%の確率で、母平均はこの区間に入る!といった感じです。この区間のことを信頼区間と呼びます。
信頼区間を求めるのには、下の3つの情報が必要です。
信頼区間を求めるのに必要な情報
推定量とは、母数を推定するために使う統計量を指します。標本で得られた値から計算します。これは、標本平均などを指します。
信頼度とは、母数がその区間内に入る確率です。これによって区間が決まります。信頼度を低くすれば、区間は狭くなり、高くすれば、広くなります。
また信頼度と区間とを結びつけるには、推定量がどのような分布に従うのか、知る必要があります。
信頼区間を求める流れ