確率密度関数・確率と面積の関係性【統計学入門】

この記事では、確率密度関数について図や例を用いて、分かりやすく説明しています。確率密度関数は、確率分布を関数として表すことにより、確率をより数学的に扱いやすくすることができます。
この記事を読む前に

確率分布についての知識が怪しい方は、まずこちらの記事を読むことをおすすめします。

[blogcard url="https://hikitaro.com/prob_distribtion/"]

統計検定2級対応問題 2019年11月問9,2017年11月問8, 2016年11月問10, 2016年6月問8 ご購入はこちら

確率密度関数とは

確率密度関数:連続型の確率分布を関数として表したもの

これだけですと少し分かりづらいですね。。。ここから1つずつ丁寧に説明していきます。

連続型の確率分布とは?

連続型の確率分布:確率変数が連続的な値をとる、確率分布。

確率密度関数の特徴

  1. 横軸は確率変数
  2. 縦軸は確率密度
  3. 確率は面積によって表される
1.横軸は確率変数

確率の横軸は確率変数を表します。これは、上の例では身長です。

2.縦軸は確率密度

生徒の身長を階級ごとに分けた際、縦軸は度数(その階級に何人の生徒が入るか)を表していました。しかしその階級の幅を0に近いくらいに縮めることにより、それは確率密度を表すようになります。

確率密度は、確率変数の出やすさを表します。確率密度の多い場所付近の確率変数は、相対的に出やすいということができます。

3.確率は面積によって表される

連続型確率分布では確率は面積によって求められます。これは、確率変数がある値をとる確率は0だからです。

連続型の確率変数において、値がちょうどぴったりになることはありません。

例えば、身長を測定して160cmという結果が出ても、実際には160.245…とか160.00089...というようにぴったり160cmであるということではありません。 身長が160.0001...cmであっても160cmとは異なるので、\(P(x=160)\)に含まれることにはなりません。よって\(P(x=160)=0\)です。

確率変数がとり得る値、全てに対する確率は1となります。

通常これらの面積は確率密度関数積分によって求めることになります。有名な分布(正規分布やt分布、F分布)の場合は、分布表を使うことになります。

確率密度関数と期待値、分散

期待値や分散とした基本統計量は、確率密度関数を使って、表すことができます.

・期待値 $$E(x)=\int^{\infty}_{-\infty}xf(x)\:dx$$ ・分散 $$V(x)=\int^{\infty}_{-\infty}(x- \mu)^2f(x)\:dx$$
\(f(x) …確率密度関数\)

期待値は、確率密度と確率変数の積の和で表されます。 \(-\infty\) から \(\infty\)で積分するのは、確率変数がとり得る値全てに関しての、確率密度と確率変数の積を足し合わせるためです。なので、確率変数のとり得る範囲が定まっている場合には、その範囲のみの積分で、期待値を求めることができます。

分散は、確率密度と(確率変数と期待値の差)の2乗の積の和で表されます。

統計検定2級対応問題 2019年11月問9,2017年11月問8, 2016年11月問10, 2016年6月問8 ご購入はこちら