この記事では、確率論で一番重要な概念の一つ「確率分布」の導入をしています。例を使って1から分かりやすく説明しているので、知識0からでも理解できます!
この記事を読む前に
確率変数についての知識が怪しい方は、まずこちらの記事を読むことをおすすめします。
[blogcard url="https://hikitaro.com/randam-variable/"]
確率分布とは
確率分布:「確率変数がとる値」と「確率変数がその値をとる確率」との関係を表したもの。
例1:サイコロ
サイコロの出る目(確率変数)と、それぞれの確率。
サイコロの目 | 1 | 2 | 3 | 4 | 5 | 6 |
確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
確率は(出る回数÷試行回数)で求めることができます。
例2:身長
*140~150 <- 140以上150未満
生徒の身長を階級別に分け、確率分布を見ていきます。
生徒の身長(階級) | 140~150 | 150~160 | 160~170 | 171~180 | 181~190 |
確率 | 0.14 | 0.19 | 0.31 | 0.25 | 0.10 |
ここでの確率は、相対度数です。相対度数は(階級の度数÷データ数)で求めることができます。これは、全生徒の中から1人ランダムに選んだ時に、その生徒の身長がその階級である確率を表します。
離散型確率分布と連続型確率分布
離散型確率分布
離散型確率分布:確率変数がとびとびの値をとる確率分布。
例1がこれに当てはまります。サイコロの目は1~6の整数という決まった数字しか取りません。確率変数が1.7や6.8といった値を取ることはありません。
離散型確率分布のイメージ
離散型確率分布の特徴
確率変数が値の間をとる確率は0。
例:サイコロで1.7の目がでる確率は0。P(x=1.7)=0
連続型確率分布
連続型確率分布:確率変数が連続した値をとる確率分布。
例2がこれに当てはまります。身長は171や172といった数だけでなく、171.1などといった値も取り得ます。これは身長が連続した値をとる確率変数だからです。
連続型確率分布のイメージ
連続型確率分布の特徴
確率変数がある値をとる確率は0。
例:ある生徒の身長が160cmである確率は0。P(x=160)=0
これは連続型の確率変数において、値がちょうどぴったりになることはないからです。
例えば、身長を測定して160cmという結果が出ても、実際には160.245…とか160.00089...というように、ぴったり160cmであるということではありません。
身長が160.0001...cmであっても160cmとは異なるので、P(x=160)に含まれることにはなりません。よってP(x=160)=0です。当然P(x=160.0001)=0です。
統計用語集
確率分布:確率変数がとる値と確率変数がその値をとる確率との関係を表したもの。
離散型確率分布:確率変数がとびとびの値をとる確率分布。
連続型確率分布:確率変数が連続した値をとる確率分布。