確率変数 | 期待値 |
分散 | 共分散 |
相関係数 | 期待値の計算 |
分散の計算 | 相関係数が単位によらない証明 |
分散の計算の証明 | 統計用語集 |
確率変数
確率変数の期待値
\(E(x)\) <- 確率変数\(x\)の期待値 (\(E\)は\(Expectation\)の頭文字)
$$E(x)=x_1p_1+x_2p_2+…+x_np_n$$\(x_1,x_2,…,x_n\) : 試行の結果、得られる数値
\(p_1,p_2,…,p_n\): それぞれの数値を取る確率
期待値は\(\mu\)(ミュー)と表されることもあります。
サイコロの目 | 1 | 2 | 3 | 4 | 5 | 6 |
でた回数 | 15 | 13 | 19 | 20 | 16 | 17 |
確率 | 16/100 | 15/100 | 17/100 | 17/100 | 18/100 | 17/100 |
確率変数の分散
日本語にすると、(各値と期待値の差)の2乗の期待値です。
分散は\(\sigma^2\)(シグマ2乗)と表されることもあります。 また分散の正の平方根である\(\sigma\)(シグマ)は、標準偏差と呼ばれます。
分散は以下の式でも求めることができます。
確率変数の共分散
出席番号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身長\*1(y-E(y))\}\)
\(=E\{xy-xE(y)-yE(x)+E(x)E(y)\}\)
\(=E(xy)-2E(x)E(y)+E(x)E(y)\)
\(=E(xy)-E(x)E(y)\)
共分散を求めるには、2つのデータに対応がある、必要があります。この例では、身長と体重が、それぞれどのデータに対応するかです。 [voice icon="https://hikitaro.com/wp-content/uploads/2019/06/40089718.2b41005ba0d1899a3f0bf130c1f85933.19060315-1-e1561226485604.jpg" name=“ユウガ” type="l"] 分散と共分散は似ている! 分散の\*2\)の部分を、一方だけ\*3\)に変えたのが、共分散。 また別の求め方でも、片方の(x)が(y)に変わっている。 (E(xx)\rightarrow E(xy)) (E(x)E(x)\rightarrow E(x)E(y))[/voice] 相関係数相関係数:2組の対応するデータの関係の強弱を表す。
\(cor(x,y)\) <- 確率変数\(x\)と確率変数\(y\)の相関係数 (\(cor\)は\(correlation\)の頭から) \(cor(x,y)=\frac{cov(x,y)}{\sqrt{V(x)V(y)}}\)共分散は単位を変える(m->cmなど)ことによって、数値が変わるが、相関係数は単位を変えても不変(証明はこちら) 例
とあるクラスの生徒の身長を確率変数\(x\)、体重を確率変数\(y\)とする。
\(cor(x,y)=\frac{cov(x,y)}{\sqrt{V(x)V(y)}}\)
\(=\frac{62.5}{\sqrt{74.4\times51.75}}=0.88\)
期待値どうしの計算
(1) \(E(x+y)=E(x)+E(y)\)
(2) \(E(x-y)=E(x)-E(y)\)
(3) \(E(x+a)=E(x)+a\)
(4) \(E(ax)=aE(x)\)
(3),(4) 確率変数以外のものは、そのまま(E( ))の中から外すことができます。これは、期待値は確率変数に対して、求めるものだからです。 分散どうしの計算
(1) \(V(x+y)=V(x)+V(y)+2cov(x,y)\)
(2) \(V(x-y)=V(x)+V(y)-2cov(x,y)\)
(3) \(V(x+a)=V(x)\)
(4) \(V(ax)=a^2V(x)\)
(5) \(確率変数同士が無相関(独立)\)
\(\Leftrightarrow cov(x,y)=0\)
(1),(2) 分散どうしの加法減法は、共分散を足したり引いたりするのに注意が必要です。 (3)分散は散らばり具合を表すものなので、全てに定数を足しても変化しません。 (4)各値を\(a\)倍すると、値どうしの距離が\(a\)倍になります。分散は(各値と期待値の2乗)の期待値なので、分散は\(a^2\)倍となります。 (5)共分散は2つの変数間の関係を表すので、2つの変数が無相関で独立場合0となります。 証明はこちら ポイント
\(E( )\)や、\(V( )\)は確率変数に使われる。 \(E(定数)\)は定数をそのまま外に出すことができる。 \(V(定数)\)は0となる。証明集相関係数は単位によらない
ある確率変数、\(x,y\)について
\(cor(x,y)=\frac{cov(x,y)}{\sqrt{V(x)V(y)}}\)
単位を変えるというのは、全てのデータを定数倍するということである。(例:m→cmのとき、全てのデータを100倍する)
よって、確率変数\(x,y\)をそれぞれ\(a倍,b倍\)する。
このとき
\(V(ax)=a^2V(x)\)
\(V(by)=b^2V(y)\)
\(cov(ax,by)=ab \cdot cov(x,y)\)
相関係数を求める。
\(cor(ax,by)\)
\(=\frac{ab \cdot cov(x,y)}{\sqrt{a^2V(x)b^2V(y)}}\)
\(=\frac{ab \cdot cov(x,y)}{ab\sqrt{V(x)V(y)}}\)
\(=\frac{cov(x,y)}{\sqrt{V(x)V(y)}}\)
\(=cor(x,y)\)
分散(1)
\(V(x+y)\)
\(=E[\{(x+y)-E(x+y)\}^2]\)
\(=E[\{(x+y)-(E(x)+E(y))\}^2]\)
\(x+y=A (Aは確率変数)\) \(E(x)+E(y)=B (Bは定数)\) とおく \(与式\) \(=E\{(A-B)^2\}\) \(=E(A^2-2AB+B^2)\) \(=E(A^2)-2B \cdot E(A)+B^2\) \(=E\{(x+y)^2\}\) \(-2(E(x)+E(y))E(x+y)\) \(+(E(x)+E(y))^2\) \(=E(x^2+2xy+y^2)\) \(-2(E(x)+E(y))(E(x)+E(y))\) \(+E(x)^2+2E(x)E(y)+E(y)^2\) \(=E(x^2)+2E(xy)+E(y^2)\) \(-2\{(E(x)^2+2E(x)E(y)+E(y)^2\}\) \(+E(x)^2+2E(x)E(y)+E(y)^2\) \(=E(x^2)+2E(xy)+E(y^2)\) \(-2E(x)^2-4E(x)E(y)-2E(y)^2\) \(+E(x)^2+2E(x)E(y)+E(y)^2\) \(=E(x^2)-2E(x)^2+E(x)^2\) \(+E(y^2)-2E(y)^2+E(y)^2\) \(+2E(xy)-4E(x)E(y)+2E(x)E(y)\) \(=E(x^2)-E(x)^2+E(y^2)-E(y)^2\) \(+2E(xy)-2E(x)E(y)\) \(=V(x)+V(y)+2cov(x,y)\)分散(3)
\(v(x+y)=v(x)+v(y)+2cov(x,y)\)
\(y=a\)を代入(\(a\)は定数)
\(v(x+a)=v(x)+v(a)+2cov(x,a)\)
\(a\)は定数なので、\(v(a)=0, cov(x,a)=0\)
よって
\(V(x+a)=V(x)\)
分散(4)
\(V(ax)\)
\(=E\{(ax-E(ax))^2\}\)
\(=E\{(ax-aE(x))^2\}\)
\(=E\{a^2x^2-2a^xE(x)+a^2E(x)^2\}\)
\(=E\{a^2(x^2-2xE(x)+E(x)^2)\}\)
\(=a^2E\{(x-E(x)^2\}\)
\(=a^2V(X)\)
統計検定2級対応問題
2018年6月問9 2017年6月問9, 2016年11月問8,問11
ご購入はこちら
統計用語集
確率変数:値が確率的に定まる変数
期待値:ある試行を行ったとき、結果として得られる数値の平均値。
分散:データの散らばり具合を表す。
標準偏差:分散の正の平方根
共分散:2組の対応するデータの関係を表す。
相関係数:2組の対応するデータの関係の強弱を表す。
*1:x)\) | 167 | 187 | 156 | 176 | 177 | 170 | 171 | 165 |
体重\((y)\) | 60 | 80 | 55 | 63 | 65 | 64 | 70 | 59 |
共分散は以下の式でも求めることができます。