統計検定2級攻略講座

統計検定2級攻略講座講座では、統計検定2級に合格するのに必要な知識を得ることができます。

この講座の特徴

セクションごとの解説

範囲を25セクションに分けて解説しています。統計検定2級ならではのトピックも扱っています。

豊富な例題

統計検定2級に、実際に出題された問題の類題を、解説とともに掲載しています。

統計検定2級の問題集との対応

各セクションには、それに対応した統計検定2級問題集(2016~2018 + 2019年11月)の問題番号を掲載しています。各セクションを読み、すぐに演習をすることができます。

2016~2018の過去問を掲載した、の統計検定2級公式問題集は、こちらから購入できます。

2019年11月の問題は、こちらから無料でダウンロードできます。

この講座を始める前に

1.この講座は、高校レベルの数学(数学3まで)を想定しています。ですが、そこまで難しい数学は出てこないので、分からないところや忘れているところは、適宜ググれば対応可能です。

2.この講座は、統計検定2級の範囲を全て網羅していません。ヒストグラムや、相関係数など、高校の範囲に含まれるもの、出題頻度が少ないものは、この講座に含まれていません。しかし、この講座の内容をマスターすれば、実際の問題の9割程度はカバーされますので、ご安心ください。

それでは、以下が統計検定2級完全攻略講座です。もちろんですが、全て無料です。質問などは僕のツイッターのダイレクトメッセージに送っていただければ、回答可能です。

統計検定2級完全攻略講座

データの活用
ラフスパイレス指数
ローレンツ曲線とジニ係数
コレログラムと自己相関
確率論の基本
確率論の基礎
条件付き確率
ベイズの定理
確率変数・確率分布
確率変数
確率分布
歪度と尖度
確率密度関数
分布関数・パーセント点
正規分布(準備中)
正規分布から派生する分布
ポアソン分布
チェビシェフの不等式
推定
点推定と区間推定
不偏推定量と一致推定量
分布表の見方
母平均の推定
母比率の推定
母分散の推定
仮説検定(統計的検定)
仮説検定(統計的検定)とは?
母平均の差の検定
母比率の差の検定
母分散の比の検定
適合度の検定
独立性の検定
第1種の過誤と第2種の過誤
分散分析・回帰分析・統計ソフトウェアの活用
分散分析
回帰分析

おすすめサイト、文献

こちらの講座と合わせて、おすすめしたい書籍やwebサイトを紹介します。

統計web

統計学の基礎を網羅したサイトです。

統計学入門 (基礎統計学Ⅰ)

統計学をより数学的に理解したい方向け。長年愛読されているだけあります。

統計検定2級過去問題集 演習をするのにおすすめです。こちらの講座には対応問題も掲載しているので、相性抜群かと。

ワードプレスのスマホ版アプリがすごい

ワードプレスでブログをはじめたわけですが、何しろいちいちパソコンを立ち上げるのが面倒。

このブログを閉鎖して、noteに移行しようと考えたりしましたが、規約違反により記事が消されるなど、自由に書けないという点で断念。

何かいい方法はないかと、探してときに見つけたのが、こちらの「ワードプレスのアプリ版(βバージョン)」。以前から、Wordpress.comのアプリはあったのですが、そちらはhatena等と同様の、無料ブログ。独自ドメインで運用しているブログには、非対応でした。それが、今回ベータ版でありながら対応ということで、とても喜ばしいことです。

この記事では、ワードプレスのアプリのダウンロード方法と、簡単なレビューをしています。

ダウンロード方法

1.Test Flightをダウンロード

Test Flightとは、アップル公式のアプリで、様々なアプリのβバージョンをダウンロードすることができます。

こちらのリンクの"View in App Store"からダウンロードすることができます。

2.Wordpressβバージョンをダウンロード

Test Flightのダウンロードが、完了すると下のリンクから、Wordpressのβバージョンにアクセスすることができます。

こちらのリンクの"Start Testing"ボタンからダウンロードすることができます。

ダウンロード完了!

いよいよ自分のワードプレスアカウントにログインして、実際にアプリを使うことができます。

レビュー

1.エディタ

記事を投稿する時に使うエディタ。ブロック、クラシック、htmlの3種類があります。

ブロックエディタは、文書を書くしか、できないです。

クラシックエディタは、簡単なコード(h1~h6, 太字, リスト)を適用することができます。画像やリンクの挿入も行うことができます。hatenablogやnoteのような使い勝手です。

htmlは、文書とともにhtmlコードが表示されます。

エディタの選択画面

画像挿入

画像サイズやキャプションを指定することができるので、とても便利です。

カスタムコード

カスタムコードを設定するには、自らコードを入力する必要があります。自分で枠や、ボタンをデザインできるのが、ワードプレスの醍醐味ですが、これをアプリでやろうとするととても面倒です。

カスタムコードの入力をする際には、htmlエディタに切り替える必要がある。

こんな人におすすめ!

  • アプリでブログを完結させたい
  • 必要最低限の機能だけで満足
  • デザインにあまり拘らない

ワードプレスアプリ版では、敷居の高いワードプレスブログを、hatenablogやnote感覚で使うことができます。しかし、カスタムコードを使ってサイトを装飾したり、微調整をしたりしたいという人にはあまり向いていないです。

最後に

百聞は一見にしかず。みなさんもぜひご自身の端末に、アプリ版ワードプレスをダウンロードしてみてください。良いところ、残念なところは使う人によって違うはずです。

ちなみに、僕はこちらの記事をすべてアプリで作成しました。小さなバクはありますが、ストレスなく使うことができました。

(追記)

この記事を書き終えて、アップロードする直前にアプリが落ち、文書が半分ほど消えてしまいました。ファ◯キンヘール。

右上にある、"Update"ボタンで、頻繁に上書き保存することを強くお薦めします!

回帰分析の出力結果の読み取り方【統計入門】

この記事では、回帰分析の基礎となる考え方と、回帰分析の結果の読み取りかたについて、解説していきます。
統計検定2級対応問題 2019年11月問18,2018年11月問18, 2018年6月問2,問14, 2017年11月問2,問12, 2017年6月問15, 2016年11月問16, 2016年6月問5,問14 ご購入はこちら

回帰分析とは?

回帰分析:目的となる変数Yを、要因となる変数Xによって説明するための統計的手法。

回帰分析は、目的となる変数\(Y\)を変数\(X\)を使って説明、もしくは予想するのに、使われます。\(Y\)を\(X\)の式で表すことによって、\(X\)と\(Y\)の関係を表します。\(X\)を説明変数、\(Y\)を目的変数\(X\)と\(Y\)の関係を表す式回帰式といいます。

回帰分析をすると、このように(Y)を(X)で表した式を得ます。

この式が表すのは、

  1. \(X\)が\(1\)単位増えたら、\(Y\)は\(a\)増える。
  2. \(X\)が\(0\)のとき、\(Y=b\)

ここからは、例を見て理解を深めましょう。

例:単回帰分析

この回帰式から読み取れること
  • 広告費が3万円の店の売り上げは106万円であると予想される。
  • 広告費を1万円増やすごとに、売り上げは2万円上がる予想される。
  • 広告を全く出さなかった店の売り上げは100万円であると予想される。

このように、1つの説明関数を使う回帰分析を、単回帰分析と言います。

例2:重回帰分析

以下はあるチェーン店の売り上げについて、広告費、従業員数、駅からの距離を説明関数に、回帰分析結果をした結果である。

(Y=1.5X_1+3X_2-5X_3+150)

(X_1):広告費(万円) (X_2):従業員数(人) (X_3):駅からの距離(km)

この回帰式から読み取れること
  • 広告費が1万円、従業員数が3人、駅からの距離が2kmの店の売り上げは、\(1.5\times1+3\times3-5\times2+100=106.5\)万円であると予想される。
  • 従業員を1人増やすと、売り上げは3万円上がると予想される。
  • 駅からの距離が1km遠くなるごとに、売り上げは5万円下がると予想される。

このように、2つの説明関数を使う回帰分析を、重回帰分析と言います。

回帰式の求め方:最小2乗法

回帰式は最小2乗法によって求められます。

最小2乗法:データとの距離の2乗の和を最小にするような回帰式を求める。

広告費と店の売り上げについての例を使って、説明していきます。こちらは、広告費と店の売り上げについて、プロットしたものです。

ここに回帰式によって描かれる直線(回帰直線)ひきます。このとき、それぞれの点と直線との距離の2乗の和が最小になるようにします。

(具体的な計算方法についてはこちら

これで回帰式が求められました。これによって、広告費によって、売り上げを予想することが可能になります。

説明関数が2つや3つに増えても、回帰式の求め方は変わりません。

回帰分析の出力の読み取り方

ここからは実際に回帰分析をした際に得られる出力を、どのように読み取ればいいのか、解説していきます。

この段階では、何がなんだかわかりません。ご心配なく。ここから1つ1つの数値が何を表すのか、説明していきます。

Estimate:\(\beta_0 〜 \beta_3\)の推定値

Estimateはそれそれの説明変数の係数の推測値です。この結果より

というような重回帰モデルが予測されます。

Std. Error:標準誤差

標準誤差:推定量のばらつきを表す統計量。

標準誤差が大きいと、推定値は、使う標本によって大きく異なり、モデルはあまり正確ではないということができます。

逆に、標準誤差が小さいと、推定値は、使う標本に依存しにくく、モデルは正確であるということができます。

t-value, Pr(<|t|):推定値の仮説検定の結果

推定値が正しいものか判断するために、回帰分析では(\(\beta_0 〜 \beta_3\))の推定値それぞれに対し、仮説検定が行われています。

\(\beta_0\)に関する仮説検定は…
帰無仮説・対立仮説

\(H_0\)が正しい、つまり\(\beta_0=0\)のとき、

分散分析・分散分析表(一元配置)【統計入門】

この記事では、分散分析の基本的な考え方と、分析結果の見方について解説しています。
統計検定2級対応問題 2017年11月問16, 2017年6月問14 ご購入はこちら

分散分析とは

分散分析:統計的検定の1つで、3つ以上の母平均に違いがあるのか調べるのに、用いられる。

母平均に影響を与えうる要因が1つである場合、一元配置の分散分析となります。

[voice icon="https://hikitaro.com/wp-content/uploads/2019/06/40089718.2b41005ba0d1899a3f0bf130c1f85933.19060315-1-e1561226485604.jpg" name=“ユウガ” type="l"]名前は分散分析だけど、調べるのは母平均の違いなので、注意が必要![/voice]

分散分析表の見方

ここからは、実際に分散分析の結果をまとめた、分散分析表を見て、どのように母平均の違いについて調べることができるのか、解説していきます。

[voice icon="https://hikitaro.com/wp-content/uploads/2019/06/40089718.2b41005ba0d1899a3f0bf130c1f85933.19060315-1-e1561226485604.jpg" name=“ユウガ” type="l"]この段階では、何がなんだかわかりません。ご心配なく。ここから1つ1つの数値が何を表すのか、説明していきます。[/voice]

1.平方和/Sum Sq

平方和はクラスの行と、残差の行にあります。

クラスの行の平方和:水準間平方和

水準(今回はクラス)の間の差を計算するのが、水準間平方和です。

\(水準間平方和=\sum (全体\)の\(平均-水準平均)^2\)

今回の例では、

残差の平方和:クラス内の差の2乗

水準内の差を計算するのが、残差の平方和です。

\(残差\)の\(平方和=\sum(データ\)の\(値-水準平均)^2+…+\sum(データ\)の\(値-水準平均)^2\)=35807

今回の例では、

2.自由度/Df

自由度とは、自由に取れる値の数。分散分析では、「それぞれの平方和を計算する際に、自由に取れる値の数」を意味します。

\(水準間\)の\(自由度(f_1)=水準数-1\)

水準間の平均を計算する際、最後の1つの値は、他の値によって決まります。これは全体平均の縛りがあるからです。

今回の例では、3組の水準平均は1組と2組の水準平均によって定まります。

よって自由度は\(3-1=2\)となっています。

\(水準内\)の\(自由度(f_2)=(各水準\)の\(データ数-1)\times 水準数\)

水準内の平均を計算する際、それぞれの水準の最後の1つの値は、他の値によって決まります。

例えば、1組に関して、\(\sum(1組のデータ-1組の平均)^2\)を求める際、最後の1人の点数は、他の\(28\)人の点数で決まってしまいます。これは、水準平均の縛りがあるからです。

よって自由度は、\((29-1)\cdot 3=84\)となります。

3.平方平均/Mean Sq

統計的検定をするために、平方平均を用います。

分散分析では、帰無仮説、対立仮説を

というように立てます。そして、

母平均が全て等しいとき、平方平均の比は自由度\((f_1,f_2)\)の\(F\)分布に従います。

今回の例では、

$$\frac{クラス間平方平均}{クラス内平方平均}$$

が自由度\((2,84)\)の\(F\)分布に従います。

4.F値・Pr(>F)

F値は平方平均の比の値、\(Pr(>F)\)は\(F\)値が、今回計算されたものよりも大きくなる確率を示します。下の図の通りです。

分散分析表からわかること

分散分析によって、母平均が全て等しいときに、F値が\(1.38\)よりも大きくなる確率は\(25\)%であるということが分かりました。

この結果を有意水準5%で検定すると、帰無仮説を採択。つまり、母平均は全て正しく、テストの点数はクラスによって変わらないと判断します。

有意水準(10)%で検定しても同様に、母平均は全て正しいと判断することになります。

\(Pr(>F)\)の値によって、どのような統計的検定でどちらの仮説を採択するのか、決まります。

統計検定2級対応問題 2017年11月問16, 2017年6月問14 ご購入はこちら

独立性の検定【統計入門】

この記事では、独立性の検定の方法について、例を使って分かりやすく説明していきます。
この記事を読む前に、、、

統計的検定について怪しい方は、こちらの記事を先に読むことをお勧めします。 [blogcard url="https://hikitaro.com/what_is_statistical_test/"]

統計検定2級対応問題 2018年6月問15, 2017年6月問13, 2016年6月問13 ご購入はこちら

統計的検定の手順

統計的検定では、まず帰無仮説と対立仮説を定めます。帰無仮説が正しいと仮定し、統計量の分布を調べます。ある確率よりも実際の統計量が得られる確率が小さかったとき、対立仮説を採用。そうでないとき帰無仮説を採用します。

独立性の検定とは?

独立性の検定:2つの事象か独立であるか、調べる検定。

例えば、「塾に通っているかどうか」と「第一志望の学校に合格するかどうか」は関係があるのか調べたいとき、この独立性の検定を使います。

クロス集計表によって情報を整理し、それぞれの観測値について、統計量を計算します。

1.帰無仮説、対立仮説を立てる。

「2つの事象は独立である」という前提で考えていきます。独立であったときの予測値と、観測値が大きく離れていた場合、2つの事象は独立でない、何か関係があると判断します。

2.予測が正しいときの分布を調べる。

予測が正しいとき、

適合度の検定【統計入門】

この記事では、適合度の検定の方法について、例を使って分かりやすく説明していきます。
この記事を読む前に、、、

統計的検定について怪しい方は、こちらの記事を先に読むことをお勧めします。 [blogcard url="https://hikitaro.com/what_is_statistical_test/"]

統計検定2級対応問題 2018年11月問16,2017年11月問15 ご購入はこちら

統計的検定の手順

統計的検定では、まず帰無仮説と対立仮説を定めます。帰無仮説が正しいと仮定し、統計量の分布を調べます。ある確率よりも実際の統計量が得られる確率が小さかったとき、対立仮説を採用。そうでないとき帰無仮説を採用します。

適合度の検定とは?

適合度の検定:予測値に対し、標本の観測値が適合するか調べる検定。

例えば、「遅刻する生徒の数は、曜日によらない」という予測に対し、実際に遅刻する生徒の数を調べ、この予測は正しいのかどうか検証するのが、適合度の検定です。

1.帰無仮説、対立仮説を立てる。

予測が正しいという前提で考えていきます。予測値からのずれがあまりに大きい時には、予測は間違いであると判断します。

2.予測が正しいときの分布を調べる。

予測が正しいとき。。。

証明については、こちらのサイトを参考にしてください。

3.有意水準の決定

有意水準は5%や10%に設定されることが多いです。帰無仮説上で起こる確率が5%/10%より少ないとき、帰無仮説を棄却し、対立仮説を採択します。

4.棄却域の決定

統計量の分布+有意水準の情報が揃ったとき、棄却域を求めることができます。

5.統計量を求め、棄却域内に入るか検証。

実際に標本から観測値を求め、統計量を計算し、帰無仮説上でどのくらいの確率で、その統計量になるのか調べます。

検定完了! これで、統計的検定が完了です。下の例題を見て、理解を深めましょう。

例題:適合度の検定

1.帰無仮説、対立仮説を立てる。

帰無仮説と対立仮説は、問題によって与えられている。

2.予測が正しいときの分布を調べる。

予測が正しいとき、統計量

(\chi2 = \sum \frac{(観測値-予測値)2}{予測値})

は、自由度\(k-1\)の\(\chi^2\)分布に従う。

ここで、観測値の数は月〜金の遅刻生徒数の5つなので、 自由度は、(5-1=4)

3.有意水準の決定

有意水準は5%。

4.棄却域の決定

分布表より…

棄却域は、

(\chi2 < 0.48, 5.39 < \chi2)

5.統計量を求め、棄却域内に入るか検証。

予測値を求める

帰無仮説は「遅刻する生徒の数は、曜日によらない」なので、全ての曜日で遅刻生徒数が同じになります。

遅刻した生徒は合計\(215\)人なので、帰無仮説上では全ての曜日での遅刻生徒数は...

$$\frac{215}{5} = 43$$

これが、全ての曜日に対する予測値です。

統計量を計算する

$$\frac{(観測値-予測値)2}{予測値}$$

を全ての曜日に対して計算し、足し合わせます。

$$\chi2 = \sum \frac{(観測値-予測値)2}{予測値}$$ (=\frac{(53-43)2}{43}+\frac{(45-43)2}{43}+\frac{(40-43)2}{43}+\frac{(47-43)2}{43}+\frac{(30-43)2}{43}) $$=6.930233$$

これは棄却域に入る。よって帰無仮説を棄却し、対立仮説を採択。予測は間違っていたと判断する。

統計検定2級対応問題 2018年11月問16,2017年11月問15 ご購入はこちら

母分散の比の検定【統計入門】

この記事では、母分散の比の検定の手順を1から説明しています。
この記事を読む前に!

統計的検定について怪しい方は、この記事を先に読むことをお勧めします。

[blogcard url="https://hikitaro.com/what_is_statistical_test/"]

統計検定2級対応問題 2018年6月問16,2017年7月問12[4] ご購入はこちら

統計的検定の手順

統計的検定では、まず帰無仮説と対立仮説を定めます。帰無仮説が正しいと仮定し、統計量の分布を調べます。ある確率よりも実際の統計量が得られる確率が小さかったとき、対立仮説を採用。そうでないとき帰無仮説を採用します。

母分散の比の検定とは?

ある2つの母集団(A),(B)の母分散(\sigma2_A),( \sigma2_B)が等しいと言えるのかどうか、不偏分散や標本数を使い統計的に検証するのが、この母分散の比の検定です。

母平均や母比率が等しいかどうか検定する際には、母平均・母比率の差について検証しましたが、母分散の場合はとなります。

さらに、母分散の比の検定では、2つの母集団は正規分布に従う必要があります。

1.帰無仮説と対立仮説を立てる。

二つの正規母集団の母分散は等しいというのを前提で、考えていきます。この記事では、両側検定について考えます。

2.帰無仮説が正しいとき、標本から得られる統計量が従う分布を調べる。

(\sigma2A=\sigma2_B)のとき、不偏分散の分布は...

説明

母集団\(A\),\(B\)と、それぞれの標本についての情報を整理します。

母集団母分散不偏分散標本数
\(A\)\(\sigma^2_A\)\(u_A^2\)\(n\)
\(B\)\(\sigma^2_B\)\(u_B^2\)\(m\)

・(A)について

・(B)について

(この理由については、こちらをご覧ください)

・一方、\(F\)分布は以下のように定義されます。

(詳しくはこちら

・これに\(A\)と\(B\)についての情報を代入すると…

3.有意水準の決定

有意水準は5%や10%に設定されることが多いです。帰無仮説上で起こる確率が5%/10%より少ないとき、帰無仮説を棄却し、対立仮説を採択します。

4.棄却域の決定

不偏分散の比の分布+有意水準の情報が揃ったとき、棄却域を求めることができます。

5.統計量を求め、棄却域内に入るか検証。

実際に標本から統計量を求め、帰無仮説上でどのくらいの確率で、その統計量になるのか調べます。

検定完了! これで、統計的検定が完了です。

統計検定2級対応問題 2017年7月問12[4] ご購入はこちら