ローレンツ曲線・ジニ係数【統計入門】

この記事では、データの偏り具合を示す、ローレンツ曲線とジニ係数について扱っています。ローレンツ曲線が何を示すのか、ジニ係数はどのように求められるのか。具体例を用いて、分かりやすく解説しています。
本日のメニュー
ローレンツ曲線ジニ係数
おまけ統計用語集
統計検定2級対応問題 2018年6月問3 ご購入はこちら

ローレンツ曲線とは?

ローレンツ曲線:データの偏り具合を表すための曲線。所得や貯蓄の不平等さ(格差)を視覚的に示すことができる。

ここからは、実際にデータを使ってローレンツ曲線を作成していきます。

使うデータ:ある村の住人の収入

人口20人のある村で、住人の収入にどれだけ格差があるのか調べるため、ローレンツ曲線を作成しました。

横軸:人口の累積相対度数 縦軸:収入の累積配分比率

ローレンツ曲線は、村人を収入の少ない方から並べます。そして、人口の累積相対度数に対し、その人たちの収入が、全体のどれだけの割合を占めるのか、プロットしていきます。

赤い線ローレンツ曲線です。

ローレンツ曲線からわかること

ローレンツ曲線は、ある層が全体のどれくらいを占めるのか、知ることができます。上の例では、ある収入層が、全体の収入のどれくらいを占めるのかということを、知ることができます。

完全平等線

完全平等線は、横軸と45度をなす直線。これは、完全に平等で、格差がない場合の、ローレンツ曲線を示します。

格差がない=全員が同じ値ということです。上の例では、20人全員の収入が同じ場合ということになります。これは、 下位20%の収入=上位20%の収入ということです。

この完全平等線から、ローレンツ曲線がどれだけ離れているかによって、不平等さ(格差)の大きさを、視覚的に知ることができます。

ポイント
ローレンツ曲線は、不平等さを視覚的にわかりやすく示す。具体的な大きさは、気にしない。 不平等さの大きさを具体的に知る→ジニ係数

ジニ係数

ジニ係数:不平等さの大きさを測る指標。 $$ジニ係数=2 \times(完全平等線とローレンツ曲線で囲まれた部分の面積)$$

ジニ係数の定義

ジニ係数不平等線が囲む面積を1としたときの、完全平等線とローレンツ曲線で囲まれた部分の面積で定義されます。これは、(完全平等線とローレンツ曲線で囲まれた部分の面積)の2倍に等しいです。

ローレンツ曲線が、視覚的に不平等さの大きさを示すのに対し、ジニ係数は不平等さを定量します。これにより、格差の大きさを比較したりできます。

ローレンツ曲線が完全平等線から、離れれば離れるほど、ジニ係数は大きくなり、これはより不平等さ具合が高いということになります。

上の例では、視覚的に格差の大小を判断していましたが、ジニ係数によって、具体的にどのくらい格差の度合いが違うのか、調べることができます。

ポイント
ジニ係数は、データの不平等さ具合を定量化。 ジニ係数が大きい→より不平等

おまけ:ローレンツ曲線のルール

ローレンツ曲線は、必ず完全平等線より下。完全平等線より上いったり、クロスしたりすることはありません。

ローレンツ曲線が、完全平等線より上にいった場合収入下位20%の住人の収入>収入上位20%の住人の収入となってしまい、矛盾が起こります。

統計検定2級対応問題 2018年6月問3 ご購入はこちら