ローレンツ曲線とジニ係数

「格差」を視覚化するローレンツ曲線と、数値で測るジニ係数

難易度 Lv 3 / 10想定時間:約20

できるようになること


「平均年収500万円」の2つの社会

ある社会Aでは全員が年収500万円です。社会Bでは、8割の人が年収200万円、2割の人が年収1700万円です。

どちらも平均は500万円ですが、社会Aは完全に均等、社会Bは極端に偏っています。

平均だけでは格差は見えません。「どれだけ不均等に分配されているか」を測る道具が必要です。


ローレンツ曲線とは

ローレンツ曲線(Lorenz curve)は、所得などの分配の不均等さをグラフで示す方法です。

作り方は次のとおりです。

  1. データを小さい順に並べる
  2. 横軸に「累積人口割合」(下位何%か)を取る
  3. 縦軸に「累積所得割合」(その人たちの所得合計が全体の何%か)を取る
  4. 各点をつないで曲線にする

もし全員の所得が同じなら、「下位20%の人が全所得の20%を、下位50%が50%を…」と、各点は対角線上に並びます。この対角線を完全平等線(45度線)と呼びます。

実際の社会では低所得者が多いため、曲線は完全平等線より下に膨らみます。膨らみが大きいほど、格差が大きいことを意味します。

ローレンツ曲線とジニ係数の関係

例:5人のデータでローレンツ曲線を描く

5人の月収(万円)が 10, 20, 30, 40, 100 だったとします。合計は200万円です。

まず小さい順に並んでいることを確認し、累積値を計算します。

月収(万円)累積人口割合所得割合累積所得割合累積所得割合(小数)
1人目1020%5%5%0.05
2人目2040%10%15%0.15
3人目3060%15%30%0.30
4人目4080%20%50%0.50
5人目100100%50%100%1.00

数式に代入する際は、パーセントではなく小数(0から1の値)を使います。右端の列が計算用の値です。

この表から、(0, 0), (20, 5), (40, 15), (60, 30), (80, 50), (100, 100) を結ぶとローレンツ曲線になります。

「下位80%の人が全所得の50%を占めている」と読み取れます。残り20%(5人目)が全所得の50%を独占しているため、かなりの偏りがあります。

完全平等線なら (80, 80) のはずが (80, 50) なので、曲線が大きく下に膨らんでいることが分かります。


ジニ係数とは

ローレンツ曲線は視覚的にわかりやすいですが、「社会Aと社会Bではどちらが不均等か」を正確に比べるには、数値が必要です。

ジニ係数(Gini coefficient)は、ローレンツ曲線と完全平等線の間の面積を使って格差を1つの数値にまとめます。

G=AA+BG = \frac{A}{A + B}

つまり G=2AG = 2A です。また、A=12BA = \frac{1}{2} - B なので G=12BG = 1 - 2B とも書けます。この形が台形公式での計算に使われます。

ジニ係数意味
G=0G = 0完全平等(全員が同額)
G=1G = 1完全不平等(1人が全所得を独占)
0<G<10 < G < 1値が大きいほど格差が大きい

ジニ係数の計算方法

方法1:台形公式

ローレンツ曲線の下の面積 BB を、隣り合う2点を結ぶ台形の和として近似し、G=12BG = 1 - 2B で計算します。

nn 人のデータを小さい順に並べ、累積所得割合を L0=0,L1,L2,,Ln=1L_0 = 0, L_1, L_2, \ldots, L_n = 1 とすると、

B=i=1n1nLi1+Li2B = \sum_{i=1}^{n} \frac{1}{n} \cdot \frac{L_{i-1} + L_i}{2}

G=12B=11ni=1n(Li1+Li)G = 1 - 2B = 1 - \frac{1}{n}\sum_{i=1}^{n}(L_{i-1} + L_i)

方法2:直接公式

データを小さい順に x1x2xnx_1 \leq x_2 \leq \cdots \leq x_n と並べたとき、ジニ係数は次の式でも求められます。

G=2i=1nixini=1nxin+1nG = \frac{2\sum_{i=1}^{n} i \cdot x_i}{n \sum_{i=1}^{n} x_i} - \frac{n+1}{n}

台形公式と同じ結果になりますが、累積割合を計算する手間が省けるため、手計算では便利です。ixii \cdot x_i は「順位が高い(所得が大きい)ほど重みが大きくなる」構造で、不均等の度合いを捕えています。

計算例

先ほどの5人のデータ(10, 20, 30, 40, 100、合計200)で計算します。

台形公式

B=15(0+0.052+0.05+0.152+0.15+0.302+0.30+0.502+0.50+1.002)B = \frac{1}{5}\left(\frac{0 + 0.05}{2} + \frac{0.05 + 0.15}{2} + \frac{0.15 + 0.30}{2} + \frac{0.30 + 0.50}{2} + \frac{0.50 + 1.00}{2}\right)

=15(0.025+0.10+0.225+0.40+0.75)=1.505=0.30= \frac{1}{5}(0.025 + 0.10 + 0.225 + 0.40 + 0.75) = \frac{1.50}{5} = 0.30

G=12×0.30=0.40G = 1 - 2 \times 0.30 = 0.40

直接公式

i=15ixi=1×10+2×20+3×30+4×40+5×100=10+40+90+160+500=800\sum_{i=1}^{5} i \cdot x_i = 1 \times 10 + 2 \times 20 + 3 \times 30 + 4 \times 40 + 5 \times 100 = 10 + 40 + 90 + 160 + 500 = 800

G=2×8005×2005+15=1600100065=1.601.20=0.40G = \frac{2 \times 800}{5 \times 200} - \frac{5+1}{5} = \frac{1600}{1000} - \frac{6}{5} = 1.60 - 1.20 = 0.40

どちらの方法でも G=0.40G = 0.40 が得られます。


解釈の目安

ジニ係数は国・地域の所得格差を比較する際によく使われます。一般的な目安は次のとおりです。

ジニ係数の範囲格差の程度
0.25 未満均等に近い北欧諸国
0.25〜0.35比較的均等西欧・日本
0.35〜0.45中程度の格差アメリカ・中国
0.45 以上格差が大きい南アフリカ・ブラジル
補足

上記は世帯所得で見た場合のおおまかな目安です。所得の種類(税前・税後)、世帯単位か個人単位かによって値が変わります。


よくある誤解

注意
  • 誤解1:ジニ係数が同じなら分布も同じ — ジニ係数は1つの数値で格差を要約するため、同じジニ係数でも分布の形が異なることがあります。ローレンツ曲線の形が異なっていても、面積が同じなら同じジニ係数になります。
  • 誤解2:ジニ係数は所得にしか使えない — ジニ係数はどんな「分配」にも使えます。資産、学力テストの得点分布、企業の市場シェアなど、不均等さを測りたいデータ全般に適用できます。

まとめ

ローレンツ曲線は、データを小さい順に並べて「下位X%が全体のY%を占める」を描いたグラフです。完全平等線(45度線)との乖離が大きいほど、格差が大きいことを示します。

ジニ係数はローレンツ曲線と完全平等線に囲まれた面積から算出される、0から1の値です。0が完全平等、1が完全不平等を意味します。

G=12BまたはG=2ixinxin+1nG = 1 - 2B \quad \text{または} \quad G = \frac{2\sum i \cdot x_i}{n\sum x_i} - \frac{n+1}{n}

ジニ係数は格差を国際比較する際に広く使われる指標ですが、単独ではなくローレンツ曲線と組み合わせることで、格差の性質(低所得層間か高所得層間か)まで読み取れます。