モーメント・歪度・尖度

平均と分散の「その先」── 分布の形を数値で測る

難易度 Lv 3 / 10想定時間:約20

できるようになること


同じ平均・同じ分散なのに、形が違う

2つの確率変数を考えます。XX はあるテストの得点、YY は別の調査で測定した所要時間です。どちらも平均が同じ、分散も同じだとしましょう。

しかし、XX の分布は左右対称な釣鐘型をしているのに対し、YY の分布は右に裾が長く伸びた形をしています。大部分の人は短時間で終わるが、少数の人がとても長い時間をかけている——そんなイメージです。

平均と分散は「中心」と「ばらつき」を教えてくれますが、この「形の違い」までは教えてくれません。

「外れ値と歪み」では、歪みを視覚的に判断しました。この単元では、分布の形を数値で正確に測る道具を手に入れます。その道具が、モーメント(moment)、歪度(skewness)、尖度(kurtosis)です。


モーメントとは何か

「期待値」で E[X]E[X] を学びました。「分散と標準偏差」で E[(Xμ)2]E[(X - \mu)^2] を学びました。実は、これらはモーメントという一般的な概念の特殊なケースです。

原点まわりのモーメント

kk 次の原点まわりのモーメント(moment about the origin)は、XXkk 乗の期待値です。

μk=E[Xk]\mu'_k = E[X^k]

k=1k = 1 のとき μ1=E[X]\mu'_1 = E[X] で、これは期待値そのものです。k=2k = 2 のとき μ2=E[X2]\mu'_2 = E[X^2] で、分散の計算公式 V[X]=E[X2](E[X])2V[X] = E[X^2] - (E[X])^2 に登場しました。

平均まわりのモーメント(中心モーメント)

kk 次の中心モーメント(central moment)は、平均 μ=E[X]\mu = E[X] からのズレの kk 乗の期待値です。

μk=E[(Xμ)k]\mu_k = E[(X - \mu)^k]

次数 kk中心モーメント意味
1μ1=0\mu_1 = 0平均からのズレの平均は常に 0
2μ2=V[X]\mu_2 = V[X]分散(ばらつき)
3μ3\mu_3歪度の材料(左右の偏り)
4μ4\mu_4尖度の材料(裾の厚さ)

期待値は 1 次の原点まわりモーメント、分散は 2 次の中心モーメントの別名です。このように、モーメントは「kk を大きくするほど分布のより細かい性質が見える」仕組みになっています。


歪度:分布の「左右の偏り」を測る

歪度(skewness)は、分布が左右対称からどの方向にどれだけずれているかを数値で表す指標です。

3 次中心モーメント μ3\mu_3 を標準偏差 σ\sigma の 3 乗で割り、スケールの影響を取り除きます。

γ1=μ3σ3=E[(Xμ)3]σ3\gamma_1 = \frac{\mu_3}{\sigma^3} = \frac{E[(X - \mu)^3]}{\sigma^3}

この式は、標準化した確率変数 Z=(Xμ)/σZ = (X - \mu)/\sigma の 3 次の期待値 E[Z3]E[Z^3] に等しくなります。標準化によって単位が消えるため、スケールが異なる分布の形を純粋に比較できます。

なぜ 3 乗なのか

分散(2 乗)では、平均より大きいズレも小さいズレも正の値になるため、「どちら向きに偏っているか」は分かりません。

3 乗は奇数乗なので、正負の符号が保存されます。

身近な例

ポイント

歪度の符号は「長い裾がどちら側にあるか」を表します。「正の歪み」は右に裾が長い分布であり、データの山(最頻値)は左寄りになります。名前と山の位置が逆に見えるので注意してください。

歪度による分布の形の違い:負の歪み・対称・正の歪み


尖度:分布の「裾の厚さ」を測る

尖度(kurtosis)は、分布の裾がどれだけ「厚い」か——つまり、極端な値がどれだけ出やすいかを表す指標です。

4 次中心モーメント μ4\mu_4 を標準偏差 σ\sigma の 4 乗で割って定義します。

尖度=μ4σ4=E[(Xμ)4]σ4\text{尖度} = \frac{\mu_4}{\sigma^4} = \frac{E[(X - \mu)^4]}{\sigma^4}

正規分布を基準にする

正規分布では、計算すると尖度が常に 33 になります。そこで、正規分布をゼロ基準に合わせた超過尖度(excess kurtosis)が広く使われます。

超過尖度=μ4σ43\text{超過尖度} = \frac{\mu_4}{\sigma^4} - 3

超過尖度分類特徴
>0> 0尖峰型(leptokurtic)正規分布より裾が厚い。極端な値が出やすい
=0= 0正規型(mesokurtic)正規分布と同程度
<0< 0扁平型(platykurtic)正規分布より裾が薄い。極端な値が出にくく、一定の範囲になだらかに散らばる

なぜ 4 乗なのか

4 乗は偶数乗なので正負の区別はなくなりますが、平均から遠い値ほど極端に増幅されます。たとえば、平均からのズレが 11 なら 14=11^4 = 1 ですが、ズレが 33 なら 34=813^4 = 81 です。この「増幅効果」により、裾にある極端な値の存在が尖度に強く反映されます。

身近な例

注意

尖度は「ピークのとがり具合」と説明されることがありますが、これは誤解を招きやすい表現です。本質は裾の厚さです。金融データのように「ふだんは安定しているが、まれに極端な変動が起きる」分布は超過尖度が正になります。

ヒント

ExcelのKURT関数やPythonのscipy.stats.kurtosis(デフォルト設定)は、すでに 3-3 を済ませた超過尖度を返します。ソフトウェアの出力を読むときは、そのソフトが返す値がどちらの定義かを確認してください。

尖度による分布の形の違い:扁平型・正規型・尖峰型


具体例:離散分布で計算する

確率変数 XX の分布が次のように与えられているとします。

xx12345
P(X=x)P(X=x)0.10.20.40.20.1

ステップ 1:期待値と分散

E[X]=1(0.1)+2(0.2)+3(0.4)+4(0.2)+5(0.1)E[X] = 1(0.1) + 2(0.2) + 3(0.4) + 4(0.2) + 5(0.1)

=0.1+0.4+1.2+0.8+0.5=3.0= 0.1 + 0.4 + 1.2 + 0.8 + 0.5 = 3.0

E[X2]=12(0.1)+22(0.2)+32(0.4)+42(0.2)+52(0.1)E[X^2] = 1^2(0.1) + 2^2(0.2) + 3^2(0.4) + 4^2(0.2) + 5^2(0.1)

=0.1+0.8+3.6+3.2+2.5=10.2= 0.1 + 0.8 + 3.6 + 3.2 + 2.5 = 10.2

V[X]=E[X2](E[X])2=10.29.0=1.2V[X] = E[X^2] - (E[X])^2 = 10.2 - 9.0 = 1.2

σ=1.21.095\sigma = \sqrt{1.2} \approx 1.095

ステップ 2:3 次中心モーメント → 歪度

各値について (x3)3(x - 3)^3 を計算し、確率で重み付けします。

μ3=E[(X3)3]\mu_3 = E[(X-3)^3]

=(2)3(0.1)+(1)3(0.2)+03(0.4)+13(0.2)+23(0.1)= (-2)^3(0.1) + (-1)^3(0.2) + 0^3(0.4) + 1^3(0.2) + 2^3(0.1)

=(8)(0.1)+(1)(0.2)+0+(1)(0.2)+(8)(0.1)= (-8)(0.1) + (-1)(0.2) + 0 + (1)(0.2) + (8)(0.1)

=0.80.2+0+0.2+0.8=0= -0.8 - 0.2 + 0 + 0.2 + 0.8 = 0

γ1=μ3σ3=01.0953=0\gamma_1 = \frac{\mu_3}{\sigma^3} = \frac{0}{1.095^3} = 0

歪度が 00 です。実際、x=3x = 3 を中心に確率が左右対称に配置されているため、この結果は直感とも一致します。

確率を変えると歪度はどうなるか

同じ値域 {1,2,3,4,5}\{1, 2, 3, 4, 5\} で、確率だけを非対称にしてみましょう。

xx12345
P(X=x)P(X=x)0.40.30.150.10.05

この分布では小さい値に確率が集中し、右に裾が伸びています。期待値は E[X]=2.1E[X] = 2.1 で、計算すると歪度は γ10.67\gamma_1 \approx 0.67(正の歪み)になります。同じ値域でも、確率の配置を変えるだけで歪度が非対称性を捉えることが確認できます。

ステップ 3:4 次中心モーメント → 尖度

元の対称な分布に戻り、各値について (x3)4(x - 3)^4 を計算します。

μ4=E[(X3)4]\mu_4 = E[(X-3)^4]

=(2)4(0.1)+(1)4(0.2)+04(0.4)+14(0.2)+24(0.1)= (-2)^4(0.1) + (-1)^4(0.2) + 0^4(0.4) + 1^4(0.2) + 2^4(0.1)

=(16)(0.1)+(1)(0.2)+0+(1)(0.2)+(16)(0.1)= (16)(0.1) + (1)(0.2) + 0 + (1)(0.2) + (16)(0.1)

=1.6+0.2+0+0.2+1.6=3.6= 1.6 + 0.2 + 0 + 0.2 + 1.6 = 3.6

σ4=(σ2)2=(V[X])2\sigma^4 = (\sigma^2)^2 = (V[X])^2 なので

尖度=μ4σ4=μ4(V[X])2=3.61.22=3.61.44=2.5\text{尖度} = \frac{\mu_4}{\sigma^4} = \frac{\mu_4}{(V[X])^2} = \frac{3.6}{1.2^2} = \frac{3.6}{1.44} = 2.5

超過尖度=2.53=0.5\text{超過尖度} = 2.5 - 3 = -0.5

超過尖度が負なので、この分布は正規分布より裾が薄い(扁平型)です。値の範囲が 1〜5 に限られているため、極端な値が出にくいことが数値に反映されています。


代表的な分布の歪度と尖度

学んできた分布について、歪度と超過尖度を一覧にします。各値は、それぞれの分布の単元で扱った定義から導出されるものです。

分布歪度超過尖度
正規分布0000
一様分布001.2-1.2
指数分布2266
ポアソン分布 Po(λ)Po(\lambda)1λ\dfrac{1}{\sqrt{\lambda}}1λ\dfrac{1}{\lambda}

正規分布は歪度・超過尖度ともに 00 で、「形」の基準になっています。一様分布は左右対称(歪度 =0= 0)ですが、超過尖度が 1.2-1.2 と負であり、正規分布より裾が薄いことが分かります。指数分布は歪度 22、超過尖度 66 と、右に強く歪み、裾も厚い分布です。

ポアソン分布は λ\lambda が大きくなるほど歪度と超過尖度がゼロに近づきます。これは λ\lambda が大きいとき、ポアソン分布が正規分布に近づくことと対応しています。


よくある誤解

注意

「歪度が 0 なら正規分布である」 — これは誤りです。左右対称な分布は歪度が 0 になりますが、逆は必ずしも成り立ちません。非対称な分布でも、正と負のズレの 3 乗がたまたま打ち消し合い、歪度が 0 になるケースが存在します。歪度が 0 だからといって左右対称とは限りませんし、ましてや正規分布であるとは限りません。分布の形を完全に特定するには、すべての次数のモーメント(あるいは分布関数そのもの)の情報が必要です。


まとめ

モーメントは E[Xk]E[X^k](原点まわり)や E[(Xμ)k]E[(X-\mu)^k](中心モーメント)として定義される量で、kk の値によって分布の異なる側面を捉えます。1 次の原点まわりモーメントは期待値、2 次中心モーメントは分散に対応し、3 次と 4 次からは分布の「形状」が読み取れます。

歪度 γ1=μ3/σ3\gamma_1 = \mu_3 / \sigma^3 は分布の左右非対称性を測り、正なら右裾が長く、負なら左裾が長いことを示します。尖度 μ4/σ4\mu_4 / \sigma^4 は裾の厚さを測り、正規分布を基準にした超過尖度(尖度 3- 3)が正なら「極端な値が出やすい分布」、負なら「極端な変動が起きにくく、一定の範囲に収まりやすい分布」と判断できます。

「外れ値と歪み」で直感的に感じていた分布の形の違いを、モーメントを使って数値で裏付けること——それがこの単元の核心です。歪度や尖度の値をもとに「平均だけで判断してよいか」を見極められるようになれば、データの読み方が一段階深くなります。