モーメント・歪度・尖度

平均と分散の「その先」── 分布の形を数値で測る

難易度 Lv 3 / 10想定時間：約20分

できるようになること

モーメント（原点まわり・平均まわり）の定義と、期待値・分散との関係を説明できる
歪度の符号から、分布の非対称性の方向を読み取れる
尖度（超過尖度）から、分布の裾の厚さを正規分布と比較できる

同じ平均・同じ分散なのに、形が違う

2つの確率変数を考えます。 $X$ はあるテストの得点、 $Y$ は別の調査で測定した所要時間です。どちらも平均が同じ、分散も同じだとしましょう。

しかし、 $X$ の分布は左右対称な釣鐘型をしているのに対し、 $Y$ の分布は右に裾が長く伸びた形をしています。大部分の人は短時間で終わるが、少数の人がとても長い時間をかけている——そんなイメージです。

平均と分散は「中心」と「ばらつき」を教えてくれますが、この「形の違い」までは教えてくれません。

「外れ値と歪み」では、歪みを視覚的に判断しました。この単元では、分布の形を数値で正確に測る道具を手に入れます。その道具が、モーメント（moment）、歪度（skewness）、尖度（kurtosis）です。

モーメントとは何か

「期待値」で $E[X]$ を学びました。「分散と標準偏差」で $E[(X - \mu)^2]$ を学びました。実は、これらはモーメントという一般的な概念の特殊なケースです。

原点まわりのモーメント

$k$ 次の原点まわりのモーメント（moment about the origin）は、 $X$ の $k$ 乗の期待値です。

$\mu'_k = E[X^k]$

$k = 1$ のとき $\mu'_1 = E[X]$ で、これは期待値そのものです。 $k = 2$ のとき $\mu'_2 = E[X^2]$ で、分散の計算公式 $V[X] = E[X^2] - (E[X])^2$ に登場しました。

平均まわりのモーメント（中心モーメント）

$k$ 次の中心モーメント（central moment）は、平均 $\mu = E[X]$ からのズレの $k$ 乗の期待値です。

$\mu_k = E[(X - \mu)^k]$

次数 $k$	中心モーメント	意味
1	$\mu_1 = 0$	平均からのズレの平均は常に 0
2	$\mu_2 = V[X]$	分散（ばらつき）
3	$\mu_3$	歪度の材料（左右の偏り）
4	$\mu_4$	尖度の材料（裾の厚さ）

期待値は 1 次の原点まわりモーメント、分散は 2 次の中心モーメントの別名です。このように、モーメントは「 $k$ を大きくするほど分布のより細かい性質が見える」仕組みになっています。

歪度：分布の「左右の偏り」を測る

歪度（skewness）は、分布が左右対称からどの方向にどれだけずれているかを数値で表す指標です。

3 次中心モーメント $\mu_3$ を標準偏差 $\sigma$ の 3 乗で割り、スケールの影響を取り除きます。

$\gamma_1 = \frac{\mu_3}{\sigma^3} = \frac{E[(X - \mu)^3]}{\sigma^3}$

この式は、標準化した確率変数 $Z = (X - \mu)/\sigma$ の 3 次の期待値 $E[Z^3]$ に等しくなります。標準化によって単位が消えるため、スケールが異なる分布の形を純粋に比較できます。

なぜ 3 乗なのか

分散（2 乗）では、平均より大きいズレも小さいズレも正の値になるため、「どちら向きに偏っているか」は分かりません。

3 乗は奇数乗なので、正負の符号が保存されます。

平均より大きい値が遠くまで散らばっていれば、正の 3 乗が大きくなり → $\gamma_1 > 0$ （正の歪み、右に裾が長い）
左右対称なら、正と負が打ち消し合い → $\gamma_1 = 0$
平均より小さい値が遠くまで散らばっていれば、負の 3 乗が大きくなり → $\gamma_1 < 0$ （負の歪み、左に裾が長い）

身近な例

年収データ：大多数は平均付近だが、少数の高所得者が右裾を引っ張る → 正の歪み
簡単すぎたテスト：多くの人が高得点に集中し、少数だけが低得点 → 負の歪み
正規分布：左右完全対称 → 歪度 $= 0$

ポイント

歪度の符号は「長い裾がどちら側にあるか」を表します。「正の歪み」は右に裾が長い分布であり、データの山（最頻値）は左寄りになります。名前と山の位置が逆に見えるので注意してください。

歪度による分布の形の違い：負の歪み・対称・正の歪み

尖度：分布の「裾の厚さ」を測る

尖度（kurtosis）は、分布の裾がどれだけ「厚い」か——つまり、極端な値がどれだけ出やすいかを表す指標です。

4 次中心モーメント $\mu_4$ を標準偏差 $\sigma$ の 4 乗で割って定義します。

$\text{尖度} = \frac{\mu_4}{\sigma^4} = \frac{E[(X - \mu)^4]}{\sigma^4}$

正規分布を基準にする

正規分布では、計算すると尖度が常に $3$ になります。そこで、正規分布をゼロ基準に合わせた超過尖度（excess kurtosis）が広く使われます。

$\text{超過尖度} = \frac{\mu_4}{\sigma^4} - 3$

超過尖度	分類	特徴
$> 0$	尖峰型（leptokurtic）	正規分布より裾が厚い。極端な値が出やすい
$= 0$	正規型（mesokurtic）	正規分布と同程度
$< 0$	扁平型（platykurtic）	正規分布より裾が薄い。極端な値が出にくく、一定の範囲になだらかに散らばる

なぜ 4 乗なのか

4 乗は偶数乗なので正負の区別はなくなりますが、平均から遠い値ほど極端に増幅されます。たとえば、平均からのズレが $1$ なら $1^4 = 1$ ですが、ズレが $3$ なら $3^4 = 81$ です。この「増幅効果」により、裾にある極端な値の存在が尖度に強く反映されます。

身近な例

株価の日次リターン：ふだんは平均付近の小さな変動が続くが、ごくまれに大暴落・急騰が起きる → 正の超過尖度（尖峰型）
成人の身長：極端な外れ値は出にくく、正規分布にほぼ一致 → 超過尖度 $\approx 0$ （正規型）
一様分布：最小値と最大値の間に均等に散らばり、極端な値が構造上出ない → 負の超過尖度（扁平型）

注意

尖度は「ピークのとがり具合」と説明されることがありますが、これは誤解を招きやすい表現です。本質は裾の厚さです。金融データのように「ふだんは安定しているが、まれに極端な変動が起きる」分布は超過尖度が正になります。

ヒント

ExcelのKURT関数やPythonのscipy.stats.kurtosis（デフォルト設定）は、すでに $-3$ を済ませた超過尖度を返します。ソフトウェアの出力を読むときは、そのソフトが返す値がどちらの定義かを確認してください。

尖度による分布の形の違い：扁平型・正規型・尖峰型

具体例：離散分布で計算する

確率変数 $X$ の分布が次のように与えられているとします。

$x$	1	2	3	4	5
$P(X=x)$	0.1	0.2	0.4	0.2	0.1

ステップ 1：期待値と分散

$E[X] = 1(0.1) + 2(0.2) + 3(0.4) + 4(0.2) + 5(0.1)$

$= 0.1 + 0.4 + 1.2 + 0.8 + 0.5 = 3.0$

$E[X^2] = 1^2(0.1) + 2^2(0.2) + 3^2(0.4) + 4^2(0.2) + 5^2(0.1)$

$= 0.1 + 0.8 + 3.6 + 3.2 + 2.5 = 10.2$

$V[X] = E[X^2] - (E[X])^2 = 10.2 - 9.0 = 1.2$

$\sigma = \sqrt{1.2} \approx 1.095$

ステップ 2：3 次中心モーメント → 歪度

各値について $(x - 3)^3$ を計算し、確率で重み付けします。

$\mu_3 = E[(X-3)^3]$

$= (-2)^3(0.1) + (-1)^3(0.2) + 0^3(0.4) + 1^3(0.2) + 2^3(0.1)$

$= (-8)(0.1) + (-1)(0.2) + 0 + (1)(0.2) + (8)(0.1)$

$= -0.8 - 0.2 + 0 + 0.2 + 0.8 = 0$

$\gamma_1 = \frac{\mu_3}{\sigma^3} = \frac{0}{1.095^3} = 0$

歪度が $0$ です。実際、 $x = 3$ を中心に確率が左右対称に配置されているため、この結果は直感とも一致します。

確率を変えると歪度はどうなるか

同じ値域 $\{1, 2, 3, 4, 5\}$ で、確率だけを非対称にしてみましょう。

$x$	1	2	3	4	5
$P(X=x)$	0.4	0.3	0.15	0.1	0.05

この分布では小さい値に確率が集中し、右に裾が伸びています。期待値は $E[X] = 2.1$ で、計算すると歪度は $\gamma_1 \approx 0.67$ （正の歪み）になります。同じ値域でも、確率の配置を変えるだけで歪度が非対称性を捉えることが確認できます。

ステップ 3：4 次中心モーメント → 尖度

元の対称な分布に戻り、各値について $(x - 3)^4$ を計算します。

$\mu_4 = E[(X-3)^4]$

$= (-2)^4(0.1) + (-1)^4(0.2) + 0^4(0.4) + 1^4(0.2) + 2^4(0.1)$

$= (16)(0.1) + (1)(0.2) + 0 + (1)(0.2) + (16)(0.1)$

$= 1.6 + 0.2 + 0 + 0.2 + 1.6 = 3.6$

$\sigma^4 = (\sigma^2)^2 = (V[X])^2$ なので

$\text{尖度} = \frac{\mu_4}{\sigma^4} = \frac{\mu_4}{(V[X])^2} = \frac{3.6}{1.2^2} = \frac{3.6}{1.44} = 2.5$

$\text{超過尖度} = 2.5 - 3 = -0.5$

超過尖度が負なので、この分布は正規分布より裾が薄い（扁平型）です。値の範囲が 1〜5 に限られているため、極端な値が出にくいことが数値に反映されています。

代表的な分布の歪度と尖度

学んできた分布について、歪度と超過尖度を一覧にします。各値は、それぞれの分布の単元で扱った定義から導出されるものです。

分布	歪度	超過尖度
正規分布	$0$	$0$
一様分布	$0$	$-1.2$
指数分布	$2$	$6$
ポアソン分布 $Po(\lambda)$	$\dfrac{1}{\sqrt{\lambda}}$	$\dfrac{1}{\lambda}$

正規分布は歪度・超過尖度ともに $0$ で、「形」の基準になっています。一様分布は左右対称（歪度 $= 0$ ）ですが、超過尖度が $-1.2$ と負であり、正規分布より裾が薄いことが分かります。指数分布は歪度 $2$ 、超過尖度 $6$ と、右に強く歪み、裾も厚い分布です。

ポアソン分布は $\lambda$ が大きくなるほど歪度と超過尖度がゼロに近づきます。これは $\lambda$ が大きいとき、ポアソン分布が正規分布に近づくことと対応しています。

よくある誤解

注意

「歪度が 0 なら正規分布である」 — これは誤りです。左右対称な分布は歪度が 0 になりますが、逆は必ずしも成り立ちません。非対称な分布でも、正と負のズレの 3 乗がたまたま打ち消し合い、歪度が 0 になるケースが存在します。歪度が 0 だからといって左右対称とは限りませんし、ましてや正規分布であるとは限りません。分布の形を完全に特定するには、すべての次数のモーメント（あるいは分布関数そのもの）の情報が必要です。

まとめ

モーメントは $E[X^k]$ （原点まわり）や $E[(X-\mu)^k]$ （中心モーメント）として定義される量で、 $k$ の値によって分布の異なる側面を捉えます。1 次の原点まわりモーメントは期待値、2 次中心モーメントは分散に対応し、3 次と 4 次からは分布の「形状」が読み取れます。

歪度 $\gamma_1 = \mu_3 / \sigma^3$ は分布の左右非対称性を測り、正なら右裾が長く、負なら左裾が長いことを示します。尖度 $\mu_4 / \sigma^4$ は裾の厚さを測り、正規分布を基準にした超過尖度（尖度 $- 3$ ）が正なら「極端な値が出やすい分布」、負なら「極端な変動が起きにくく、一定の範囲に収まりやすい分布」と判断できます。

「外れ値と歪み」で直感的に感じていた分布の形の違いを、モーメントを使って数値で裏付けること——それがこの単元の核心です。歪度や尖度の値をもとに「平均だけで判断してよいか」を見極められるようになれば、データの読み方が一段階深くなります。