ガンマ分布
複数の事象が起きるまでの待ち時間を扱う
難易度 Lv 4 / 10想定時間:約25分
できるようになること
- ガンマ分布の前提を確認し、使えるかどうかを判断できる
- 確率密度関数のパラメータ(形状 α、率 λ)の意味を説明できる
- 指数分布との関係(α=1 の特殊ケース)を理解できる
通話1件分から合計時間へ
指数分布では「次の1件の電話がかかってくるまでの待ち時間」を扱いました。
ここでは問いを広げます。「α 件分の電話の合計通話時間はどのような分布になるか」です。
たとえばコールセンターで、1件あたりの通話時間が平均5分(λ=0.2/分)の指数分布に従うとき、3件分の合計通話時間はどう分布するでしょうか。平均15分の前後に散らばりますが、その確率的な振る舞いを記述するのがガンマ分布(gamma distribution)です。
ガンマ分布とは何か
確率変数 X がガンマ分布に従うとき、次のように書きます。
X∼Gamma(α,λ)
ここで、
- α>0:形状パラメータ(shape)。分布の形を決める
- λ>0:率パラメータ(rate)。単位時間あたりの発生率
X は非負の実数値をとります(X≥0)。
ガンマ分布のパラメータ表記は文献によって異なります。Gamma(α,λ)(率パラメータ)と書く流儀と、Gamma(α,θ)(θ=1/λ で尺度パラメータ)と書く流儀があります。本単元では指数分布と揃えて率パラメータ λ を使います。
指数分布との関係
ガンマ分布は指数分布を一般化したものです。
- 指数分布:1件目の事象までの時間 → Exp(λ)=Gamma(1,λ)
- ガンマ分布:α 件目の事象までの時間 → Gamma(α,λ)
つまり α=1 のとき、ガンマ分布は指数分布と一致します。
指数分布の和としての解釈
α が正の整数のとき、ガンマ分布は独立な指数分布 α 個の和として解釈できます。
X=Y1+Y2+⋯+Yα(Yi∼Exp(λ))
この見方は、幾何分布と負の二項分布の関係(離散版)と同じ構造です。
α が正の整数のとき、ガンマ分布は特にアーラン分布(Erlang distribution)と呼ばれます。ガンマ分布はこれをさらに一般化し、α が正の実数でも定義されます。
ガンマ分布が成り立つための前提
ガンマ分布の前提は、基本的に指数分布と同じです。
| 前提 | 意味 | コールセンターの例 |
|---|
| 1. 事象が独立に発生 | 1件の電話が他の電話に影響しない | 前の通話が長くても次に影響しない |
| 2. 発生率が一定 | 単位時間あたりの発生率 λ が変わらない | 時間帯によらず通話ペースが一定 |
| 3. 非負の連続値 | 時間や量など、0以上の連続値を扱う | 通話時間は0分以上 |
前提が怪しいときの確認ポイント
前提1:事象が独立に発生しているか
ある電話が終わった直後に関連する問い合わせが来るといった依存関係がある場合、独立の前提が崩れます。
前提2:発生率 λ は一定か
α 件分の合計を考えるため、観測する期間全体にわたって λ が一定であることが求められます。朝と夕方で通話ペースが変わる場合などは注意が必要です。
確率密度関数
ガンマ分布の確率密度関数は次の式で表されます(x≥0)。
f(x)=Γ(α)λαxα−1e−λx
ここで Γ(α) はガンマ関数です。
Γ(α)=∫0∞tα−1e−tdt
実際の計算では統計ソフトや数表が値を与えてくれるため、この積分を手計算する必要はありません。
ガンマ関数は階乗の一般化で、α が正の整数のとき Γ(α)=(α−1)! が成り立ちます。
密度関数の各項の意味
- xα−1:分布の形を決める(α が大きいほど右に山が移動)
- e−λx:右の裾を作る(大きな値の確率を下げる)
- Γ(α)λα:面積が1になるための正規化定数
α=1 のとき
Γ(1)=0!=1 なので、
f(x)=1λ1x0e−λx=λe−λx
これは指数分布の密度関数と一致します。
分布の形
ガンマ分布の形は α の値によって大きく変わります。
- α<1:x=0 付近で密度が最大(J字型)
- α=1:指数分布(単調減少)
- α>1:山型で、α が大きいほど山が右に移動し、形が対称に近づく

λ を変えると、分布の「スケール」が変わります。λ が大きいほど分布が左に凝縮し、λ が小さいほど右に広がります。

α が十分大きいとき、ガンマ分布の形は正規分布に近づきます。
期待値と分散
X∼Gamma(α,λ) のとき、
- 期待値:E[X]=λα
- 分散:Var(X)=λ2α
指数分布の和からの導出
α が正の整数のとき、ガンマ分布は独立な指数分布 α 個の和です。各 Yi∼Exp(λ) の期待値と分散は、
- E[Yi]=λ1
- Var(Yi)=λ21
期待値の線形性と独立性に基づく分散の加法性より、
E[X]=α⋅λ1=λα
Var(X)=α⋅λ21=λ2α
例:1件あたり平均5分(λ=0.2/分)の通話が3件なら、合計通話時間の期待値は 3/0.2=15 分、分散は 3/0.04=75(標準偏差約8.7分)です。15分の平均に対してかなりのばらつきがあることがわかります。
なお、この期待値と分散の公式は α が整数でない正の実数であってもそのまま成り立ちます。
他の分布との関係
ガンマ分布はいくつかの重要な分布の基盤になっています。
- α=1:指数分布 Exp(λ)
- α=n/2, λ=1/2:カイ二乗分布 χ2(n)(次の単元で詳しく扱います)
まとめ
ガンマ分布 Gamma(α,λ) は、発生率 λ の事象が α 回起きるまでの時間を表す連続分布です。
f(x)=Γ(α)λαxα−1e−λx
期待値は λα、分散は λ2α です。
α=1 のとき指数分布と一致し、独立な指数分布 α 個の和として解釈できます。
使う前に 事象の独立性 と 発生率の一定性 を確認してください。