確率分布
値がどう出るか、傾向を一覧にする
できるようになること
- 確率分布を表・式・グラフの3つの形で表現できる
- 確率分布が満たす2つの条件を確認できる
- 確率の合計が1にならないときの原因を3パターンで切り分けられる
平均が同じでも、感じ方が違う
次の3つのゲームから1つ選べるとします。
- ゲームA:確実に1,000円もらえる
- ゲームB:コインを投げて、表なら2,000円、裏なら0円
- ゲームC:サイコロを振って、1なら0円、2–5なら1,000円、6なら2,000円
あなたならどれを選びますか。
どのゲームも平均すると1,000円を獲得できます。
では、「どのゲームを選んでも同じだ」と感じるでしょうか。 そう感じる方もいるかもしれませんし、大きな差を感じる方もいるかもしれません。
差を感じる要因は、「どの金額が、どれくらいの確率で起こるか」が違うことにあります。
このどの値をどれくらいの確率でとるのか という対応関係を整理したものが確率分布(probability distribution)です。
確率分布を見ると、平均だけでは分からない出方の違い(ばらつきや極端な値の出やすさ)を比べられるようになります。
確率分布とは何か
確率変数 について、 が取りうる値 と、その確率 を対応づけたものを確率分布といいます。
例として、サイコロを1回振って出た目を とします。
| 1 | 2 | 3 | 4 | 5 | 6 | |
|---|---|---|---|---|---|---|
| 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
この「値 と確率 の対応」が確率分布です。
確率分布の表現方法(表・式・グラフ)
確率分布は、目的に応じて次の3つの方法で表します。
1. 表で表現する
値が少ないときは、先ほどのように表で一覧にすると見落としが減ります。
2. 式で表現する
規則性があるときは、式のほうがコンパクトです。先ほどのサイコロなら、
と書けます。
3. グラフで表現する
棒グラフ(横軸に 、縦軸に )にすると、どこに確率が集まっているかを視覚的に確認できます。

確率分布で比較する:3つのゲーム
導入の3つのゲームについて、受け取る金額を確率変数 (単位:円)として確率分布を表で書きます。
ゲームA(確実に1,000円)
| (円) | 1,000 |
|---|---|
| 1.0 |
ゲームB(コイン投げ)
| (円) | 0 | 2,000 |
|---|---|---|
| 0.5 | 0.5 |
ゲームC(サイコロ)
| (円) | 0 | 1,000 | 2,000 |
|---|---|---|---|
| 1/6 | 4/6 | 1/6 |
平均はどれも1,000円です(例えばゲームBは 0×0.5 + 2,000×0.5 = 1,000 です)。
ただし、分布を見ると特徴は異なります。
- ゲームAは毎回1,000円で、結果が固定されます。
- ゲームBは0円か2,000円で、振れ幅が大きくなります。
- ゲームCは0/1,000/2,000が出ますが、Aほど固定ではなく、Bほど極端でもありません。
このように、平均だけでは見えない「ばらつき」 や 「極端な値の出やすさ」 は、確率分布を見てはじめて整理することができます。
確率分布が満たす2つの条件
確率分布は、必ず次の2つを満たします。
1つ目:すべての確率は0以上です。
2つ目:確率の合計は1です。
この2つを確認すると、確率分布作りの間違いに気づきやすくなります。
よくあるミス:確率の合計が1にならない
例えば、次の表を見てみましょう。
| 1 | 2 | 3 | |
|---|---|---|---|
| 0.3 | 0.4 | 0.2 |
このままだと合計が0.9で、確率分布としては不足しています。 こういうときは、次の3点を順に確認すると直しやすいです。
- 漏れ:取りうる値が他にもあるのに、表に入っていない。
- 二重計上:同じケースを別の値として数えてしまっている(分類が重なっている)。
- 丸め:小数の丸めで1からズレている(元の値をもう少し桁で持つ)。
原因が「丸め」だと分かっているなら、最後に合計が1になるよう調整します。
原因が「漏れ」や「二重計上」かもしれない場合に、いきなり全体を 0.9 で割って正規化する(合計を無理に1にする)のは、問題を隠すことがあります。まず原因の切り分けを優先するのが安全です。
まとめ
確率分布 は、確率変数 が取りうる値 と、その確率 を対応づけたものです。 表・式・グラフのいずれでも表せますが、目的に応じて使い分けます。
平均が同じでも、確率分布が違えば結果の出方は変わります。 確率分布を作ったら、 と の2点を確認してください。 合計が1にならないときは、いきなり正規化せず、漏れ・二重計上・丸めのどれが原因かを先に確認します。