ベイズは「確率の更新」である

観測で、確率を更新する

難易度 Lv 4 / 10想定時間:約25

できるようになること


3回連続で表が出たら「偏り」と言えるか

次の2種類のコインがあります。

袋の中には、公平なコインが9枚、偏りがあるコインが1枚入っています。 袋から1枚選び、そのコインを3回投げたところ、結果は 表・表・表 でした。

選んだコインが偏りのあるコインである確率は、どれぐらいあるでしょうか。

これを考えるために、事象を次のように置きます。

袋の状態から、観測前(投げる前)の見込みは

P(A)=0.1,P(B)=0.9P(A) = 0.1, \quad P(B) = 0.9

です。これを事前確率と呼びます。

一方、各コインで3回とも表が出る確率は、

P(CA)=0.93=0.729,P(CB)=0.53=0.125P(C \mid A) = 0.9^3 = 0.729, \quad P(C \mid B) = 0.5^3 = 0.125

です。これは A, B それぞれが情報として与えられたとき、C がどれだけ起こるかを表しています。

観測によって確率を更新する

知りたいのは、表・表・表という観測 CC があったときに、そのコインが偏りのあるコインである確率 P(AC)P(A \mid C) です。 これを事後確率と呼びます。

ベイズの定理を使うと、

P(AC)=P(CA)P(A)P(C)P(A \mid C) = \dfrac{P(C \mid A) \cdot P(A)}{P(C)}

と書けます。分母 P(C)P(C) は「全体で表・表・表が出る確率」です。 偏りがある場合と公平な場合に分けて、全確率の定理 を用いると、

P(C)=P(CA)P(A)+P(CB)P(B)P(C) = P(C \mid A) \cdot P(A) + P(C \mid B) \cdot P(B)

よって、

P(AC)=P(CA)P(A)P(CA)P(A)+P(CB)P(B)P(A \mid C) = \dfrac{P(C \mid A) \cdot P(A)}{P(C \mid A) \cdot P(A) + P(C \mid B) \cdot P(B)}

数値を代入すると、

P(AC)=0.729×0.10.729×0.1+0.125×0.90.393P(A \mid C) = \dfrac{0.729 \times 0.1}{0.729 \times 0.1 + 0.125 \times 0.9} \approx 0.393

したがってこの設定では、

に更新されます。

もう一回投げたらどうなるか

確率の更新は、1回計算して終わりではありません。観測が増えるたびに確率は更新されます。

例えば4回目も表なら、偏りがあるコインの確率は約53.8%に上がります。 逆に、4回目が裏なら、偏りがあるコインの確率は約11.5%に下がります。

観測が増えるたびに確率が変動することが、更新のイメージです。

何が更新を決めているか

P(AC)P(A \mid C) を計算したときの式をもう一度見てみましょう。

P(AC)=P(CA)P(A)P(CA)P(A)+P(CB)P(B)P(A \mid C) = \dfrac{P(C \mid A) \cdot P(A)}{P(C \mid A) \cdot P(A) + P(C \mid B) \cdot P(B)}

P(CA)=0.729,P(CB)=0.125P(C \mid A) = 0.729, \quad P(C \mid B) = 0.125

更新後の確率を決めているのは主に次の2つです。

今回の例では、「表・表・表」という観測は、公平なコインよりも偏りがあるコインの場合に起きやすい観測です。 そのため観測後は、偏りのあるコインである確率 P(AC)P(A \mid C) が観測前の P(A)P(A) より大きくなります。

一方で、袋の中では偏りがあるコインが少ない(P(A)=0.1P(A) = 0.1)ので、「表・表・表」という観測があっても、偏りのあるコインの確率がすぐ1に近づくわけではありません。

このバランスが上の式に反映されています。

同じ観測でも、事前確率が違うと事後確率が変わる

同じ観測 CC(表・表・表)でも、袋の中身が変わると更新結果も変わります。 観測の情報量が同じでも、観測前の見込み(P(A)P(A))が異なるからです。

ケース1:偏りがあるコインが半分

袋に公平なコインが1枚、偏りがあるコインが1枚入っている場合、P(A)=0.5P(A) = 0.5P(B)=0.5P(B) = 0.5 とします。

P(AC)=0.729×0.50.729×0.5+0.125×0.50.854P(A \mid C) = \dfrac{0.729 \times 0.5}{0.729 \times 0.5 + 0.125 \times 0.5} \approx 0.854

事後確率は85.4%まで上がります。

ケース2:偏りがあるコインが1%

袋に公平なコインが99枚、偏りがあるコインが1枚入っている場合、P(A)=0.01P(A) = 0.01P(B)=0.99P(B) = 0.99 とします。

P(AC)=0.729×0.010.729×0.01+0.125×0.990.056P(A \mid C) = \dfrac{0.729 \times 0.01}{0.729 \times 0.01 + 0.125 \times 0.99} \approx 0.056

事後確率は5.6%にとどまります。

このように、同じ「表・表・表」でも、観測前に偏りがある可能性がどれぐらいあったかで、更新後の確率は大きく変わります。

更新を考えるときの3つのポイント

確率の更新は時に直観に反することがあります。

そのような場合でもきちんと説明するために、次の3つをセットで整理するのがおすすめです。

今回の例では、

というように整理しておくとよいでしょう。

まとめ

観測前の見込み(事前確率)が、観測を踏まえた見込み(事後確率)に更新されることを確認しました。

更新の結果は、観測そのものだけでなく、観測前にどれぐらい起こりそうだったかという事前確率 にも依存します。同じ観測でも事前確率が違えば事後確率も変わります。

確率の更新を説明するときは、「事前確率・観測・事後確率」の3つをセットで整理してください。