連続分布

「点」ではなく「区間」で確率を考える

難易度 Lv 3 / 10想定時間:約20

できるようになること


連続型確率変数とは何か

連続型確率変数(continuous random variable)とは、ある区間の中であればどの値も取りうると考える確率変数です。

例としては、次のようなものがあります。

例えば、身長を確率変数 XX とします。 「身長がちょうど170cmである確率」P(X=170)P(X=170) を考えると、 170.0cm、170.00cm…のように細かく区切るほど、1つの値にぴったり一致する確率は小さくなります。

理論的には、区切り方を限りなく細かくすると、特定の1点の確率は 00 になります。

そこで連続型では、確率は「aa から bb の間に入る確率」P(aXb)P(a \leq X \leq b) のように、 区間に対して定義します。


区間の確率で考える

連続型として扱うとき、基本は次の形です。

P(aXb)P(a \leq X \leq b)aa 以上 bb 以下に入る確率

連続型では P(X=a)=0P(X=a) = 0 が成り立つため、等号の有無(\leq<< か)で確率は変わりません。 例えば、P(aXb)P(a \leq X \leq b)P(a<X<b)P(a < X < b) は同じ値になります。


確率密度関数

連続型の確率を計算するときは、確率密度関数 f(x)f(x) を使います。

区間の確率は、f(x)f(x)aa から bb まで積分して求めます。 ここで重要なのは、f(x)f(x) 自体は確率ではなく「密度」だという点です。 確率は、区間に対応する面積として決まります。

P(aXb)=abf(x)dxP(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx

確率密度関数の面積と確率


面積が確率になる

f(x)f(x) の高さ(値)そのものではなく、区間の面積が P(aXb)P(a \leq X \leq b) になります。

全体の確率は1になる

連続型では、全範囲での面積が 11 になります。

f(x)dx=1\int_{-\infty}^{\infty} f(x) \, dx = 1

P(X=a)=0P(X=a)=0X=aX=aにならない、という意味ではない

P(X=a)=0P(X=a) = 0 は「X=aX=a にならない」という断定ではありません。 あくまでも「特定の1点の確率は0」ということを意味しています。


離散型と連続型の違い

離散型では確率質量関数として P(X=x)P(X=x) を扱います。 連続型では確率密度関数 f(x)f(x) を扱い、区間の積分で確率を計算します。 違いを表で整理します。

区分離散型連続型
取りうる値数え上げられる値区間内のどの値も
確率の基本単位点:P(X=x)P(X=x)区間:P(aXb)P(a \leq X \leq b)
1点の確率0以上になりえます常に0です
使う関数確率質量関数確率密度関数
確率の計算足し算(\sum積分(\int

まとめ

連続型確率変数では、確率は「1点」ではなく「区間」に対して考えます。

P(X=a)=0P(X=a) = 0 が成り立ちます。これは「X=aX=a にならない」という意味ではなく、 「特定の1点の確率は0」という意味です。等号の有無で区間確率は変わりません。

区間の確率は、確率密度関数 f(x)f(x) を積分して面積として求めます。 f(x)f(x) の値そのものは確率ではなく「密度」です。全体の面積は必ず1になります。