連続分布

「点」ではなく「区間」で確率を考える

難易度 Lv 3 / 10想定時間：約20分

連続型確率変数（continuous random variable）とは、ある区間の中であればどの値も取りうると考える確率変数です。

例としては、次のようなものがあります。

例えば、身長を確率変数 $X$ とします。「身長がちょうど170cmである確率」 $P(X=170)$ を考えると、 170.0cm、170.00cm…のように細かく区切るほど、1つの値にぴったり一致する確率は小さくなります。

理論的には、区切り方を限りなく細かくすると、特定の1点の確率は $0$ になります。

そこで連続型では、確率は「 $a$ から $b$ の間に入る確率」 $P(a \leq X \leq b)$ のように、区間に対して定義します。

連続型として扱うとき、基本は次の形です。

$P(a \leq X \leq b)$ ： $a$ 以上 $b$ 以下に入る確率

連続型では $P(X=a) = 0$ が成り立つため、等号の有無（ $\leq$ か $<$ か）で確率は変わりません。例えば、 $P(a \leq X \leq b)$ と $P(a < X < b)$ は同じ値になります。

連続型の確率を計算するときは、確率密度関数 $f(x)$ を使います。

区間の確率は、 $f(x)$ を $a$ から $b$ まで積分して求めます。ここで重要なのは、 $f(x)$ 自体は確率ではなく「密度」だという点です。確率は、区間に対応する面積として決まります。

P(a \leq X \leq b) = \int_{a}^{b} f(x) \, dx

確率密度関数の面積と確率

$f(x)$ の高さ（値）そのものではなく、区間の面積が $P(a \leq X \leq b)$ になります。

連続型では、全範囲での面積が $1$ になります。

\int_{-\infty}^{\infty} f(x) \, dx = 1

$P(X=a) = 0$ は「 $X=a$ にならない」という断定ではありません。あくまでも「特定の1点の確率は0」ということを意味しています。

離散型では確率質量関数として $P(X=x)$ を扱います。連続型では確率密度関数 $f(x)$ を扱い、区間の積分で確率を計算します。違いを表で整理します。

連続型確率変数では、確率は「1点」ではなく「区間」に対して考えます。

$P(X=a) = 0$ が成り立ちます。これは「 $X=a$ にならない」という意味ではなく、「特定の1点の確率は0」という意味です。等号の有無で区間確率は変わりません。

区間の確率は、確率密度関数 $f(x)$ を積分して面積として求めます。 $f(x)$ の値そのものは確率ではなく「密度」です。全体の面積は必ず1になります。