正規分布
真ん中付近に集まりやすいデータを扱う
できるようになること
- の と がグラフの形に与える影響を説明できる
- 標準化 を使って正規分布の確率を計算できる
- 68.3%・95.4%・99.7%の目安を、正規分布を仮定したときの話として使える
なぜ同じ形の分布がいたるところに現れるのか
テストの点数、身長、測定誤差のように、値が真ん中付近に集まり、両端に行くほど少なくなるデータがあります。 この「中心が高く、左右に広がる」形を数式で表した代表が正規分布(normal distribution)です。
正規分布を仮定すると、「ある範囲に入る確率」を同じ手順で計算できるようになります。 たとえば「80点以上の確率」や「平均から±20の範囲に入る割合」といった問いに答えやすくなります。
正規分布の書き方
連続型の確率変数 が、平均 、分散 の正規分布に従うとき、次のように書きます。 は標準偏差、 は分散です。
| パラメータ | |||
|---|---|---|---|
| 意味 | 中心(平均) | 広がり(標準偏差) | 広がり(分散) |
| 単位 | と同じ | と同じ | の2乗 |
確率密度関数
正規分布の確率密度関数は次の形です。式そのものを暗記する必要はありません。 実務上は「 と の2つで形が決まる」 ことと、「左右対称で、中心から離れるほど小さくなる」 ことが分かっていれば十分な場面が多いです。

平均 と標準偏差 がグラフに与える影響
正規分布の形は、次の2点で把握できます。
- (平均):分布の中心を決めます。 が大きいほど、グラフ全体が右に移動します。
- (標準偏差):分布の広がりを決めます。 が大きいほど横に広がり、山は低く見えます。 が小さいほど横に狭まり、山は高く見えます。
また、正規分布は を中心に左右対称です。 このため、最頻値・中央値・平均が一致します。

「どれぐらいの範囲に入るか」の目安(68.3%・95.4%・99.7%)
正規分布では、中心 から標準偏差 の何倍までを見るかで、区間に入る確率の目安が決まります。「平均との差がどれぐらい珍しいか」を考えるときに便利です。
| 範囲 | |||
|---|---|---|---|
| 含まれる確率の目安 | 約68.3% | 約95.4% | 約99.7% |
ここでの数値は「正規分布ならこの程度」という目安です。データが正規分布に近いかどうかの確認をせずに、機械的に当てはめないようにします。

標準正規分布と標準化
平均0、分散1の正規分布を標準正規分布といいます。 正規分布の確率計算は、標準化によって「標準正規分布の確率」に置き換えるのが基本手順 です。
のとき、次の変換で標準正規分布に直します。
標準正規分布の分布関数を と書くことが多いです。 このとき、 の確率は次の形で計算できます。
例として、(平均60、標準偏差10)を仮定し、「80点以上」の確率を考えます。 とおくと、 は に対応します。
なので、確率は約 (約2.3%)になります。
正規近似(離散分布を正規分布で近似する)
二項分布は、条件が整うと正規分布で近似できます。 厳密計算が重いときに、概算として使われます。
近似を使う目安として、次を満たすかを確認します。
二項分布は離散型、正規分布は連続型なので、確率を近似するときに「連続性の補正(continuity correction)」を入れる場合があります。 使うかどうかは、求めたい確率が境界付近にあるか、 が十分大きいかで判断します。
期待値と分散
正規分布 では、パラメータがそのまま期待値と分散になります。
- 期待値:
- 分散:
確認ポイント(混同しやすいところ)
- と を混同していないか → は標準偏差、 は分散です。単位も変わります
- 「確率」と「確率密度」を混同していないか → 連続型では で、確率は区間で考えます
- 68.3%などの目安は「正規分布を仮定したとき」の話か → データがその形に近いかは別途確認します
- 標準化は「平均との差を標準偏差で割る」操作になっているか → の形を崩さないようにします
まとめ
正規分布は、平均 と分散 (標準偏差 )で形が決まる、左右対称の連続分布です。
に約68.3% が入るなど、標準偏差を基準に「どれぐらい珍しいか」を見積もれます。
確率計算は、標準化 によって標準正規分布の確率に置き換えるのが基本手順です。
条件が整えば二項分布などを正規分布で近似でき、概算が必要な場面で役に立ちます。 混同しやすい点( と 、確率と確率密度、目安の前提)は確認ポイントで整理してください。