分布表とパーセント点の使い方
分布表から臨界値を引く方法を身につける
できるようになること
- パーセント点(上側 点)の定義を理解し、分布表から値を読み取れる
- 標準正規分布・t分布・カイ二乗分布・F分布の表の引き方を区別できる
- 対称な分布と非対称な分布で臨界値の求め方が異なることを説明できる
「棄却できる?」に答えるために
検定統計量が 、有意水準 (両側検定)が分かったとします。このとき、帰無仮説を棄却できるをどう判定すればよいでしょうか。
この問いに答えるには、「有意水準5%で棄却するための境界の値(臨界値)はいくつか」を知る必要があります。この臨界値のことをパーセント点と呼び、分布表から読み取ることができます。
この単元では、分布表の仕組みと読み方を整理します。
パーセント点とは
を満たす値 を、上側 パーセント点と呼びます。
つまり、「確率変数がその値を超える確率がちょうど になる点」です。
たとえば標準正規分布の上側5%点は です。これは を意味します。
添字の は上側確率を表します。 なら「右側に5%の面積が残る点」です。教科書によっては下側確率(左側に の面積)で表記することもあるため、どちらの確率を指しているか必ず確認してください。
標準正規分布表
標準正規分布は左右対称なので、上側と下側の臨界値は符号を変えるだけで求められます。
| 上側確率 | パーセント点 | 用途の例 |
|---|---|---|
| 0.10 | 1.282 | 片側10% |
| 0.05 | 1.645 | 片側5% |
| 0.025 | 1.960 | 両側5%() |
| 0.01 | 2.326 | 片側1% |
| 0.005 | 2.576 | 両側1%() |
冒頭の問い(、両側5%)に戻りましょう。両側検定では に対応する点を見ます。 なので、棄却域は です。 なので、帰無仮説を棄却できます。
t分布表
t分布は正規分布と同じく左右対称ですが、自由度ごとに形が変わるため、表は「自由度 × 上側確率」の2次元になります。
| 自由度 \上側確率 | 0.10 | 0.05 | 0.025 | 0.01 | 0.005 |
|---|---|---|---|---|---|
| 5 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 |
| 10 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 |
| 20 | 1.325 | 1.725 | 2.086 | 2.528 | 2.845 |
| 30 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 |
| 1.282 | 1.645 | 1.960 | 2.326 | 2.576 |
自由度 の行が標準正規分布に一致していることを確認してください。自由度が小さいほど裾が重い(臨界値が大きい)ことが表から読み取れます。
t分布も左右対称なので、下側の臨界値は です。
カイ二乗分布表
カイ二乗分布は0以上の値しか取らず、左右非対称です。そのため、上側と下側で別々に臨界値を引く必要があります。
| 自由度 \上側確率 | 0.975 | 0.95 | 0.05 | 0.025 | 0.01 |
|---|---|---|---|---|---|
| 5 | 0.831 | 1.145 | 11.07 | 12.83 | 15.09 |
| 10 | 3.247 | 3.940 | 18.31 | 20.48 | 23.21 |
| 20 | 9.591 | 10.85 | 31.41 | 34.17 | 37.57 |
| 30 | 16.79 | 18.49 | 43.77 | 46.98 | 50.89 |
カイ二乗分布表の添字は上側確率です。 は「自由度10で右側に2.5%の面積が残る点」を意味します。左側の列(上側確率が大きい列)ほど左寄りの臨界値(小さい値)になります。両側検定では上側()と下側()の両方を引きます。たとえば有意水準5%の両側検定なら、 と を使います。
F分布表
F分布も0以上の値しか取らず、非対称です。さらに、分子の自由度 と分母の自由度 の2つの自由度を持つため、、、 の3つのパラメータに依存します。通常は ごとに別の表が用意されます。
以下は上側確率 のF分布表の抜粋です。一般的な教科書と同様に、列が分子の自由度 、行が分母の自由度 です。
| \ | 1 | 5 | 10 | 20 |
|---|---|---|---|---|
| 5 | 6.608 | 5.050 | 4.735 | 4.558 |
| 10 | 4.965 | 3.326 | 2.978 | 2.774 |
| 20 | 4.351 | 2.711 | 2.348 | 2.124 |
| 30 | 4.171 | 2.534 | 2.165 | 1.932 |
F分布表は通常上側確率のみ掲載されています。下側の臨界値が必要な場合は、次の関係を使います。
つまり、自由度を入れ替えて逆数を取ることで下側の臨界値を求めます。
例:(分子5、分母10の下側5%点)を求めるには、 を表から引いて逆数を取ります。
対称な分布と非対称な分布の違い
臨界値の求め方は、分布が左右対称かどうかで異なります。
| 対称(正規・t) | 非対称(カイ二乗・F) | |
|---|---|---|
| 右側検定 | 上側 点を引く | 上側 点を引く |
| 左側検定 | 符号を反転( や ) | カイ二乗: を引く F:自由度入替 + 逆数 |
| 両側検定 | (や )を引き、棄却域を とする | 上側 点と下側 点を別々に引く |
分布表とソフトウェア
現代の統計ソフトウェアでは、パーセント点は関数1つで計算できます(Excelなら NORM.S.INV、T.INV、CHISQ.INV.RT など)。
それでも分布表の仕組みを理解しておく意義があります。
- 分布表が「確率 → 値」の対応を一覧にしたものだと理解することで、p値と臨界値の関係が明確になる
- t分布の自由度が大きくなると正規分布に近づくといった分布同士の関係が、表を見比べることで直感的に把握できる
- 試験で分布表が配布されることがあり、引き方を知っておけば慌てずに済む
ソフトウェアの関数は、入力が上側確率か下側確率かが関数ごとに異なります。たとえば NORM.S.INV や T.INV は下側確率(累積確率)を入力するため、上側5%点を求めるには を指定します。一方、.RT(Right Tail)がつく関数(CHISQ.INV.RT など)は上側確率 を直接指定できます。
まとめ
パーセント点(上側 点)は、確率変数がその値を超える確率がちょうど になる点 です。分布表はこの対応を、自由度や上側確率ごとにまとめた表です。
標準正規分布とt分布は左右対称なので、下側の臨界値は符号を反転するだけで求められます。一方、カイ二乗分布やF分布は非対称なため、両側検定では上側と下側の臨界値を別々に引く必要があります。F分布の下側臨界値は、自由度を入れ替えて逆数を取ることで求めます。
検定で使う臨界値の引き方は、片側検定なら 、両側検定なら に対応する列を見ます。この関係は「棄却域と片側・両側検定」で詳しく学びます。