棄却域と片側・両側検定

棄却域の設定方法と、片側検定・両側検定の使い分けを学びます。検定統計量の判定方法を理解し、問いに応じた検定の設計ができるようになります。

難易度 Lv 4 / 10想定時間：約20分

できるようになること

棄却域アプローチの手順を説明できる
両側検定と片側検定の違いを、仮説と棄却域の形で区別できる
問いの内容に応じて、片側・両側を正しく選べる

同じ「差があるか」でも、問い方が違う

ある工場で、製品の重さが規格値の500gに合っているかを検査したいとします。重すぎても軽すぎても不良品です。関心があるのは「500gからズレているかどうか」であり、ズレの方向は問いません。

一方、新薬の臨床試験では、新薬が既存薬より効くかどうかを調べたいとします。「効果が同じかどうか」ではなく、「新薬の方が良いかどうか」が関心です。悪い方向にズレていても「差がある」と結論づけたいわけではありません。

この2つの場面では、同じ「差があるか」という問いでも、検定の設計が変わります。この単元では、その設計の違いを学びます。

p値アプローチと棄却域アプローチ

この2つの場面で判定方法がどう変わるのかを理解するには、「棄却域」という考え方が必要です。

「仮説検定の考え方」では、p値を計算して有意水準と比べる方法を学びました。

p < \alpha \Rightarrow \text{棄却}

このp値アプローチは、検定の結論を出す標準的な方法です。しかし、別の出発点からも同じ結論にたどり着けます。

棄却域アプローチ

**棄却域（**rejection region）とは、「帰無仮説を棄却する検定統計量の範囲」をあらかじめ定めたものです。

手順は次のようになります。

帰無仮説 $H_0$ と対立仮説 $H_1$ を立てる
有意水準 $\alpha$ を決める
$\alpha$ に対応する**臨界値（**critical value）を分布表から求め、棄却域を定める。臨界値とは、帰無仮説のもとでの分布において、上側（または下側）確率がちょうど $\alpha$ （または $\alpha/2$ ）となる点のことです
データから検定統計量を計算する
検定統計量が棄却域に入れば $H_0$ を棄却、入らなければ棄却しない

p値アプローチでは「面積を計算して $\alpha$ と比較」しますが、棄却域アプローチでは「値の位置を見て線の内か外かを判定」します。

ポイント

p値アプローチと棄却域アプローチは、同じ判定に異なる角度からたどり着く方法です。p値が $\alpha$ より小さいことと、検定統計量が棄却域に入ることは、数学的に同値です。

なぜ同値といえるか：右片側検定を例に取ると、p値は「検定統計量の観測値 $z_{\text{obs}}$ より極端になる確率」、 $\alpha$ は「臨界値 $z_{\alpha}$ より極端になる確率」です。 $p < \alpha$ は $z_{\text{obs}} > z_{\alpha}$ と同じことを意味します。

なぜ棄却域アプローチも知るべきか

p値が計算できる環境では、p値アプローチだけで十分です。しかし、棄却域アプローチを知っておくと：

分布表だけで判定できる。表には臨界値（パーセント点）が載っており、p値の正確な計算ができなくても判定可能です
検出力の理解につながる。検出力は「対立仮説のもとで、検定統計量が棄却域に入る確率」であり、棄却域を知らないと可視化できません
検定の設計が見える。片側・両側の違いは、棄却域の形で最も明確に理解できます

両側検定

問いの形

「母数がある値と異なるかどうか」を検定するとき、両側検定を使います。

H_0: \mu = \mu_0 \quad \text{vs} \quad H_1: \mu \neq \mu_0

対立仮説が $\neq$ （等しくない）であることがポイントです。 $\mu_0$ より大きい方向にも小さい方向にもズレを検出したいので、分布の両方の裾に棄却域を設けます。

棄却域の形

有意水準 $\alpha$ を両方の裾に均等に振り分けます。

左の裾：面積 $\alpha/2$
右の裾：面積 $\alpha/2$

ここでは母分散 $\sigma$ が既知であるか、サンプルサイズ $n$ が十分に大きく、検定統計量 $z$ が標準正規分布に従う場合を考えます。 $\alpha = 0.05$ のとき、臨界値は $\pm 1.96$ です。

\text{棄却域：} z < -1.96 \text{　または　} z > 1.96

製品検査の例

工場での製品重量の検査に戻ります。

$H_0: \mu = 500$ （平均重量は500g）
$H_1: \mu \neq 500$ （平均重量は500gではない）
有意水準 $\alpha = 0.05$

100個の製品を抽出したところ、標本平均 $\bar{x} = 502$ g でした。母標準偏差 $\sigma = 8.7$ g が既知のとき、検定統計量は：

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{502 - 500}{8.7 / \sqrt{100}} \approx 2.30

$z = 2.30 > 1.96$ なので棄却域に入ります。「平均重量は500gではない」と結論します。

補足

この例では右の裾に入りましたが、もし $z = -2.5$ だったとしても棄却域に入ります。両側検定では、どちらの方向へのズレも検出します。

片側検定

問いの形

「母数がある値より**大きいかどうか（**または小さいかどうか）」を検定するとき、片側検定を使います。

**右片側検定（**大きいかどうか）：

H_0: \mu \leq \mu_0 \quad \text{vs} \quad H_1: \mu > \mu_0

**左片側検定（**小さいかどうか）：

H_0: \mu \geq \mu_0 \quad \text{vs} \quad H_1: \mu < \mu_0

「仮説検定の考え方」では帰無仮説を等号（ $\mu = \mu_0$ ）で書きました。片側検定では $\leq$ や $\geq$ を使いますが、検定の計算では第1種の過誤の確率が最大となる境界値 $\mu = \mu_0$ を基準にします。実質的な計算の仕方は等号の場合と変わりません。

棄却域の形

有意水準 $\alpha$ をすべて片方の裾に割り当てます。

右片側検定（ $\alpha = 0.05$ 、標準正規分布）の場合：

\text{棄却域：} z > 1.645

臨界値が $1.96$ ではなく $1.645$ であることに注目してください。 $\alpha$ を片方に集中させるため、同じ有意水準でも棄却しやすくなります。

新薬の臨床試験の例

新薬が既存薬より血圧を下げるかどうかを検定します。血圧の値が小さいほど効果があるため、新薬が有効なら $\mu_{\text{新}} < \mu_{\text{既}}$ となるはずです。したがって対立仮説は「左方向」になります。

$H_0: \mu_{\text{新}} \geq \mu_{\text{既}}$ （新薬は既存薬以上の血圧を示す＝効果なし）
$H_1: \mu_{\text{新}} < \mu_{\text{既}}$ （新薬は既存薬より血圧を下げる＝効果あり）
有意水準 $\alpha = 0.05$

これは左片側検定です。臨界値は $z = -1.645$ であり、棄却域は $z < -1.645$ です。

データから $z = -2.1$ が得られたとすると、 $-2.1 < -1.645$ なので棄却域に入り、「新薬は既存薬より血圧を下げる効果がある」と結論します。

片側・両側のどちらを選ぶか

判断基準	両側検定	片側検定
関心のある方向	どちらの方向にもズレを検出したい	一方向のみに関心がある
対立仮説	$H_1: \mu \neq \mu_0$	$H_1: \mu > \mu_0$ または $H_1: \mu < \mu_0$
棄却域	両方の裾	片方の裾のみ
典型的な場面	規格値との一致、品質管理	新しい手法の優越性、改善効果

片側検定の注意点

片側検定は、同じ有意水準でも棄却しやすくなります。これは利点でもあり、危険でもあります。

注意

片側検定の方向は、データを見る前に決めなければなりません。データを見てから「こちらの方向の方が有意になりそうだ」と片側検定を選ぶのは、p-ハッキングの一種です。「p値は何を測っていて、何を測っていないか」で学んだ事前決定の原則と同じです。

判断に迷ったら、両側検定を選ぶのが安全です。両側検定で有意であり、かつズレの方向が片側検定の対立仮説と一致していれば、同じ有意水準の片側検定でも必ず有意になります。

棄却域・p値・信頼区間の関係

ここまでに学んだ3つの道具は、実は同じ情報を異なる角度から見ています。

道具	判定方法
p値アプローチ	$p < \alpha$ なら棄却
棄却域アプローチ	検定統計量が棄却域に入れば棄却
信頼区間	$\mu_0$ が信頼区間に含まれなければ棄却（両側検定の場合）

$\alpha = 0.05$ の両側検定で $H_0: \mu = \mu_0$ を検定する場合、次の3つは同値です。

p値が 0.05 より小さい
検定統計量が棄却域（ $|z| > 1.96$ ）に入る
$\mu_0$ が 95% 信頼区間に含まれない

ポイント

3つの方法は常に同じ結論を出します。計算の手間や情報の伝え方が異なるだけです。実務では、p値を報告しつつ信頼区間を添えるのが最も情報量の多い報告方法です（「p値は何を測っていて、何を測っていないか」で学びました）。

よくある誤解

注意

誤解1：片側検定の方がp値の基準が緩いから、いつも片側を使えばいい — 片側検定は一方向のズレしか検出しません。たとえば新薬の臨床試験で「新薬が良い方向のみ」の片側検定を選んだ場合、新薬が既存薬より明らかに悪い結果を示しても、統計的には「有意でない」として見逃されます。検定の方向は研究の問いに基づいて事前に決めるものです。
誤解2：両側検定で有意にならなかったので片側検定に切り替えた — これはp-ハッキングです。検定の方向は、データを見る前に決めなければなりません。
誤解3：棄却域アプローチとp値アプローチは異なる結果を出すことがある — 同じ有意水準で同じ検定を行えば、必ず同じ結論になります。

まとめ

棄却域アプローチは、検定統計量が「あらかじめ定めた範囲」に入るかどうかで判定する方法です。p値アプローチとは表裏の関係にあり、常に同じ結論を出します。

両側検定は「どちらの方向のズレも検出したいとき」、片側検定は「一方向だけに関心があるとき」に使います。片側検定の方向は、データを見る前に決める必要があります。

迷ったら両側検定を選びましょう。別の単元では、これらの道具を使って実際に検定を行う手順を学びます。