棄却域と片側・両側検定

検定統計量の判定方法を理解し、問いに応じた検定の設計ができる

難易度 Lv 4 / 10想定時間:約20

できるようになること


同じ「差があるか」でも、問い方が違う

ある工場で、製品の重さが規格値の500gに合っているかを検査したいとします。重すぎても軽すぎても不良品です。関心があるのは「500gからズレているかどうか」であり、ズレの方向は問いません。

一方、新薬の臨床試験では、新薬が既存薬より効くかどうかを調べたいとします。「効果が同じかどうか」ではなく、「新薬の方が良いかどうか」が関心です。悪い方向にズレていても「差がある」と結論づけたいわけではありません。

この2つの場面では、同じ「差があるか」という問いでも、検定の設計が変わります。この単元では、その設計の違いを学びます。


p値アプローチと棄却域アプローチ

この2つの場面で判定方法がどう変わるのかを理解するには、「棄却域」という考え方が必要です。

「仮説検定の考え方」では、p値を計算して有意水準と比べる方法を学びました。

p<α棄却p < \alpha \Rightarrow \text{棄却}

このp値アプローチは、検定の結論を出す標準的な方法です。しかし、別の出発点からも同じ結論にたどり着けます。

棄却域アプローチ

棄却域(rejection region)とは、「帰無仮説を棄却する検定統計量の範囲」をあらかじめ定めたものです。

手順は次のようになります。

  1. 帰無仮説 H0H_0 と対立仮説 H1H_1 を立てる
  2. 有意水準 α\alpha を決める
  3. α\alpha に対応する臨界値(critical value)を分布表から求め、棄却域を定める。臨界値とは、帰無仮説のもとでの分布において、上側(または下側)確率がちょうど α\alpha(または α/2\alpha/2)となる点のことです
  4. データから検定統計量を計算する
  5. 検定統計量が棄却域に入れば H0H_0 を棄却、入らなければ棄却しない

p値アプローチでは「面積を計算して α\alpha と比較」しますが、棄却域アプローチでは「値の位置を見て線の内か外かを判定」します。

ポイント

p値アプローチと棄却域アプローチは、同じ判定に異なる角度からたどり着く方法です。p値が α\alpha より小さいことと、検定統計量が棄却域に入ることは、数学的に同値です。

なぜ同値といえるか:右片側検定を例に取ると、p値は「検定統計量の観測値 zobsz_{\text{obs}} より極端になる確率」、α\alpha は「臨界値 zαz_{\alpha} より極端になる確率」です。p<αp < \alphazobs>zαz_{\text{obs}} > z_{\alpha} と同じことを意味します。

なぜ棄却域アプローチも知るべきか

p値が計算できる環境では、p値アプローチだけで十分です。しかし、棄却域アプローチを知っておくと:


両側検定

問いの形

「母数がある値と異なるかどうか」を検定するとき、両側検定を使います。

H0:μ=μ0vsH1:μμ0H_0: \mu = \mu_0 \quad \text{vs} \quad H_1: \mu \neq \mu_0

対立仮説が \neq(等しくない)であることがポイントです。μ0\mu_0 より大きい方向にも小さい方向にもズレを検出したいので、分布の両方の裾に棄却域を設けます。

棄却域の形

有意水準 α\alpha を両方の裾に均等に振り分けます。

ここでは母分散 σ\sigma が既知であるか、サンプルサイズ nn が十分に大きく、検定統計量 zz が標準正規分布に従う場合を考えます。α=0.05\alpha = 0.05 のとき、臨界値は ±1.96\pm 1.96 です。

棄却域:z<1.96 または z>1.96\text{棄却域:} z < -1.96 \text{ または } z > 1.96

製品検査の例

工場での製品重量の検査に戻ります。

100個の製品を抽出したところ、標本平均 xˉ=502\bar{x} = 502 g でした。母標準偏差 σ=8.7\sigma = 8.7 g が既知のとき、検定統計量は:

z=xˉμ0σ/n=5025008.7/1002.30z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{502 - 500}{8.7 / \sqrt{100}} \approx 2.30

z=2.30>1.96z = 2.30 > 1.96 なので棄却域に入ります。「平均重量は500gではない」と結論します。

補足

この例では右の裾に入りましたが、もし z=2.5z = -2.5 だったとしても棄却域に入ります。両側検定では、どちらの方向へのズレも検出します。


片側検定

問いの形

「母数がある値より大きいかどうか(または小さいかどうか)」を検定するとき、片側検定を使います。

右片側検定(大きいかどうか):

H0:μμ0vsH1:μ>μ0H_0: \mu \leq \mu_0 \quad \text{vs} \quad H_1: \mu > \mu_0

左片側検定(小さいかどうか):

H0:μμ0vsH1:μ<μ0H_0: \mu \geq \mu_0 \quad \text{vs} \quad H_1: \mu < \mu_0

「仮説検定の考え方」では帰無仮説を等号(μ=μ0\mu = \mu_0)で書きました。片側検定では \leq\geq を使いますが、検定の計算では第1種の過誤の確率が最大となる境界値 μ=μ0\mu = \mu_0 を基準にします。実質的な計算の仕方は等号の場合と変わりません。

棄却域の形

有意水準 α\alpha をすべて片方の裾に割り当てます。

右片側検定(α=0.05\alpha = 0.05、標準正規分布)の場合:

棄却域:z>1.645\text{棄却域:} z > 1.645

臨界値が 1.961.96 ではなく 1.6451.645 であることに注目してください。α\alpha を片方に集中させるため、同じ有意水準でも棄却しやすくなります

新薬の臨床試験の例

新薬が既存薬より血圧を下げるかどうかを検定します。血圧の値が小さいほど効果があるため、新薬が有効なら μ<μ\mu_{\text{新}} < \mu_{\text{既}} となるはずです。したがって対立仮説は「左方向」になります。

これは左片側検定です。臨界値は z=1.645z = -1.645 であり、棄却域は z<1.645z < -1.645 です。

データから z=2.1z = -2.1 が得られたとすると、2.1<1.645-2.1 < -1.645 なので棄却域に入り、「新薬は既存薬より血圧を下げる効果がある」と結論します。


片側・両側のどちらを選ぶか

判断基準両側検定片側検定
関心のある方向どちらの方向にもズレを検出したい一方向のみに関心がある
対立仮説H1:μμ0H_1: \mu \neq \mu_0H1:μ>μ0H_1: \mu > \mu_0 または H1:μ<μ0H_1: \mu < \mu_0
棄却域両方の裾片方の裾のみ
典型的な場面規格値との一致、品質管理新しい手法の優越性、改善効果

片側検定の注意点

片側検定は、同じ有意水準でも棄却しやすくなります。これは利点でもあり、危険でもあります。

注意

片側検定の方向は、データを見る前に決めなければなりません。データを見てから「こちらの方向の方が有意になりそうだ」と片側検定を選ぶのは、p-ハッキングの一種です。「p値は何を測っていて、何を測っていないか」で学んだ事前決定の原則と同じです。

判断に迷ったら、両側検定を選ぶのが安全です。両側検定で有意であり、かつズレの方向が片側検定の対立仮説と一致していれば、同じ有意水準の片側検定でも必ず有意になります。


棄却域・p値・信頼区間の関係

ここまでに学んだ3つの道具は、実は同じ情報を異なる角度から見ています。

道具判定方法
p値アプローチp<αp < \alpha なら棄却
棄却域アプローチ検定統計量が棄却域に入れば棄却
信頼区間μ0\mu_0 が信頼区間に含まれなければ棄却(両側検定の場合)

α=0.05\alpha = 0.05 の両側検定で H0:μ=μ0H_0: \mu = \mu_0 を検定する場合、次の3つは同値です。

ポイント

3つの方法は常に同じ結論を出します。計算の手間や情報の伝え方が異なるだけです。実務では、p値を報告しつつ信頼区間を添えるのが最も情報量の多い報告方法です(「p値は何を測っていて、何を測っていないか」で学びました)。


よくある誤解

注意
  • 誤解1:片側検定の方がp値の基準が緩いから、いつも片側を使えばいい — 片側検定は一方向のズレしか検出しません。たとえば新薬の臨床試験で「新薬が良い方向のみ」の片側検定を選んだ場合、新薬が既存薬より明らかに悪い結果を示しても、統計的には「有意でない」として見逃されます。検定の方向は研究の問いに基づいて事前に決めるものです。
  • 誤解2:両側検定で有意にならなかったので片側検定に切り替えた — これはp-ハッキングです。検定の方向は、データを見る前に決めなければなりません。
  • 誤解3:棄却域アプローチとp値アプローチは異なる結果を出すことがある — 同じ有意水準で同じ検定を行えば、必ず同じ結論になります。

まとめ

棄却域アプローチは、検定統計量が「あらかじめ定めた範囲」に入るかどうかで判定する方法です。p値アプローチとは表裏の関係にあり、常に同じ結論を出します。

両側検定は「どちらの方向のズレも検出したいとき」、片側検定は「一方向だけに関心があるとき」に使います。片側検定の方向は、データを見る前に決める必要があります。

迷ったら両側検定を選びましょう。別の単元では、これらの道具を使って実際に検定を行う手順を学びます。