2標本検定（母分散の比・母比率の差）

F検定で2つの母分散の等しさを調べ、正規近似で母比率の差を検定する方法を学びます。検定の前提確認から実行までの手順を扱います。

難易度 Lv 4 / 10想定時間：約20分

「2標本検定（母平均の差）」では、2つの標本の平均を比較する方法を学びました。ここでは、分散（ばらつき）の比較と比率の比較を扱います。

2つの母集団の分散が等しいかどうかを検定します。この検定の結果は、プールドt検定を使ってよいかどうかの判断にも使えます。

H_0: \sigma_1^2 = \sigma_2^2 \quad \text{vs} \quad H_1: \sigma_1^2 \neq \sigma_2^2

検定統計量は、2つの不偏分散の比です。

F = \frac{s_1^2}{s_2^2}

慣例として、大きい方の不偏分散を分子に置きます（ $s_1^2 \geq s_2^2$ ）。この統計量は自由度 $(n_1 - 1, n_2 - 1)$ のF分布に従います。

$F$ が1に近ければ2つの分散はほぼ等しく、1から大きく離れるほど差があることを示します。

補足

F分布は0以上の値のみを取る右に裾の長い分布です。大きい不偏分散を分子に置く操作によって検定統計量が $F \geq 1$ （分布の右側）に強制されるため、下側の棄却域を気にする必要がなくなり、上側 $\alpha/2$ の棄却点との比較だけで両側検定と同値の判定ができます。

2つの生産ラインの品質のばらつきに差があるかを検定します（ライン1： $s_1^2 = 100$ , $n_1 = 20$ 、ライン2： $s_2^2 = 121$ , $n_2 = 25$ ）。

手順：

F = \frac{121}{100} = 1.21

ポイント

F検定は母集団の正規性に非常に敏感です。母集団が正規分布から大きくずれている場合、F検定の結果は信頼できません。そのため、プールドt検定を使うかWelchのt検定を使うかの判断にF検定を使うことには注意が必要です。迷った場合はWelchのt検定を選ぶ方が頑健です。

2つの母集団の比率が等しいかどうかを検定します。

H_0: p_1 = p_2 \quad \text{vs} \quad H_1: p_1 \neq p_2

帰無仮説のもとでは $p_1 = p_2$ なので、2つの標本を統合してプールド比率を求めます。

\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}

ここで $x_1$ , $x_2$ はそれぞれの標本での「成功」数です。

検定統計量は：

z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1 - \hat{p})\left(\dfrac{1}{n_1} + \dfrac{1}{n_2}\right)}}

この統計量は近似的に標準正規分布に従います。

補足

1標本の母比率の検定では分母に $p_0$ を使いましたが、2標本では帰無仮説のもとで共通の比率が未知なので、プールド比率 $\hat{p}$ で推定します。

A工場とB工場で不良品率に差があるかを検定します。

両側検定（ $\alpha = 0.05$ ）で検定します。

手順：

\hat{p} = \frac{18 + 25}{300 + 250} = \frac{43}{550} \approx 0.0782

\sqrt{0.0782 \times 0.9218 \times \left(\frac{1}{300} + \frac{1}{250}\right)} = \sqrt{0.0721 \times 0.00733} = \sqrt{0.000528} \approx 0.0230

z = \frac{0.060 - 0.100}{0.0230} = \frac{-0.040}{0.0230} \approx -1.74

A工場6%に対しB工場10%と、数字上は差が大きく見えますが、 $|z| = 1.74$ は棄却域にかなり近い値です。「差がない」と確定したわけではなく、「この標本サイズでは差を統計的に裏付けるには至らなかった」という意味です。

補足

この近似が妥当であるためには、 $n_1\hat{p}$ , $n_1(1-\hat{p})$ , $n_2\hat{p}$ , $n_2(1-\hat{p})$ がすべて5以上であることを確認してください。

検定したい対象	検定統計量	従う分布	条件
母分散の比	$F = s_1^2 / s_2^2$	F分布（自由度 $n_1-1, n_2-1$ ）	正規母集団
母比率の差	$z = \dfrac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p})(1/n_1+1/n_2)}}$	標準正規分布	各群の成功・失敗の期待度数 ≥ 5

F検定は2つの母分散が等しいかを判定しますが、正規性に敏感なため結果の解釈には慎重さが必要です。母比率の差の検定はプールド比率を使った正規近似で、2群の比率を比較します。どちらの検定も、前提条件（F検定は正規母集団、比率の検定は期待度数 ≥ 5）を確認してから使いましょう。