2標本検定(母分散の比・母比率の差)
F検定で分散の等しさを調べ、正規近似で比率の差を検定する
難易度 Lv 4 / 10想定時間:約20分
できるようになること
- 母分散の比をF検定で検定できる
- 母比率の差を正規近似で検定できる
- F検定の限界とWelchのt検定との関係を説明できる
母平均以外の比較
「2標本検定(母平均の差)」では、2つの標本の平均を比較する方法を学びました。ここでは、分散(ばらつき)の比較と比率の比較を扱います。
母分散の比の検定(F検定)
2つの母集団の分散が等しいかどうかを検定します。この検定の結果は、プールドt検定を使ってよいかどうかの判断にも使えます。
H0:σ12=σ22vsH1:σ12=σ22
検定統計量は、2つの不偏分散の比です。
F=s22s12
慣例として、大きい方の不偏分散を分子に置きます(s12≥s22)。この統計量は自由度 (n1−1,n2−1) のF分布に従います。
F が1に近ければ2つの分散はほぼ等しく、1から大きく離れるほど差があることを示します。
F分布は0以上の値のみを取る右に裾の長い分布です。大きい不偏分散を分子に置く操作によって検定統計量が F≥1(分布の右側)に強制されるため、下側の棄却域を気にする必要がなくなり、上側 α/2 の棄却点との比較だけで両側検定と同値の判定ができます。
例:2つの生産ラインのばらつき比較
2つの生産ラインの品質のばらつきに差があるかを検定します(ライン1:s12=100, n1=20、ライン2:s22=121, n2=25)。
手順:
-
H0:σ12=σ22、H1:σ12=σ22
-
α=0.05(両側)
-
大きい不偏分散(ライン2:s22=121)を分子に置く:
F=100121=1.21
- 自由度 (24,19) のF分布の上側 2.5% 点 ≈2.45(両側検定なので α/2=0.025)
- F=1.21<2.45 なので棄却域に入らない
- 結論:2つのラインの分散が異なるとは言えない
F検定は母集団の正規性に非常に敏感です。母集団が正規分布から大きくずれている場合、F検定の結果は信頼できません。そのため、プールドt検定を使うかWelchのt検定を使うかの判断にF検定を使うことには注意が必要です。迷った場合はWelchのt検定を選ぶ方が頑健です。
母比率の差の検定
2つの母集団の比率が等しいかどうかを検定します。
H0:p1=p2vsH1:p1=p2
帰無仮説のもとでは p1=p2 なので、2つの標本を統合してプールド比率を求めます。
p^=n1+n2x1+x2
ここで x1, x2 はそれぞれの標本での「成功」数です。
検定統計量は:
z=p^(1−p^)(n11+n21)p^1−p^2
この統計量は近似的に標準正規分布に従います。
1標本の母比率の検定では分母に p0 を使いましたが、2標本では帰無仮説のもとで共通の比率が未知なので、プールド比率 p^ で推定します。
例:2つの工場の不良品率
A工場とB工場で不良品率に差があるかを検定します。
| A工場 | B工場 |
|---|
| 検査数 n | 300 | 250 |
| 不良品数 x | 18 | 25 |
| 標本比率 p^ | 0.060 | 0.100 |
両側検定(α=0.05)で検定します。
手順:
-
H0:p1=p2、H1:p1=p2
-
α=0.05(両側)、臨界値 ±1.96
-
プールド比率を計算:
p^=300+25018+25=55043≈0.0782
- 差の標準誤差を計算:
0.0782×0.9218×(3001+2501)=0.0721×0.00733=0.000528≈0.0230
- 検定統計量を計算:
z=0.02300.060−0.100=0.0230−0.040≈−1.74
- ∣z∣=1.74<1.96 なので棄却域に入らない
- 結論:2つの工場の不良品率に差があるとは言えない
A工場6%に対しB工場10%と、数字上は差が大きく見えますが、∣z∣=1.74 は棄却域にかなり近い値です。「差がない」と確定したわけではなく、「この標本サイズでは差を統計的に裏付けるには至らなかった」という意味です。
この近似が妥当であるためには、n1p^, n1(1−p^), n2p^, n2(1−p^) がすべて5以上であることを確認してください。
検定の選び方
| 検定したい対象 | 検定統計量 | 従う分布 | 条件 |
|---|
| 母分散の比 | F=s12/s22 | F分布(自由度 n1−1,n2−1) | 正規母集団 |
| 母比率の差 | z=p^(1−p^)(1/n1+1/n2)p^1−p^2 | 標準正規分布 | 各群の成功・失敗の期待度数 ≥ 5 |
まとめ
F検定は2つの母分散が等しいかを判定しますが、正規性に敏感なため結果の解釈には慎重さが必要です。母比率の差の検定はプールド比率を使った正規近似で、2群の比率を比較します。どちらの検定も、前提条件(F検定は正規母集団、比率の検定は期待度数 ≥ 5)を確認してから使いましょう。