2標本の区間推定

母平均の差・母分散の比・母比率の差の信頼区間を計算する

難易度 Lv 4 / 10想定時間:約25

できるようになること


比較対象が「もう1つの標本」になるとき

「1標本の区間推定」では、1つの母集団の母数(μ\mu, σ2\sigma^2, pp)を推定しました。しかし実際のデータ分析では、2つの母集団を比較する場面がよくあります。A工場とB工場のどちらの品質が高いか、新薬と従来薬のどちらが効果的か、といった問いです。

2標本の区間推定では、母数そのものではなく母数の差や比の信頼区間を求めます。差の信頼区間が0を含むか、比の信頼区間が1を含むかが、2つの母集団に違いがあるかの判断材料になります。

補足

この単元では、2つの独立な(互いに無関係な)標本を扱います。同じ対象を測定前後で比較する場合(対応のあるデータ)は別の方法を使います。


母平均の差の区間推定

2つの母集団の平均の差 μ1μ2\mu_1 - \mu_2 の信頼区間を求めます。1標本の場合と同様に、母分散が分かっているかどうかで使う方法が変わります。

母分散が既知の場合(z区間)

(xˉ1xˉ2)±zα/2σ12n1+σ22n2(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}

分母のルートの中は差の標準誤差です。独立な確率変数の差の分散は、それぞれの分散を足したものになります(「確率変数の和と線形結合」で学んだ性質です)。

例:2つの工場の製品重量(母分散が既知)

「2標本検定(母平均の差)」と同じデータで、母平均の差の95%信頼区間を求めます。

A工場B工場
標本サイズ nn200150
標本平均 xˉ\bar{x}502 g498 g
母標準偏差 σ\sigma15 g12 g
(502498)±1.96×152200+122150=4±1.96×1.444=4±2.83(502 - 498) \pm 1.96 \times \sqrt{\frac{15^2}{200} + \frac{12^2}{150}} = 4 \pm 1.96 \times 1.444 = 4 \pm 2.83

95%信頼区間は [1.17, 6.83] g です。区間が0を含まないので、2つの工場の平均重量には差があると判断できます。これは検定で帰無仮説が棄却された結果と一致します。

補足

一般に、差の (1α)(1-\alpha) 信頼区間が0を含まないことと、有意水準 α\alpha の検定で帰無仮説が棄却されることは同値です。同様に、比の信頼区間が1を含まないことと検定での棄却が対応します。以降の例でもこの対応を確認しましょう。

母分散が未知で等しいと仮定する場合(プールドt区間)

母分散が未知で、σ12=σ22\sigma_1^2 = \sigma_2^2 と仮定できる場合、2つの標本を統合して共通の分散を推定します。プールド分散 sp2s_p^2 は:

sp2=(n11)s12+(n21)s22n1+n22s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}

信頼水準 (1α)(1-\alpha) の信頼区間は:

(xˉ1xˉ2)±tα/2(n1+n22)sp1n1+1n2(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(n_1 + n_2 - 2) \cdot s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}
例:2つの生産ラインの比較(等分散を仮定)
ライン1ライン2
標本サイズ nn2025
標本平均 xˉ\bar{x}501 g497 g
不偏標準偏差 ss10 g11 g

母集団はそれぞれ正規分布に従うと仮定します。

sp2=19×100+24×12143=480443111.7,sp10.57s_p^2 = \frac{19 \times 100 + 24 \times 121}{43} = \frac{4804}{43} \approx 111.7, \quad s_p \approx 10.57

自由度 20+252=4320 + 25 - 2 = 43 のt分布の上側2.5%点は t0.025(43)=2.017t_{0.025}(43) = 2.017 です。

(501497)±2.017×10.57×120+125=4±2.017×3.17=4±6.39(501 - 497) \pm 2.017 \times 10.57 \times \sqrt{\frac{1}{20} + \frac{1}{25}} = 4 \pm 2.017 \times 3.17 = 4 \pm 6.39

95%信頼区間は [-2.39, 10.39] g です。区間が0を含んでいるため、母平均に差があるとは言い切れません。

母分散が未知で等しいと仮定しない場合(Welchのt区間)

等分散の仮定が不確かな場合は、Welch近似を使います。

(xˉ1xˉ2)±tα/2(ν)s12n1+s22n2(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(\nu) \cdot \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}

自由度 ν\nu はウェルチ–サタスウェイトの近似で求めます(「2標本検定(母平均の差)」を参照)。

例:異なる工場の比較(等分散を仮定しない)

今度は別の2つの工場(C工場・D工場)を比較します。ばらつきが大きく異なるため、Welchのt区間を使います。

C工場D工場
標本サイズ nn2025
標本平均 xˉ\bar{x}501 g497 g
不偏標準偏差 ss10 g18 g
10220+18225=5+12.96=17.964.24\sqrt{\frac{10^2}{20} + \frac{18^2}{25}} = \sqrt{5 + 12.96} = \sqrt{17.96} \approx 4.24

自由度は ν38.8\nu \approx 38.8 です。分布表を参照するには整数が必要なため、安全側(区間が広くなる側)に切り捨てて ν=38\nu = 38 とします。t0.025(38)=2.024t_{0.025}(38) = 2.024 です。

(501497)±2.024×4.24=4±8.58(501 - 497) \pm 2.024 \times 4.24 = 4 \pm 8.58

95%信頼区間は [-4.58, 12.58] g です。D工場の標準偏差が大きい(18g vs 10g)ため区間が広く、差の有無を判定するには不十分なデータ量です。

ポイント

検定の場合と同様に、プールドt区間とWelchのt区間で迷ったらWelchのt区間を選ぶのが安全です。等分散が成り立つ場合でもWelchの結果はほぼ同じですが、成り立たないのにプールドt区間を使うと区間の被覆率が公称値からずれます。


母分散の比の区間推定

プールドt区間では等分散を仮定しました。等分散かどうかの判断材料として、σ12/σ22\sigma_1^2 / \sigma_2^2 の信頼区間を使うこともできます。2つの正規母集団の分散の比の信頼区間を求めましょう。

不偏分散の比 s12/s22s_1^2 / s_2^2 にF分布を適用します。信頼水準 (1α)(1-\alpha) の信頼区間は:

[s12s221Fα/2(n11,  n21),s12s22Fα/2(n21,  n11)]\left[\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,\; n_2-1)},\quad \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2}(n_2-1,\; n_1-1)\right]

ここで Fα/2(m,n)F_{\alpha/2}(m, n) は自由度 (m,n)(m, n) のF分布の上側 α/2\alpha/2 点です。

補足

F分布は左右対称ではないため、上限と下限で異なるパーセント点を使います。公式の中で自由度の順序((n11,n21)(n_1-1, n_2-1)(n21,n11)(n_2-1, n_1-1))が入れ替わるのは、F分布の下側パーセント点が上側パーセント点の逆数 F1α/2(m,n)=1/Fα/2(n,m)F_{1-\alpha/2}(m, n) = 1 / F_{\alpha/2}(n, m) で求まるためです。

例:2つの生産ラインのばらつき比較

先ほどの2つの生産ラインのデータ(ライン1:s12=100s_1^2 = 100, n1=20n_1 = 20、ライン2:s22=121s_2^2 = 121, n2=25n_2 = 25)で、母分散の比 σ12/σ22\sigma_1^2 / \sigma_2^2 の95%信頼区間を求めます。

s12s22=1001210.826\frac{s_1^2}{s_2^2} = \frac{100}{121} \approx 0.826

F分布のパーセント点:F0.025(19,24)2.35F_{0.025}(19, 24) \approx 2.35F0.025(24,19)2.45F_{0.025}(24, 19) \approx 2.45

[0.8262.35,0.826×2.45]=[0.35,2.02]\left[\frac{0.826}{2.35},\quad 0.826 \times 2.45\right] = [0.35,\quad 2.02]

95%信頼区間は [0.35, 2.02] です。区間が1を含んでいるため、分散が異なるとは言い切れません(F検定の結果と一致します)。


母比率の差の区間推定

2つの母集団の比率の差 p1p2p_1 - p_2 の信頼区間を求めます。

(p^1p^2)±zα/2p^1(1p^1)n1+p^2(1p^2)n2(\hat{p}_1 - \hat{p}_2) \pm z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}
ポイント

検定では帰無仮説のもとで p1=p2p_1 = p_2 と仮定するためプールド比率 p^\hat{p} を使いましたが、区間推定ではそのような仮定を置かないため、各群の標本比率 p^1\hat{p}_1, p^2\hat{p}_2 をそれぞれ使います。これは検定と区間推定の重要な違いです。

例:2つの工場の不良品率

「2標本検定(母分散の比・母比率の差)」と同じデータを使います。

A工場B工場
検査数 nn300250
不良品数 xx1825
標本比率 p^\hat{p}0.0600.100
(0.0600.100)±1.96×0.060×0.940300+0.100×0.900250(0.060 - 0.100) \pm 1.96 \times \sqrt{\frac{0.060 \times 0.940}{300} + \frac{0.100 \times 0.900}{250}} =0.040±1.96×0.000188+0.000360=0.040±1.96×0.02341=0.040±0.046= -0.040 \pm 1.96 \times \sqrt{0.000188 + 0.000360} = -0.040 \pm 1.96 \times 0.02341 = -0.040 \pm 0.046

95%信頼区間は [-0.086, 0.006] です。区間が0を含んでいるため、2つの工場の不良品率に差があるとは言い切れません。

ただし区間の上限が0.006と0に近く、A工場の方が低い可能性が示唆されています。標本サイズを増やせば結論がはっきりする可能性があります。


区間推定の使い分け

推定対象信頼区間の式使う分布条件
母平均の差(σ\sigma 既知)(xˉ1xˉ2)±zα/2σ12/n1+σ22/n2(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2}\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}標準正規分布σ1\sigma_1, σ2\sigma_2 が既知
母平均の差(等分散)(xˉ1xˉ2)±tα/2(n1+n22)sp1/n1+1/n2(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(n_1+n_2-2) \cdot s_p\sqrt{1/n_1+1/n_2}t分布正規母集団、等分散
母平均の差(不等分散)(xˉ1xˉ2)±tα/2(ν)s12/n1+s22/n2(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(\nu) \cdot \sqrt{s_1^2/n_1+s_2^2/n_2}t分布正規母集団、Welch近似
母分散の比[s12s221Fα/2(n11,n21),  s12s22Fα/2(n21,n11)]\left[\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\; \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2}(n_2-1,n_1-1)\right]F分布正規母集団
母比率の差(p^1p^2)±zα/2p^1(1p^1)n1+p^2(1p^2)n2(\hat{p}_1-\hat{p}_2) \pm z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}標準正規分布各群で np^5n\hat{p} \geq 5 かつ n(1p^)5n(1-\hat{p}) \geq 5

よくある誤解

注意
  • 誤解1:信頼区間が0を含まなければ差は「大きい」 — 0を含まないことは差の存在を示唆しますが、差の大きさが実務的に意味があるかは別の判断です。区間の幅と差の絶対値を合わせて解釈してください。
  • 誤解2:母分散の比の信頼区間も左右対称 — F分布は左右対称ではないため、信頼区間も非対称です。母分散の比が1に近くても、区間の上側と下側の幅は異なります。

まとめ

2標本の区間推定は、1標本の場合と同じ論理で構成されますが、比較対象にも不確実性があることが新たな考慮点です。母平均の差では差の標準誤差に2つの分散が含まれ、母比率の差では各群の標本比率から標準誤差を計算します。

信頼区間と検定の結論は一致します。差の信頼区間が0を含まなければ検定で有意、母分散の比の信頼区間が1を含まなければF検定で有意です。信頼区間は有意かどうかだけでなく、差や比がどの範囲にありそうかという情報も与えてくれます。