2標本の区間推定
母平均の差・母分散の比・母比率の差の信頼区間を計算する
難易度 Lv 4 / 10想定時間:約25分
できるようになること
- 母平均の差・母分散の比・母比率の差の信頼区間を計算できる
- 状況に応じて適切な区間推定の手法を選べる
- 信頼区間から検定の結論を読み取れる
比較対象が「もう1つの標本」になるとき
「1標本の区間推定」では、1つの母集団の母数(μ, σ2, p)を推定しました。しかし実際のデータ分析では、2つの母集団を比較する場面がよくあります。A工場とB工場のどちらの品質が高いか、新薬と従来薬のどちらが効果的か、といった問いです。
2標本の区間推定では、母数そのものではなく母数の差や比の信頼区間を求めます。差の信頼区間が0を含むか、比の信頼区間が1を含むかが、2つの母集団に違いがあるかの判断材料になります。
この単元では、2つの独立な(互いに無関係な)標本を扱います。同じ対象を測定前後で比較する場合(対応のあるデータ)は別の方法を使います。
母平均の差の区間推定
2つの母集団の平均の差 μ1−μ2 の信頼区間を求めます。1標本の場合と同様に、母分散が分かっているかどうかで使う方法が変わります。
母分散が既知の場合(z区間)
(xˉ1−xˉ2)±zα/2n1σ12+n2σ22
分母のルートの中は差の標準誤差です。独立な確率変数の差の分散は、それぞれの分散を足したものになります(「確率変数の和と線形結合」で学んだ性質です)。
例:2つの工場の製品重量(母分散が既知)
「2標本検定(母平均の差)」と同じデータで、母平均の差の95%信頼区間を求めます。
| A工場 | B工場 |
|---|
| 標本サイズ n | 200 | 150 |
| 標本平均 xˉ | 502 g | 498 g |
| 母標準偏差 σ | 15 g | 12 g |
(502−498)±1.96×200152+150122=4±1.96×1.444=4±2.83
95%信頼区間は [1.17, 6.83] g です。区間が0を含まないので、2つの工場の平均重量には差があると判断できます。これは検定で帰無仮説が棄却された結果と一致します。
一般に、差の (1−α) 信頼区間が0を含まないことと、有意水準 α の検定で帰無仮説が棄却されることは同値です。同様に、比の信頼区間が1を含まないことと検定での棄却が対応します。以降の例でもこの対応を確認しましょう。
母分散が未知で等しいと仮定する場合(プールドt区間)
母分散が未知で、σ12=σ22 と仮定できる場合、2つの標本を統合して共通の分散を推定します。プールド分散 sp2 は:
sp2=n1+n2−2(n1−1)s12+(n2−1)s22
信頼水準 (1−α) の信頼区間は:
(xˉ1−xˉ2)±tα/2(n1+n2−2)⋅spn11+n21
例:2つの生産ラインの比較(等分散を仮定)
| ライン1 | ライン2 |
|---|
| 標本サイズ n | 20 | 25 |
| 標本平均 xˉ | 501 g | 497 g |
| 不偏標準偏差 s | 10 g | 11 g |
母集団はそれぞれ正規分布に従うと仮定します。
sp2=4319×100+24×121=434804≈111.7,sp≈10.57
自由度 20+25−2=43 のt分布の上側2.5%点は t0.025(43)=2.017 です。
(501−497)±2.017×10.57×201+251=4±2.017×3.17=4±6.39
95%信頼区間は [-2.39, 10.39] g です。区間が0を含んでいるため、母平均に差があるとは言い切れません。
母分散が未知で等しいと仮定しない場合(Welchのt区間)
等分散の仮定が不確かな場合は、Welch近似を使います。
(xˉ1−xˉ2)±tα/2(ν)⋅n1s12+n2s22
自由度 ν はウェルチ–サタスウェイトの近似で求めます(「2標本検定(母平均の差)」を参照)。
例:異なる工場の比較(等分散を仮定しない)
今度は別の2つの工場(C工場・D工場)を比較します。ばらつきが大きく異なるため、Welchのt区間を使います。
| C工場 | D工場 |
|---|
| 標本サイズ n | 20 | 25 |
| 標本平均 xˉ | 501 g | 497 g |
| 不偏標準偏差 s | 10 g | 18 g |
20102+25182=5+12.96=17.96≈4.24
自由度は ν≈38.8 です。分布表を参照するには整数が必要なため、安全側(区間が広くなる側)に切り捨てて ν=38 とします。t0.025(38)=2.024 です。
(501−497)±2.024×4.24=4±8.58
95%信頼区間は [-4.58, 12.58] g です。D工場の標準偏差が大きい(18g vs 10g)ため区間が広く、差の有無を判定するには不十分なデータ量です。
検定の場合と同様に、プールドt区間とWelchのt区間で迷ったらWelchのt区間を選ぶのが安全です。等分散が成り立つ場合でもWelchの結果はほぼ同じですが、成り立たないのにプールドt区間を使うと区間の被覆率が公称値からずれます。
母分散の比の区間推定
プールドt区間では等分散を仮定しました。等分散かどうかの判断材料として、σ12/σ22 の信頼区間を使うこともできます。2つの正規母集団の分散の比の信頼区間を求めましょう。
不偏分散の比 s12/s22 にF分布を適用します。信頼水準 (1−α) の信頼区間は:
[s22s12⋅Fα/2(n1−1,n2−1)1,s22s12⋅Fα/2(n2−1,n1−1)]
ここで Fα/2(m,n) は自由度 (m,n) のF分布の上側 α/2 点です。
F分布は左右対称ではないため、上限と下限で異なるパーセント点を使います。公式の中で自由度の順序((n1−1,n2−1) と (n2−1,n1−1))が入れ替わるのは、F分布の下側パーセント点が上側パーセント点の逆数 F1−α/2(m,n)=1/Fα/2(n,m) で求まるためです。
例:2つの生産ラインのばらつき比較
先ほどの2つの生産ラインのデータ(ライン1:s12=100, n1=20、ライン2:s22=121, n2=25)で、母分散の比 σ12/σ22 の95%信頼区間を求めます。
s22s12=121100≈0.826
F分布のパーセント点:F0.025(19,24)≈2.35、F0.025(24,19)≈2.45
[2.350.826,0.826×2.45]=[0.35,2.02]
95%信頼区間は [0.35, 2.02] です。区間が1を含んでいるため、分散が異なるとは言い切れません(F検定の結果と一致します)。
母比率の差の区間推定
2つの母集団の比率の差 p1−p2 の信頼区間を求めます。
(p^1−p^2)±zα/2n1p^1(1−p^1)+n2p^2(1−p^2)
検定では帰無仮説のもとで p1=p2 と仮定するためプールド比率 p^ を使いましたが、区間推定ではそのような仮定を置かないため、各群の標本比率 p^1, p^2 をそれぞれ使います。これは検定と区間推定の重要な違いです。
例:2つの工場の不良品率
「2標本検定(母分散の比・母比率の差)」と同じデータを使います。
| A工場 | B工場 |
|---|
| 検査数 n | 300 | 250 |
| 不良品数 x | 18 | 25 |
| 標本比率 p^ | 0.060 | 0.100 |
(0.060−0.100)±1.96×3000.060×0.940+2500.100×0.900
=−0.040±1.96×0.000188+0.000360=−0.040±1.96×0.02341=−0.040±0.046
95%信頼区間は [-0.086, 0.006] です。区間が0を含んでいるため、2つの工場の不良品率に差があるとは言い切れません。
ただし区間の上限が0.006と0に近く、A工場の方が低い可能性が示唆されています。標本サイズを増やせば結論がはっきりする可能性があります。
区間推定の使い分け
| 推定対象 | 信頼区間の式 | 使う分布 | 条件 |
|---|
| 母平均の差(σ 既知) | (xˉ1−xˉ2)±zα/2σ12/n1+σ22/n2 | 標準正規分布 | σ1, σ2 が既知 |
| 母平均の差(等分散) | (xˉ1−xˉ2)±tα/2(n1+n2−2)⋅sp1/n1+1/n2 | t分布 | 正規母集団、等分散 |
| 母平均の差(不等分散) | (xˉ1−xˉ2)±tα/2(ν)⋅s12/n1+s22/n2 | t分布 | 正規母集団、Welch近似 |
| 母分散の比 | [s22s12⋅Fα/2(n1−1,n2−1)1,s22s12⋅Fα/2(n2−1,n1−1)] | F分布 | 正規母集団 |
| 母比率の差 | (p^1−p^2)±zα/2n1p^1(1−p^1)+n2p^2(1−p^2) | 標準正規分布 | 各群で np^≥5 かつ n(1−p^)≥5 |
よくある誤解
- 誤解1:信頼区間が0を含まなければ差は「大きい」 — 0を含まないことは差の存在を示唆しますが、差の大きさが実務的に意味があるかは別の判断です。区間の幅と差の絶対値を合わせて解釈してください。
- 誤解2:母分散の比の信頼区間も左右対称 — F分布は左右対称ではないため、信頼区間も非対称です。母分散の比が1に近くても、区間の上側と下側の幅は異なります。
まとめ
2標本の区間推定は、1標本の場合と同じ論理で構成されますが、比較対象にも不確実性があることが新たな考慮点です。母平均の差では差の標準誤差に2つの分散が含まれ、母比率の差では各群の標本比率から標準誤差を計算します。
信頼区間と検定の結論は一致します。差の信頼区間が0を含まなければ検定で有意、母分散の比の信頼区間が1を含まなければF検定で有意です。信頼区間は有意かどうかだけでなく、差や比がどの範囲にありそうかという情報も与えてくれます。