2標本の区間推定

2つの母集団の平均の差・分散の比・比率の差の信頼区間を計算する方法を学びます。ケースごとの分布の使い分けを整理します。

難易度 Lv 4 / 10想定時間：約25分

できるようになること

母平均の差・母分散の比・母比率の差の信頼区間を計算できる
状況に応じて適切な区間推定の手法を選べる
信頼区間から検定の結論を読み取れる

比較対象が「もう1つの標本」になるとき

「1標本の区間推定」では、1つの母集団の母数（ $\mu$ , $\sigma^2$ , $p$ ）を推定しました。しかし実際のデータ分析では、2つの母集団を比較する場面がよくあります。A工場とB工場のどちらの品質が高いか、新薬と従来薬のどちらが効果的か、といった問いです。

2標本の区間推定では、母数そのものではなく母数の差や比の信頼区間を求めます。差の信頼区間が0を含むか、比の信頼区間が1を含むかが、2つの母集団に違いがあるかの判断材料になります。

補足

この単元では、2つの独立な（互いに無関係な）標本を扱います。同じ対象を測定前後で比較する場合（対応のあるデータ）は別の方法を使います。

母平均の差の区間推定

2つの母集団の平均の差 $\mu_1 - \mu_2$ の信頼区間を求めます。1標本の場合と同様に、母分散が分かっているかどうかで使う方法が変わります。

母分散が既知の場合（z区間）

(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}

分母のルートの中は差の標準誤差です。独立な確率変数の差の分散は、それぞれの分散を足したものになります（「確率変数の和と線形結合」で学んだ性質です）。

例：2つの工場の製品重量（母分散が既知）

「2標本検定（母平均の差）」と同じデータで、母平均の差の95%信頼区間を求めます。

	A工場	B工場
標本サイズ $n$	200	150
標本平均 $\bar{x}$	502 g	498 g
母標準偏差 $\sigma$	15 g	12 g

(502 - 498) \pm 1.96 \times \sqrt{\frac{15^2}{200} + \frac{12^2}{150}} = 4 \pm 1.96 \times 1.444 = 4 \pm 2.83

95%信頼区間は [1.17, 6.83] g です。区間が0を含まないので、2つの工場の平均重量には差があると判断できます。これは検定で帰無仮説が棄却された結果と一致します。

補足

一般に、差の $(1-\alpha)$ 信頼区間が0を含まないことと、有意水準 $\alpha$ の検定で帰無仮説が棄却されることは同値です。同様に、比の信頼区間が1を含まないことと検定での棄却が対応します。以降の例でもこの対応を確認しましょう。

母分散が未知で等しいと仮定する場合（プールドt区間）

母分散が未知で、 $\sigma_1^2 = \sigma_2^2$ と仮定できる場合、2つの標本を統合して共通の分散を推定します。プールド分散 $s_p^2$ は：

s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}

信頼水準 $(1-\alpha)$ の信頼区間は：

(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(n_1 + n_2 - 2) \cdot s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}

例：2つの生産ラインの比較（等分散を仮定）

	ライン1	ライン2
標本サイズ $n$	20	25
標本平均 $\bar{x}$	501 g	497 g
不偏標準偏差 $s$	10 g	11 g

母集団はそれぞれ正規分布に従うと仮定します。

s_p^2 = \frac{19 \times 100 + 24 \times 121}{43} = \frac{4804}{43} \approx 111.7, \quad s_p \approx 10.57

自由度 $20 + 25 - 2 = 43$ のt分布の上側2.5%点は $t_{0.025}(43) = 2.017$ です。

(501 - 497) \pm 2.017 \times 10.57 \times \sqrt{\frac{1}{20} + \frac{1}{25}} = 4 \pm 2.017 \times 3.17 = 4 \pm 6.39

95%信頼区間は [-2.39, 10.39] g です。区間が0を含んでいるため、母平均に差があるとは言い切れません。

母分散が未知で等しいと仮定しない場合（Welchのt区間）

等分散の仮定が不確かな場合は、Welch近似を使います。

(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(\nu) \cdot \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}

自由度 $\nu$ はウェルチ–サタスウェイトの近似で求めます（「2標本検定（母平均の差）」を参照）。

例：異なる工場の比較（等分散を仮定しない）

今度は別の2つの工場（C工場・D工場）を比較します。ばらつきが大きく異なるため、Welchのt区間を使います。

	C工場	D工場
標本サイズ $n$	20	25
標本平均 $\bar{x}$	501 g	497 g
不偏標準偏差 $s$	10 g	18 g

\sqrt{\frac{10^2}{20} + \frac{18^2}{25}} = \sqrt{5 + 12.96} = \sqrt{17.96} \approx 4.24

自由度は $\nu \approx 38.8$ です。分布表を参照するには整数が必要なため、安全側（区間が広くなる側）に切り捨てて $\nu = 38$ とします。 $t_{0.025}(38) = 2.024$ です。

(501 - 497) \pm 2.024 \times 4.24 = 4 \pm 8.58

95%信頼区間は [-4.58, 12.58] g です。D工場の標準偏差が大きい（18g vs 10g）ため区間が広く、差の有無を判定するには不十分なデータ量です。

ポイント

検定の場合と同様に、プールドt区間とWelchのt区間で迷ったらWelchのt区間を選ぶのが安全です。等分散が成り立つ場合でもWelchの結果はほぼ同じですが、成り立たないのにプールドt区間を使うと区間の被覆率が公称値からずれます。

母分散の比の区間推定

プールドt区間では等分散を仮定しました。等分散かどうかの判断材料として、 $\sigma_1^2 / \sigma_2^2$ の信頼区間を使うこともできます。2つの正規母集団の分散の比の信頼区間を求めましょう。

不偏分散の比 $s_1^2 / s_2^2$ にF分布を適用します。信頼水準 $(1-\alpha)$ の信頼区間は：

\left[\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,\; n_2-1)},\quad \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2}(n_2-1,\; n_1-1)\right]

ここで $F_{\alpha/2}(m, n)$ は自由度 $(m, n)$ のF分布の上側 $\alpha/2$ 点です。

補足

F分布は左右対称ではないため、上限と下限で異なるパーセント点を使います。公式の中で自由度の順序（ $(n_1-1, n_2-1)$ と $(n_2-1, n_1-1)$ ）が入れ替わるのは、F分布の下側パーセント点が上側パーセント点の逆数 $F_{1-\alpha/2}(m, n) = 1 / F_{\alpha/2}(n, m)$ で求まるためです。

例：2つの生産ラインのばらつき比較

先ほどの2つの生産ラインのデータ（ライン1： $s_1^2 = 100$ , $n_1 = 20$ 、ライン2： $s_2^2 = 121$ , $n_2 = 25$ ）で、母分散の比 $\sigma_1^2 / \sigma_2^2$ の95%信頼区間を求めます。

\frac{s_1^2}{s_2^2} = \frac{100}{121} \approx 0.826

F分布のパーセント点： $F_{0.025}(19, 24) \approx 2.35$ 、 $F_{0.025}(24, 19) \approx 2.45$

\left[\frac{0.826}{2.35},\quad 0.826 \times 2.45\right] = [0.35,\quad 2.02]

95%信頼区間は [0.35, 2.02] です。区間が1を含んでいるため、分散が異なるとは言い切れません（F検定の結果と一致します）。

母比率の差の区間推定

2つの母集団の比率の差 $p_1 - p_2$ の信頼区間を求めます。

(\hat{p}_1 - \hat{p}_2) \pm z_{\alpha/2} \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}

ポイント

検定では帰無仮説のもとで $p_1 = p_2$ と仮定するためプールド比率 $\hat{p}$ を使いましたが、区間推定ではそのような仮定を置かないため、各群の標本比率 $\hat{p}_1$ , $\hat{p}_2$ をそれぞれ使います。これは検定と区間推定の重要な違いです。

例：2つの工場の不良品率

「2標本検定（母分散の比・母比率の差）」と同じデータを使います。

	A工場	B工場
検査数 $n$	300	250
不良品数 $x$	18	25
標本比率 $\hat{p}$	0.060	0.100

(0.060 - 0.100) \pm 1.96 \times \sqrt{\frac{0.060 \times 0.940}{300} + \frac{0.100 \times 0.900}{250}}

= -0.040 \pm 1.96 \times \sqrt{0.000188 + 0.000360} = -0.040 \pm 1.96 \times 0.02341 = -0.040 \pm 0.046

95%信頼区間は [-0.086, 0.006] です。区間が0を含んでいるため、2つの工場の不良品率に差があるとは言い切れません。

ただし区間の上限が0.006と0に近く、A工場の方が低い可能性が示唆されています。標本サイズを増やせば結論がはっきりする可能性があります。

区間推定の使い分け

推定対象	信頼区間の式	使う分布	条件
母平均の差（ $\sigma$ 既知）	$(\bar{x}_1 - \bar{x}_2) \pm z_{\alpha/2}\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}$	標準正規分布	$\sigma_1$ , $\sigma_2$ が既知
母平均の差（等分散）	$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(n_1+n_2-2) \cdot s_p\sqrt{1/n_1+1/n_2}$	t分布	正規母集団、等分散
母平均の差（不等分散）	$(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2}(\nu) \cdot \sqrt{s_1^2/n_1+s_2^2/n_2}$	t分布	正規母集団、Welch近似
母分散の比	$\left[\frac{s_1^2}{s_2^2} \cdot \frac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\; \frac{s_1^2}{s_2^2} \cdot F_{\alpha/2}(n_2-1,n_1-1)\right]$	F分布	正規母集団
母比率の差	$(\hat{p}_1-\hat{p}_2) \pm z_{\alpha/2}\sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1}+\frac{\hat{p}_2(1-\hat{p}_2)}{n_2}}$	標準正規分布	各群で $n\hat{p} \geq 5$ かつ $n(1-\hat{p}) \geq 5$

よくある誤解

注意

誤解1：信頼区間が0を含まなければ差は「大きい」 — 0を含まないことは差の存在を示唆しますが、差の大きさが実務的に意味があるかは別の判断です。区間の幅と差の絶対値を合わせて解釈してください。
誤解2：母分散の比の信頼区間も左右対称 — F分布は左右対称ではないため、信頼区間も非対称です。母分散の比が1に近くても、区間の上側と下側の幅は異なります。

まとめ

2標本の区間推定は、1標本の場合と同じ論理で構成されますが、比較対象にも不確実性があることが新たな考慮点です。母平均の差では差の標準誤差に2つの分散が含まれ、母比率の差では各群の標本比率から標準誤差を計算します。

信頼区間と検定の結論は一致します。差の信頼区間が0を含まなければ検定で有意、母分散の比の信頼区間が1を含まなければF検定で有意です。信頼区間は有意かどうかだけでなく、差や比がどの範囲にありそうかという情報も与えてくれます。