良い推定量の条件(不偏性・一致性・有効性)
推定量を評価する3つの基準を、具体的な比較を通じて理解する
できるようになること
- 不偏性・一致性・有効性の定義を述べられる
- 具体的な推定量がこれらの性質を持つかどうかを判断できる
- 3つの性質の違いを理解し、推定量の良し悪しを評価できる
母平均の推定方法は1つではない
ある県の成人男性の平均身長(母平均 )を知りたいとします。30人を無作為に抽出して身長を測定しました。
このデータから母平均 を推定するとき、候補は1つではありません。
- 推定量A:標本平均 (全データの平均)
- 推定量B:標本中央値(データを小さい順に並べた中央の値)
- 推定量C:最初の1人の値 (抽出した最初の人の身長をそのまま使う)
推定量Cは極端ですが、「抽出した1人の値」も母平均の推定量として形式的には使えます。しかし、実用的かどうかは別の話です。
「推定とは何か」で、良い推定量には不偏性・一致性・有効性があると紹介しました。この単元では、3つの推定量を実際に評価しながら、それぞれの性質を掘り下げます。
不偏性:平均的に正しいか
不偏性(unbiasedness)は、推定量の期待値が母数と一致する性質です。
推定したい母数を 、推定量を と書くと、
が成り立つとき、 は不偏推定量(unbiased estimator)です。「何度も標本を取って推定値を計算したら、その平均は母数に等しくなる」という意味です。
3つの推定量の不偏性
以下では、各データ が互いに独立に同じ分布から抽出されている(独立同一分布)ことを前提とします。
推定量A(標本平均):
期待値が と一致するので、不偏推定量です。
推定量B(標本中央値):
母集団の分布が を中心に対称(正規分布など)なとき、標本中央値の期待値は に等しくなります。対称分布のもとでは不偏推定量です(対称分布の場合)。
身長の分布はほぼ左右対称なので、この例では標本中央値は不偏推定量として扱えます。年収のように右に偏った分布では中央値の期待値は母平均と一致しないため注意が必要です。
推定量C():
は母集団からの無作為な抽出値なので、その期待値は母平均そのものです。
3つとも不偏推定量です(Bは対称分布のもとで)。つまり、不偏性だけでは推定量の優劣を決められません。
不偏でない推定量の代表例は、 で割る標本分散 です。 となり、母分散を系統的に小さく見積もります。この補正のために で割る不偏分散を使うことを「推定とは何か」で学びました。
一致性:データが増えれば正確になるか
一致性(consistency)は、標本サイズ を大きくすると、推定値が母数に近づいていく性質です。データを増やすほど、母数から大きくずれた推定値が出る確率が限りなく小さくなります。
数式で書くと、どんなに小さい正の数 に対しても
が成り立つとき、 は一致推定量(consistent estimator)です。
3つの推定量の一致性
推定量A(標本平均):
すでに見たように の期待値は であり(不偏推定量)、分散は です。 が大きくなると分散は0に近づくので、 は のまわりに集中していきます。これは大数の法則そのものです。一致推定量です。
推定量B(標本中央値):
標本中央値の分散も が大きくなると0に近づきます。一致推定量です。
推定量C():
の分散は であり、 がいくら大きくなっても変わりません。データが100件あっても1000件あっても、最初の1人しか使わないので精度は改善しません。一致推定量ではありません。
推定量Cは不偏ですが一致ではありません。不偏性と一致性は独立した概念です。「平均的に正しい」ことと「データを増やせば正確になる」ことは別の性質です。
ここまでで推定量Cが脱落しました。残りはAとBです。どちらも一致推定量ですが、母数に近づく速さが異なります。この速さを比較するのが、次の基準です。
有効性:どちらがより安定しているか
有効性(efficiency、効率性ともいう)は、同じ母数の不偏推定量どうしを比べたとき、分散が小さい方を「より有効」と評価する基準です。
分散が小さいほど、推定値が母数のまわりに密集し、安定した推定ができます。
推定量AとBの有効性を比較する
母集団が正規分布 に従うとき、それぞれの分散は次のようになります。
推定量A(標本平均)の分散:
推定量B(標本中央値)の分散( が十分大きいときの近似):
推定量Bの分散は推定量Aの約1.57倍です。つまり標本平均の方がばらつきが小さく、安定した推定ができます。
この比較を数値化したものが相対効率(relative efficiency)です。
これは「標本中央値は標本平均の約64%の有効性しかない」という意味です。同じ精度を達成するには、標本中央値は約1.57倍のサンプルサイズが必要になります。
ただし外れ値が多いデータでは、標本中央値の方が安定することがあります。有効性の評価は「どの分布を仮定するか」に依存します。正規分布では標本平均が最も有効ですが、それは外れ値がないという前提のもとでの結論です。
3つの性質で推定量を評価する
ここまでの結果を整理します(母集団が正規分布の場合)。
| 推定量 | 不偏性 | 一致性 | 有効性 |
|---|---|---|---|
| A:標本平均 | ✅ 不偏 | ✅ 一致 | ✅ 最も有効 |
| B:標本中央値 | ✅ 不偏(対称分布) | ✅ 一致 | △ 約64%の有効性 |
| C:(最初の1つ) | ✅ 不偏 | ❌ 非一致 | —(非一致のため除外) |
3つの性質はそれぞれ異なる側面から推定量を評価しています。
- 不偏性は「系統的なずれがないか」
- 一致性は「データを増やせば改善するか」
- 有効性は「不偏推定量の中でどれが安定しているか」
不偏性だけでは推定量を選べません。一致性で候補を絞り、有効性で最終的に比較するという流れが自然です。
よくある誤解
- 誤解1:不偏なら良い推定量 — 不偏性は「平均的にずれがない」というだけで、個々の推定が正確とは限りません。推定量C()は不偏ですが、実用的ではありません。一致性や有効性も合わせて評価する必要があります。
- 誤解2:不偏でない推定量は使えない — 不偏性は望ましい性質ですが、絶対的な条件ではありません。不偏でなくても分散が小さい推定量は実用上有用なことがあります。
- 誤解3:標本平均がいつでも最良 — 正規分布では標本平均が最も有効ですが、外れ値が多い分布や裾が重い分布では、中央値やトリム平均の方が安定することがあります。
まとめ
推定量の良し悪しは、不偏性、一致性、有効性という3つの基準で評価します。不偏性は推定量の期待値が母数と一致すること、一致性は標本サイズが大きくなるにつれて推定値が母数に近づくこと、有効性は不偏推定量の中で分散が小さいことを意味します。
正規分布のもとでは、母平均の推定量として標本平均が最も有効です。標本中央値も不偏かつ一致ですが、有効性は標本平均の約64%にとどまります。ただし外れ値に強いという別の利点があり、推定量の選択はデータの性質や分析の目的に応じて判断します。
3つの性質を的当てで考えると整理しやすくなります。不偏性は「的の中心を狙えているか」(系統的にずれていないか)、有効性は「矢が的の中心付近に集まるか」(ばらつきが小さいか)、一致性は「使えるデータ(矢の本数)を増やすほど的の中心に確実に当たるようになるか」に対応します。