標本抽出法
母集団から標本をどう選ぶかで、推測の精度とコストが変わる
できるようになること
- 単純無作為抽出の考え方と、それだけでは現実の調査に不十分な理由を説明できる
- 系統抽出・層化抽出・クラスター抽出・多段抽出のそれぞれの特徴と使い分けを説明できる
- 実際の公的統計がどのような抽出法を採用しているかを説明できる
標本をどう選ぶか──「無作為」の先へ
「母集団と標本」では、一部のデータから全体を推測するという統計の基本的な発想を学びました。「データソースと公的統計」では、全数調査と標本調査の違いを確認しました。
では、標本調査を行うと決めたとき、具体的にどうやって標本を選べばよいのでしょうか。
最も公正に見える方法は、母集団からまったくのランダムに選ぶことです。しかし実は、労働力調査も家計調査も、「完全にランダム」に選んでいるわけではありません。そこにはコスト・実施可能性・精度という3つのトレードオフがあり、それぞれの調査が最適なバランスを追求した結果として、さまざまな抽出法が生まれました。
この単元では、代表的な標本抽出法を学び、どの方法がどのような場面で有効かを理解します。
単純無作為抽出──すべての基準
単純無作為抽出(simple random sampling)は、母集団から指定したサイズの標本を選ぶとき、考えられるすべての組み合わせがどれも等しい確率で選ばれる抽出法です。
たとえば、1,000人の社員名簿から100人を選ぶ場合、乱数表やコンピュータの乱数を使って100人を選びます。どの「100人の組み合わせ」も同じ確率で選ばれるため、結果として各社員が選ばれる確率も で等しくなります。
この方法には重要な性質があります。標本平均が母平均の不偏推定量になること、標本から計算した統計量の標本分布が理論通りに導けること、そして推測統計の多くの理論がこの抽出法を前提としていることです。
単純無作為抽出は統計理論の出発点であり、他の抽出法を評価する「基準」でもあります。
「推定とは何か」や「信頼区間の意味」で学ぶ信頼区間や仮説検定の公式は、基本的に単純無作為抽出を前提としています。他の抽出法を使った場合、推定量の分散の計算式が変わるため、専用の補正が必要になります。
なぜ単純無作為抽出だけでは足りないのか
単純無作為抽出は理論的に理想的ですが、大規模な調査では3つの壁に直面します。
1. 名簿の問題──母集団の完全なリスト(抽出枠、sampling frame)が必要ですが、「日本の全世帯」のような巨大な母集団の完全なリストを用意するのは容易ではありません。
2. コストの問題──全国から完全にランダムに選ぶと、北海道から沖縄まで対象者が散らばり、訪問調査の移動コストが膨大になります。
3. 精度の問題──母集団に明確なグループ(地域、年齢層など)がある場合、ランダムに選ぶだけでは、たまたま特定のグループが過剰・過少に含まれる可能性があります。この偶然の偏りを積極的に抑える仕組みが欲しくなります。
これらの壁を乗り越えるために、さまざまな抽出法が考案されました。
系統抽出法
系統抽出法(systematic sampling)は、名簿の最初の1人をランダムに選び、そこから一定間隔で選んでいく方法です。
たとえば、1,000人の名簿から100人を選ぶ場合は次のようにします。
- 抽出間隔を計算する:
- 1〜10の中からランダムに1つ選ぶ(たとえば3)
- 3番目、13番目、23番目、…、993番目を選ぶ
| 単純無作為抽出 | 系統抽出法 | |
|---|---|---|
| 手順 | 毎回ランダムに選ぶ | 最初の1人だけランダム、あとは等間隔 |
| 利点 | 理論的に最も基本的 | 実施が簡単、名簿をそのまま使える |
| 注意点 | 大規模では実施が煩雑 | 名簿に周期的なパターンがあると偏る |
名簿の並び順にランダム性がある(特定のパターンがない)場合、系統抽出法は単純無作為抽出とほぼ同等の精度を持ちながら、実施が格段に簡単です。逆に、名簿が年齢順や成績順のように何らかの順序で並んでいる場合は、等間隔で抽出することで全範囲からまんべんなくデータが取れるため、層化抽出法に近い精度の向上が見込めることもあります。
データに周期性がある場合は注意が必要です。たとえば、日次売上データから で等間隔に抽出すると、毎回同じ曜日(たとえば日曜日)のデータばかりが選ばれてしまいます。同様に、マンションの部屋番号順に1フロア10部屋ずつ で抽出すると、すべて同じ位置の部屋(たとえば角部屋)ばかりになります。データの並びに周期的なパターンがないかを事前に確認することが重要です。
層化抽出法
層化抽出法(stratified sampling)は、母集団をあらかじめいくつかの層(stratum)に分け、各層から独立に標本を抽出する方法です。
たとえば、全国の消費支出を調べたいとき、地域(北海道・東北・関東・…)ごとに層を作り、各層から標本を抽出します。
層化抽出の最大の利点は、推定精度の向上です。単純無作為抽出では「たまたま若者ばかりが選ばれる」といった偶然の偏りが起こりえますが、層化抽出ではあらかじめ構成比を母集団に合わせるため、そのような極端な偏りを防ぐことができます。さらに、同じ層に属するメンバーは似た特性を持つため、各層内での推定誤差は小さくなります。この結果、単純無作為抽出より少ない標本サイズで同じ精度を達成できます。
各層からどれだけの標本を抽出するか(配分)には、主に2つの方法があります。
| 配分方法 | 説明 | 適する場面 |
|---|---|---|
| 比例配分 | 各層の母集団に占める割合と同じ比率で配分する | 層間の分散が同程度のとき |
| ネイマン配分 | 各層の大きさとばらつき(標準偏差)の両方を考慮し、規模が大きくばらつきも大きい層に多く配分する | 層ごとの分散が異なるとき(精度を最大化したい場合) |
層化の基準として使う変数は、調べたい変数と関連が強いものを選ぶのが効果的です。たとえば所得を調べるなら、年齢層や居住地域で層化すると効果が大きくなります。関連の弱い変数で層化しても、精度はほとんど改善されません。
クラスター抽出法
クラスター抽出法(cluster sampling)は、母集団をいくつかのクラスター(集落、cluster)に分け、ランダムに選んだクラスターの中を全数調査する方法です。
たとえば、全国の小学生の学力を調べるとき、学校をクラスターとして扱い、ランダムに選んだ学校の全生徒を調査します。
一見すると層化抽出法と似ていますが、考え方は正反対です。
| 層化抽出法 | クラスター抽出法 | |
|---|---|---|
| 分け方の理想 | 層内が均質になるように分ける | クラスター内が多様になるのが理想 |
| 抽出対象 | すべての層から一部を抽出 | 一部のクラスターを選び、その中を全数調査 |
| 精度 | 単純無作為抽出より高くなりやすい | 単純無作為抽出より低くなりやすい |
| コスト | 全層にアクセスが必要 | 選ばれたクラスターだけでよく、低コスト |
クラスター抽出法は精度では劣りますが、コストの大幅な削減が最大の利点です。全国に散らばる個人を1人ずつ訪問するより、選ばれた地域や施設をまとめて調査するほうが、はるかに効率的です。
精度が低くなりやすい理由は、現実のクラスター(同じ学校の生徒や同じ地域の住民など)は互いに似た特性を持ちやすいためです。同じクラスター内を全員調査しても似たようなデータが重複しやすく、全国からバラバラに選ぶ場合と比べて実質的な情報量が少なくなります。
多段抽出法
多段抽出法(multistage sampling)は、抽出を複数の段階に分けて行う方法です。実際の大規模調査で最もよく使われる方法でもあります。
たとえば、全国の世帯調査を行う場合は次のように設計できます。
- 第1段:全国の市区町村からランダムにいくつかを選ぶ
- 第2段:選ばれた市区町村の中から、調査区(地域の小さなブロック)をランダムに選ぶ
- 第3段:選ばれた調査区の中から、世帯をランダムに選ぶ
各段階でクラスター抽出や層化抽出を組み合わせることができるため、柔軟な設計が可能です。
日本の労働力調査は、層化2段抽出法を採用しています。まず全国の調査区を地域・都市規模などで層化し、第1段で調査区を選び、第2段で調査区内の世帯を選びます。「完全にランダム」ではないものの、統計理論に基づいた設計によって信頼性の高い推定が可能になっています。
抽出法の全体像
ここまで学んだ抽出法を整理します。
| 抽出法 | ひとことで | 精度 | コスト |
|---|---|---|---|
| 単純無作為抽出 | 完全にランダムに選ぶ | 基準 | 高い |
| 系統抽出法 | 等間隔で選ぶ | ≈ 基準 | 低い |
| 層化抽出法 | グループに分けて各グループから選ぶ | 基準より高い | やや高い |
| クラスター抽出法 | 集団ごとまとめて調べる | 基準より低い | 低い |
| 多段抽出法 | 段階的に絞り込む | 設計による | 中程度 |
どの方法が「最善」というわけではなく、調査の目的・予算・母集団の構造に応じて、適切な方法を選ぶ──あるいは複数を組み合わせるのが実務です。
よくある誤解
- 誤解1:標本は多ければ多いほどよい — 標本サイズを増やせば精度は上がりますが、抽出法に偏りがあれば、いくらサイズを増やしても偏りは解消されません。1936年の米国大統領選挙予測では、雑誌社が200万人以上の回答を集めましたが、電話・自動車の所有者に偏った名簿を使ったため予測を大きく外しました。一方、科学的な抽出を行った別の調査は、わずか数千人の標本で正確に結果を予測しています。
- 誤解2:ランダムに選べば必ず偏りがない — ランダム抽出は「繰り返しの平均として」偏りがないという性質です。1回の抽出では偶然による偏り(標本誤差)が生じえます。だからこそ、信頼区間や仮説検定といった「ばらつきを織り込んだ推測の枠組み」が必要になります。
まとめ
単純無作為抽出は標本抽出の理論的な基本であり、推測統計の多くの公式はこの方法を前提に組み立てられています。しかし、大規模な調査では名簿の入手困難さ、コストの膨大さ、偶然の偏りといった現実的な壁に直面するため、目的に応じた抽出法の選択が必要になります。
系統抽出法は名簿から等間隔で選ぶことで実施を簡便にし、層化抽出法は母集団のグループ構造を活かして推定精度を高めます。クラスター抽出法は調査対象を地理的にまとめることでコストを大幅に削減し、多段抽出法はこれらを組み合わせて大規模調査を現実的に設計します。
実際の公的統計では、層化と多段抽出を組み合わせた設計が標準的に採用されています。どの抽出法にも一長一短があり、精度・コスト・実施可能性のバランスを考えて設計することが、信頼性の高いデータ収集の出発点です。