観察研究と実験研究

「関連がある」と「原因である」の違いを、研究デザインから理解する

難易度 Lv 2 / 10想定時間:約15

できるようになること


「関連がある」と「原因である」は違う

「コーヒーをよく飲む人は心臓病になりにくい」というデータがあったとします。

これは「コーヒーが心臓病を防ぐ」ことを意味するでしょうか。もしかすると、コーヒーをよく飲む人は健康意識が高く、運動習慣があるだけかもしれません。

関連(association)があることと、因果関係(causation)があることは別の問題です。この区別を正しく行うためには、データがどのような研究デザインで得られたかを理解する必要があります。

補足

「データソースと公的統計」の単元では、既存データの入手先と信頼性の確認方法を学びました。では、知りたい問いに答えるデータを自ら集めるとき、どのように研究を設計すればよいでしょうか。この単元では、その「設計」に焦点を当てます。


観察研究

観察研究(observational study)とは、研究者が対象者に介入せず、自然な状態のデータを収集・分析する研究です。

例えば「喫煙者と非喫煙者の肺がん発症率を比較する」場合、研究者は対象者に喫煙を指示するわけではなく、すでに喫煙している人・していない人のデータを観察します。

観察研究にはいくつかの種類があります。

種類特徴
前向き研究(代表例:コホート研究)現在の時点で対象者を選び、将来の結果を追跡する喫煙者・非喫煙者を10年間追跡し、肺がん発症率を比較
後ろ向き研究(代表例:ケースコントロール研究)結果が出た後に過去を振り返って要因を調べる肺がん患者と非患者の過去の喫煙歴を比較
横断研究ある一時点のデータで関連を調べる現在の喫煙状況と健康状態の関連を調査

いずれの方法でも、研究者は対象者に何も操作を加えないという点で共通しています。


交絡変数:なぜ観察研究で因果が言いにくいのか

観察研究で因果を主張しにくい最大の理由は、交絡変数(confounding variable)の存在です。

交絡変数とは、原因と結果の両方に影響を与える第三の変数のことです。

たとえば「アイスクリームの売上が増えると溺死者が増える」というデータがあっても、これはアイスクリームが溺死の原因であることを意味しません。両方に影響しているのは気温(暑い日はアイスクリームが売れ、水遊びも増える)という交絡変数です。

冒頭のコーヒーの例も同様です。「コーヒーをよく飲む人は心臓病になりにくい」という関連があっても、健康意識や運動習慣が交絡変数として影響している可能性があります。

注意

交絡は観察研究で特に問題になります。グループ間の違いが調べたい要因の効果なのか、もともとのグループの特性の違いなのかを区別できないためです。

交絡の問題を解決する最も強力な方法が、次に説明する実験研究です。


実験研究

実験研究(experimental study)とは、研究者が対象者を意図的にグループに分け、異なる処理(treatment)を与えてその効果を比較する研究です。

たとえば「ある新薬が血圧を下げるか」を調べるために、参加者を2つのグループに分け、一方に新薬を投与するグループ(処理群)、もう一方に偽薬(プラセボ)を投与するグループ(対照群)を設定して結果を比較します。

補足

わざわざ偽薬を投与するのは、「薬を飲んだ」という安心感による心理的効果(プラセボ効果)を両グループで条件として揃えるためです。何も飲ませないグループと比較した場合、心理的効果と薬の効果を区別できなくなります。

最も信頼性の高い実験デザインがランダム化比較試験(RCT:Randomized Controlled Trial)です。

観察研究実験研究
研究者の介入なし(自然な状態を観察)あり(処理を割り当てる)
因果の主張難しい(交絡の影響を排除しにくい)しやすい(ランダム化で交絡を抑制)
倫理的制約比較的少ない大きい場合がある
喫煙と肺がんの関連を調査新薬の効果をRCTで検証

ランダム化の役割

実験研究では、対象者を処理群と対照群にランダム(無作為)に割り当てることで、交絡変数の影響を抑制します。

なぜランダム化が有効なのでしょうか。

十分な人数の対象者をランダムに割り当てると、年齢、性別、健康状態、生活習慣など、研究者が測定していない要因も含めて、両グループの特性が平均的に等しくなることが期待できます。

つまり、結果に違いが出た場合、それは処理の効果であると因果的に主張する根拠が強くなります。

補足

コインを100回投げると表と裏がほぼ半々になるように、多くの人をランダムに2グループに分けると、「たまたま健康な人が片方に偏る」確率は低くなります。ランダム化は「既知の交絡」だけでなく「未知の交絡」も含めて均等にする点が重要です。観察研究では、統計的手法(回帰分析など)で既知の交絡を調整できますが、未知の交絡は対処が難しいという限界があります。


実験ができない場面

実験研究が因果関係の証明に強力であるにもかかわらず、すべての研究で実験が行えるわけではありません。

倫理的制約が最大の理由です。たとえば「喫煙が肺がんを引き起こすか」を実験で調べるには、ランダムに選んだ人に喫煙を強制する必要がありますが、健康被害が予想される行為を強制することは倫理的に許されません。

このような場合は、観察研究のデータを慎重に分析し、複数の研究結果を総合的に判断して因果関係を推測します。実際に、喫煙と肺がんの因果関係は、数十年にわたる膨大な観察研究の積み重ねによって確立されました。観察研究だからといって因果に関する知見が得られないわけではなく、研究の蓄積によって強い根拠を築くことができます。


よくある誤解

注意
  • 誤解1:関連があれば因果がある — 2つの変数に関連があっても、それだけでは因果関係を主張できません。交絡変数が影響している可能性があります。因果の主張には、研究デザイン(特に実験研究)の根拠が必要です。
  • 誤解2:RCTが常に最善の方法である — RCTは因果関係の証明に最も強力ですが、倫理的制約、現実的な実施困難、コストなどにより常に実施できるわけではありません。研究の目的と状況に応じて、適切な研究デザインを選ぶことが大切です。

まとめ

観察研究は対象者に介入せずデータを収集する方法で、実験研究は研究者が処理を割り当ててその効果を検証する方法です。

観察研究では交絡変数の影響を排除しにくいため、因果関係の主張は慎重に行う必要があります。実験研究ではランダム化によって交絡の影響を抑制し、因果の主張を支える根拠が得られます。

ただし、倫理的・実務的な制約から実験が不可能な場面も多く、研究の目的と状況に応じた研究デザインの選択が求められます。