フィッシャーの3原則と実験計画
「差を見たいもの以外の条件を揃える」ための基本ルール
できるようになること
- 実験において「条件を揃える」ことの難しさと重要性を説明できる
- フィッシャーの3原則(反復・無作為化・局所管理)のそれぞれの目的を理解している
- 完全無作為化法と乱塊法の違いを説明できる
はじめに:公正な比較とは何か
ある農家が、新しい肥料Aと従来の肥料Bのどちらが収量を上げるかを調べたいと考えました。畑の半分(東側)に肥料Aを、もう半分(西側)に肥料Bを撒いて育て、収穫量を比較しました。結果、肥料Aを使った東側の収穫量が20%多かったとします。
農家は「肥料Aのほうが優れている」と結論づけました。しかし、ここで問題があります。実は東側の畑は日当たりが良く、西側は午後になると建物の日陰になっていたのです。
この結果は本当に「肥料Aのおかげ」でしょうか。もしかすると「日当たりの良さのおかげ」かもしれません。このように、調べたい要因(肥料)以外の条件(日当たり)が異なっていると、どちらの効果なのかが区別できなくなります。これを「交絡が起きている」と言います(詳しくは「観察研究と実験研究」の単元を参照してください)。
実験の目的は「差を見たいもの以外の条件をすべて揃えること」に尽きます。しかし、現実には温度、湿度、土の質、個体差など無数の条件があり、すべてを完全に等しくすることは不可能です。
では、どうすれば「公正な比較」ができるのでしょうか。実験計画法の基礎を築いた統計学者ロナルド・A・フィッシャーは、農業の圃場(ほじょう)実験の経験から、この問題に対する強力な答えを導き出しました。それが「フィッシャーの3原則」です。
原則1:反復(Replication)
1つ目の原則は反復(はんぷく)です。これは「同じ処理を複数の対象に対して行う」ことを意味します。
もし肥料Aを1つの苗にだけ与え、肥料Bを別の1つの苗にだけ与えて比較したとします。結果に差が出たとしても、それが「肥料の違い」によるものか、「たまたまその苗が元気だったから(個体差)」なのか分かりません。
同じ処理を何度も反復することで、偶然によるばらつき(統計では誤差と呼びます)の大きさを評価できるようになります。ここでの誤差は測定ミスではなく、個体差などの自然なばらつきを指します。
10本、20本と対象を増やすほど誤差の評価が安定します。たとえば100本の苗でAを試し、別の100本でBを試すことで、「個体差のばらつき」を超えて「肥料の違いによる確かな差」があるかどうかを統計的に判定できるようになります。
注意:反復(Replication)と繰り返し(Repeated measure)の違い ある1つの苗の収穫量を何度も測り直すことは「反復」ではありません(これは「繰り返し」と呼ばれます)。独立した別々の苗を複数用意することが重要です。
反復の目的は「誤差の大きさを測り、結果の信頼性を高めること」です。
原則2:無作為化(Randomization)
2つ目の原則は無作為化(むさくいか)、あるいはランダム化です。これは「処理を割り当てる対象をランダムに決める」ことを意味します。
冒頭の農家の例では、東側にA、西側にBと、まとめて配置してしまったため「日当たりの違い」という系統的な偏り(バイアス)が生じてしまいました。もし、畑を小さな区画に分け、それぞれの区画にAを撒くかBを撒くかをコイントスのようにランダムに決めたらどうなるでしょうか。
日当たりの良い区画にも、日陰の区画にも、AとBがランダムに混ざって配置されます。十分な数の区画(反復)があれば、大数の法則により、AとBが受ける日当たりの合計は「平均的に等しく」なります。無作為化は単独ではなく、反復とセットになって初めて強力に機能します。
無作為化の最もすごいところは、私たちが気付いていない要因(たとえば「実は土壌の水分量がグラデーションになっている」など)についても、平均的に均等に振り分けてくれる点です。これにより、未知の交絡の影響を排除できます。
無作為化は「偏りを防ぐ」ためのものであり、ばらつきそのものを減らすわけではありません。ばらつきの中で「AとBの条件を公平にする」のが無作為化の役割です。
原則3:局所管理(Local control)
無作為化だけでもある程度公正な比較はできますが、まだ問題があります。日向と日陰の区画にA・Bをランダムに割り当てたとしても、それぞれの環境の違いによる「ばらつき」が大きくなりすぎると、肝心の肥料の効果がそのばらつきに埋もれて見えにくくなってしまいます。
これを解決するのが3つ目の原則、局所管理(きょくしょかんり)です。これは「あらかじめ似たもの同士のグループ(ブロック)を作り、ブロック内で処理を割り当てる」ことを意味します。
たとえば、畑を「日当たりの良いエリア(ブロック1)」と「日陰のエリア(ブロック2)」に分けます。そして、ブロック1の中でAとBをランダムに比較し、ブロック2の中でもAとBをランダムに比較します。
ブロック内(同じ日当たり条件)でAとBの差を比較し、その結果を集計する仕組みです。結果として、日向か日陰かという「環境のベースラインの違い(ブロック間のばらつき)」が比較結果に影響しなくなり、純粋な肥料の効果が誤差に埋もれなくなります。「日当たりの違いによる大きなばらつき」をあらかじめ分離して取り除くことができるため、より正確(高精度)な比較が可能になります。
局所管理の考え方は、「標本抽出法」の単元で学んだ層化抽出法によく似ています。層化抽出法が「あらかじめ似たグループ(層)を作ってから抽出する」ことで推測の精度を上げたように、局所管理も「あらかじめ似たブロックを作ってから比較する」ことで実験の精度を上げます。ただし、層化は**母集団の正確な推測(サンプリング)が目的ですが、局所管理は処理間の正確な比較(実験)**が目的です。局所管理の目的は「実験の精度を高めること(誤差を小さくすること)」です。
実験デザインの基本形
これまで見てきた原則の組み合わせによって、実験デザインの形が変わります。
1. 完全無作為化法(CRD)
反復と無作為化の2つだけを用いた最もシンプルなデザインです。たとえば、温度や湿度が均等に管理されたビニールハウス内で、20個の鉢植えに対して肥料AとBを完全にコイントスでランダムに割り当てる場合などが該当します。環境条件が全体的に均一である(局所管理の必要がない)とみなせる場合に適しています。
2. 乱塊法(RCBD:Randomized Complete Block Design)
反復・無作為化に加えて、局所管理(ブロック化)を用いたデザインです。先ほどの「日向ブロックと日陰ブロックを分けて比較する」方法がこれにあたります。現実の実験(農業、医療、工場など)では環境が完全に均一であることは少ないため、この乱塊法が非常に頻繁に使われます。 ※ここでいう「完全(Complete)」とは、1つのブロックの中に比較したいすべての処理(ここでは肥料AとBの両方)が必ず割り当てられていることを意味します。
よくある誤解
- 誤解1:反復回数が多ければ無作為化は不要 — 反復は誤差の大きさを評価するための原則であり、無作為化は偏りを排除するための原則です。役割が異なるため、どちらか一方では不十分です。反復を増やしても、処理の割り当てに偏りがあれば結論は歪んだままです。
- 誤解2:ブロック化すれば無作為化は不要 — ブロック化は既知の変動要因を管理しますが、ブロック内にもまだ未知の偏りが存在する可能性があります。ブロック内でもランダムに処理を割り当てることで、初めてブロック内の公正な比較が実現します。
まとめ
フィッシャーの3原則は、実験によって「条件を揃える」ための強力な技術です。反復は同じ処理を複数の対象に行うことで偶然のばらつきを評価し、無作為化は処理の割り当てをランダムにすることで未知の要因を含めた偏り(バイアス)を排除します。そして局所管理は、あらかじめ分かっている影響の大きい要因をブロック化して取り除くことで、実験の精度を高めます。
これら3つの原則はそれぞれ独立した役割を持ちますが、組み合わせることで初めて最大の効果を発揮します。正しく設計された実験からデータを集めることで、全体のばらつきを「処理の違い」「ブロックの違い」「純粋な誤差」に数学的に切り分けることができます。そのための手法が、次単元で学ぶ**分散分析(ANOVA)**です。