t分布
母分散が未知のとき、標本平均の分布を扱う
できるようになること
- 母分散が未知のときに正規分布ではなくt分布を使う理由を説明できる
- t分布の自由度による形の変化を理解できる
- 標本平均の検定・推定におけるt分布の役割を説明できる
母分散がわからないとき、何が起きるか
標本平均 を使って母平均 を推定する場面を考えます。
母集団が正規分布 に従い、母分散 がわかっていれば、標本平均を標準化した統計量
は標準正規分布 に従います。これを使えば、区間推定や仮説検定ができます。
しかし現実には 母分散 がわからない ことがほとんどです。そこで の代わりに、標本から計算した不偏標準偏差 を使いたくなります。
ところがこの統計量 は、もはや標準正規分布には従いません。 は と違って固定された定数ではなく、サンプルごとに異なる値をとる確率変数です。そのため を に置き換えたことで、不確実性が増す のです。
特にサンプルサイズが小さいとき、 はたまたま非常に小さな値をとることがあり、そのとき は異常に大きな値になります。正規分布ではこの「たまたま」が考慮されていないため、 の分布は正規分布より裾が厚く(極端な値が出やすく)なります。
この が従う分布が、t分布(t-distribution)です。
t分布の定義
と が独立のとき、
で定義される は自由度 のt分布に従います。
標本平均の場合は (サンプルサイズ − 1)です。これはカイ二乗分布の単元で学んだ、不偏分散に対応する自由度と同じです。
t分布は、ギネスビール醸造所に勤めていた統計家ウィリアム・ゴセットが「Student」というペンネームで1908年に発表したことから、スチューデントのt分布(Student's t-distribution)とも呼ばれます。少数サンプルでの品質管理が動機でした。
t分布が成り立つための前提
| 前提 | 意味 |
|---|---|
| 1. 母集団が正規分布に従う | 標本が正規母集団から抽出されている |
| 2. 標本が独立 | 各データが互いに影響しない |
| 3. 母分散が未知 | がわからず、 で推定する |
母分散がわかっている場合は 統計量(正規分布)を使えばよく、t分布を使う必要はありません。サンプルサイズが大きい場合は、 が に近づくため、t分布も正規分布に近づきます。
分布の形
t分布は正規分布と似た左右対称の釣鐘型ですが、正規分布より裾が厚いのが特徴です。
- 平均は ( のとき)
- :コーシー分布と一致(裾が非常に厚く、期待値が存在しない)
- が小さい:裾が厚く、極端な値が出やすい
- が大きい:正規分布に近づく
- :標準正規分布と一致

裾が厚い理由は、母分散の推定の不確実性を分布に反映しているためです。サンプルサイズが小さいほど のばらつきが大きく、裾がより厚くなります。
確率密度関数
自由度 のt分布の確率密度関数は次の式で表されます。
正規分布の の部分が に置き換わっている点が特徴です。 が大きいとき、この項は指数関数より緩やかに減少するため、裾が厚くなります。
実際の計算では統計ソフトや数表(t分布表)を使うため、この式を直接計算する必要はありません。
期待値と分散
のとき、
- 期待値:()
- 分散:()
分散は1より大きく、正規分布(分散1)よりばらつきが大きいことを示します。自由度 が大きくなると となり、分散も正規分布の値に近づきます。
例: のとき、 です。正規分布の分散1と比べて25%大きく、その分だけ裾が厚くなっています。
正規分布との比較
| 性質 | 標準正規分布 | t分布 | |---|---|---| | 平均 | | () | | 分散 | | () | | 裾の厚さ | 薄い | 厚い( が小さいほど厚い) | | 使用条件 | 母分散が既知() | 母分散が未知( で推定) | | | — | 標準正規分布に一致 |
他の分布との関係
- :コーシー分布 と一致
- :標準正規分布 に収束
- t分布の2乗 は自由度 の F分布 に従う
まとめ
t分布 は、母分散が未知のときに標本平均の標準化統計量が従う分布です。
正規分布より裾が厚い形を持ち、母分散の推定に伴う不確実性を反映しています。自由度が大きくなると正規分布に近づきます。
母平均の区間推定や仮説検定において、母分散が未知の場合にはt分布を使います。