ヒストグラムの読み方

数値だけでは見えないデータの「温度感」と「形」を可視化する

難易度 Lv 2 / 10想定時間:約15

できるようになること


数値だけでは見えないもの

30人のテスト結果があります。平均70点、標準偏差15点。

この情報だけで、データの様子がイメージできるでしょうか。

実際には、60-80点に集中しているかもしれないし、55点と85点に二極化しているかもしれません。

数値だけでは見えない「分布の形」を見せてくれるのがヒストグラムです。


ヒストグラムとは何か

ヒストグラム(histogram)は、データを区間(階級)に分けて、各区間に入るデータの個数(度数)を表したグラフです。

:30人のテスト結果

点数の範囲(階級)人数(度数)
40点以上 50点未満2人
50点以上 60点未満5人
60点以上 70点未満10人
70点以上 80点未満8人
80点以上 90点未満3人
90点以上 100点未満2人

この表のデータを、横軸に階級、縦軸に度数をとり、隣り合う長方形に隙間を空けずに描画したグラフがヒストグラムです。

ヒストグラムの基本構造


ヒストグラムの特徴

長方形が隙間なく並ぶ: ヒストグラムは、値の範囲を区間に区切って分布の形を表します。区間は連続して並ぶので、長方形は基本的に隙間なく描かれます(カテゴリを並べる棒グラフとは発想が異なります)。

面積が度数を表す: 多くのヒストグラムは、階級幅が同じときは「高さ=度数(人数)」で描けます。 一方、階級幅が異なるときは、高さを度数密度(度数 ÷ 階級幅)として描くのが基本で、このとき長方形の面積が度数に対応します。


ヒストグラムから読み取れること

ヒストグラムを見ると、数値だけでは分からない「分布の形」が見えてきます。

1. 中心の位置

どの辺りにデータが集中しているか、最頻値(度数が最大の階級)の位置を見ます。

2. ばらつきの大きさ

ばらつきは、**どのくらい広い範囲にデータが分布しているか(横方向の広がり)**で見ます。

3. 歪み

グラフが左右対称か、どちらかに偏っているかを見ます。

一般に、歪みが強いほど平均と中央値はずれやすくなります(ただし標本が小さい場合や外れ値がある場合は、見え方が揺れることがあります)。

4. 山の数

山(度数が極大となる場所)がいくつあるかを見ます。

5. その他の特徴


ヒストグラムと代表値の関係


階級幅の選び方

ヒストグラムの見え方は、階級幅(区間の幅)によって大きく変わります。

目安

実際には、いくつか試して「分布の特徴が見えやすい」階級幅を選びます。


よくある誤解

誤解1:ヒストグラムの高さ = 確率

高さは基本的に度数(人数)や相対度数です。

誤解2:階級の境界値の扱い

60-70点という階級があるとき、「ちょうど70点」はどちらに入るでしょうか。 一般的には「以上、未満」で区切ります。

ポイント

境界のルール(以上/未満、以上/以下)をどこかで明示することが重要です。グラフを見るときは凡例や注釈を必ず確認しましょう。


まとめ

ヒストグラムは、データを階級に分けて度数を長方形で表したグラフです。数値だけでは分からない中心の位置、ばらつきの大きさ、歪み、山の数、外れ値やギャップなど、「分布の形」を視覚的に読み取ることができます。

階級幅の選び方で見え方が変わるという特性を理解し、代表値と組み合わせてデータの全体像を把握することが重要です。