定義
・度数分布(連続量)を棒グラフ形状で可視化したもの。
・横軸に階級、縦軸に度数(あるいは相対度数)を表す。
公式・描画手順
1.データを階級に分ける(階級幅を設定)。
2.各階級に入るデータの度数を数える。
3.横軸に階級区間、縦軸に度数を取り、各階級区間の幅に応じた長方形を描く。
特徴
・連続変数の分布を視覚的に把握しやすい。
・山の数や形、外れ値の存在、分布の左右対称性などが直感的に分かる。
使いどころ
・テスト点数や身長、売上など数値が連続的に変化するデータ。
・データの偏りや、多峰性(山が複数ある)、正規分布に近いかどうかを把握したいとき。
応用例
・工場の品質管理で、製品の寸法誤差がどの程度の分布を示しているかをチェック。
・公共交通機関の遅延時間の分布を把握し、90%以上が何分以下で収まるかを確認。
留意点
・階級幅・階級数の選び方によって見え方が変わる(スタージェスの公式、Freedman–Diaconisのルールなど参考)。
・カテゴリデータ(離散型)にはヒストグラムではなく棒グラフを使うのが一般的。