ヒストグラム / Histogram

定義

・度数分布(連続量)を棒グラフ形状で可視化したもの。

・横軸に階級、縦軸に度数(あるいは相対度数)を表す。

公式・描画手順

1.データを階級に分ける(階級幅を設定)。

2.各階級に入るデータの度数を数える。

3.横軸に階級区間、縦軸に度数を取り、各階級区間の幅に応じた長方形を描く。

特徴

・連続変数の分布を視覚的に把握しやすい。

・山の数や形、外れ値の存在、分布の左右対称性などが直感的に分かる。

使いどころ

・テスト点数や身長、売上など数値が連続的に変化するデータ。

・データの偏りや、多峰性(山が複数ある)、正規分布に近いかどうかを把握したいとき。

応用例

・工場の品質管理で、製品の寸法誤差がどの程度の分布を示しているかをチェック。

・公共交通機関の遅延時間の分布を把握し、90%以上が何分以下で収まるかを確認。

留意点

・階級幅・階級数の選び方によって見え方が変わる(スタージェスの公式、Freedman–Diaconisのルールなど参考)。

・カテゴリデータ(離散型)にはヒストグラムではなく棒グラフを使うのが一般的。

  • URLをコピーしました!
  • URLをコピーしました!
目次