定義
1つの変数(例えば「年齢」や「テスト得点」など)の度数分布。
特徴
記述統計の最も基本的な視点で、単変量分析と呼ばれる。
ヒストグラム、棒グラフなどが典型的な可視化手段。
使いどころ
データ分析の入り口として、まずは各変数を単独で集計・可視化して特徴を知る。
EDAでも、最初に各変数のヒストグラムや要約統計量を確認するのが一般的。
応用例
「身長」だけを集計し、度数分布表を作ってヒストグラムを描く。
「1か月の売上」だけを対象に度数分布を見て、平均や中央値を調べる。
留意点
多変量(複数の変数同士の関係)の視点が抜け落ちるため、相関などは捉えられない。
まずは一次元で特徴を捉え、必要に応じてクロス集計や散布図(2次元)に拡張。