一次元度数分布 / Univariate Frequency Distribution

定義

1つの変数(例えば「年齢」や「テスト得点」など)の度数分布。

特徴

記述統計の最も基本的な視点で、単変量分析と呼ばれる。

ヒストグラム、棒グラフなどが典型的な可視化手段。

使いどころ

データ分析の入り口として、まずは各変数を単独で集計・可視化して特徴を知る。

EDAでも、最初に各変数のヒストグラムや要約統計量を確認するのが一般的。

応用例

「身長」だけを集計し、度数分布表を作ってヒストグラムを描く。

「1か月の売上」だけを対象に度数分布を見て、平均や中央値を調べる。

留意点

多変量(複数の変数同士の関係)の視点が抜け落ちるため、相関などは捉えられない。

まずは一次元で特徴を捉え、必要に応じてクロス集計や散布図(2次元)に拡張。

  • URLをコピーしました!
  • URLをコピーしました!
目次