Freedman–Diaconisのルール / Freedman–Diaconis Rule

定義

ヒストグラムのビン幅(階級幅)を決めるための指標の1つ。四分位範囲(IQR)を用いて適切な幅を算出する。

公式

\[
h = 2 \times \frac{\text{IQR}}{\sqrt[3]{n}}
\]

(\( n \) はサンプル数)

特徴

スタージェスの公式(\( \approx 1 + \log_2(n) \))よりも外れ値に頑健とされる。

データ分布が正規的でない場合にも比較的柔軟に対応。

使いどころ

ヒストグラムの作成時に、「どうビン幅を設定すれば分布の特徴を適切に反映できるか」悩む際。

外れ値が存在しうる実データに対して、階級幅の決定に用いる。

応用例

大量データをヒストグラム化する際に、スタージェスよりも細かい幅または広めの幅を試す一案として採用。

アンケートの回答分布が偏っている場合に、分布を潰さないように階級設定。

留意点

完全に最適なビン幅を保証するわけではなく、あくまで1つのガイドライン。

外れ値が極端に大きい場合、IQR計算自体には影響が小さいが、分布全体をどう表すかは別途考慮が必要。

  • URLをコピーしました!
  • URLをコピーしました!
目次