定義
ヒストグラムのビン幅(階級幅)を決めるための指標の1つ。四分位範囲(IQR)を用いて適切な幅を算出する。
公式
\[h = 2 \times \frac{\text{IQR}}{\sqrt[3]{n}}
\]
(\( n \) はサンプル数)
特徴
スタージェスの公式(\( \approx 1 + \log_2(n) \))よりも外れ値に頑健とされる。
データ分布が正規的でない場合にも比較的柔軟に対応。
使いどころ
ヒストグラムの作成時に、「どうビン幅を設定すれば分布の特徴を適切に反映できるか」悩む際。
外れ値が存在しうる実データに対して、階級幅の決定に用いる。
応用例
大量データをヒストグラム化する際に、スタージェスよりも細かい幅または広めの幅を試す一案として採用。
アンケートの回答分布が偏っている場合に、分布を潰さないように階級設定。
留意点
完全に最適なビン幅を保証するわけではなく、あくまで1つのガイドライン。
外れ値が極端に大きい場合、IQR計算自体には影響が小さいが、分布全体をどう表すかは別途考慮が必要。