定義
ヒストグラムのビン(階級)の最適数を推定するための経験則。
公式
\[k = 1 + \log_2(n)
\]
(\( n \) はサンプル数、\( k \) はビン数)
特徴
データ数が増えると対数的にビン数を増やすシンプルな指標。
大きなデータに対してはビン数が少なめになるため、近年はFreedman–Diaconisルールなど他のルールと比較検討されることが多い。
使いどころ
入門的・教科書的にヒストグラムのビン数をとりあえず決める際の目安。
データ量がそれほど多くない場合に簡易的に利用。
応用例
100件のデータで「\( k = 1 + \log_2(100) \approx 1 + 6.64 \approx 8 \)」としてビン数8個でヒストグラムを描く。
大学院の初歩的な統計実験でビン数を決める簡便法として採用。
留意点
すべての分布に対して最適という保証はなく、特に大規模データには向かない場合がある。
外れ値や極端に偏った分布では、別の方法と併用しながらビン幅を調整することが望ましい。