スタージェスの公式 / Sturges’ Formula

定義

ヒストグラムのビン(階級)の最適数を推定するための経験則。

公式

\[
k = 1 + \log_2(n)
\]

(\( n \) はサンプル数、\( k \) はビン数)

特徴

データ数が増えると対数的にビン数を増やすシンプルな指標。

大きなデータに対してはビン数が少なめになるため、近年はFreedman–Diaconisルールなど他のルールと比較検討されることが多い。

使いどころ

入門的・教科書的にヒストグラムのビン数をとりあえず決める際の目安。

データ量がそれほど多くない場合に簡易的に利用。

応用例

100件のデータで「\( k = 1 + \log_2(100) \approx 1 + 6.64 \approx 8 \)」としてビン数8個でヒストグラムを描く。

大学院の初歩的な統計実験でビン数を決める簡便法として採用。

留意点

すべての分布に対して最適という保証はなく、特に大規模データには向かない場合がある。

外れ値や極端に偏った分布では、別の方法と併用しながらビン幅を調整することが望ましい。

  • URLをコピーしました!
  • URLをコピーしました!
目次