定義
階級化されたデータ(Grouped Data)から分散を計算するとき、ビン幅のために生じる誤差を補正する手法。
特徴
階級の中心値を使って分散を計算すると、実際より過小評価になる傾向があるため、補正項を加えて推定をより正確にする。
マニアックな概念だが、Grouped Dataでより厳密に分散を推定したい場合に有用。
使いどころ
度数分布表のみが手元にあり、生データが存在しない状況で分散を求める際の補正。
教科書の上級編や研究レベルで登場する。
応用例
大量データを区間集計して平均・分散を計算するときにシェパード補正を加え、真の分散に近い値を見積もる。
補正前後で結果がどの程度変わるかを比較・検証。
留意点
ビン幅が大きいほど誤差が大きくなるため、補正量も大きくなる。
実務レベルでは、生データがあればそちらを使う方が正確であり、あまり頻繁には利用されない。