定義
分布の左右非対称(歪み)の程度を数値化した指標。
一般的な統計ソフトでは「Pearsonのモーメントによる歪度」等が用いられる。
公式(一例:Fisherのサンプル歪度)
\[\text{Skewness} = \frac{n}{(n-1)(n-2)} \sum_{i=1}^n \left( \frac{x_i – \bar{x}}{s} \right)^3
\]
特徴
正(+)の歪度:右裾が長い(右側に外れ値が多い)分布を意味。
負(−)の歪度:左裾が長い分布を意味。
0に近いほど左右対称に近い。
使いどころ
データ分布が正規に近いかどうかの判断材料。
賃金分布や所得分布などで、しばしば右に長い裾(高所得層)を示すため歪度が正になる。
応用例
「歪度が+2.0」と大きく正なら、分布の右側に大きい値が偏って存在することを示唆。
テスト得点分布で歪度がマイナスなら、高得点寄りに多いか、または低得点裾が長い。
留意点
サンプルが少ないと推定誤差が大きくなるので、歪度はあくまでも参考値。
外れ値が1つあるだけでも大きく変化する可能性がある。