定義
データが平均からどの程度離れているかを二乗平均した指標。
公式(母分散の例)
\[
\sigma^2 = \frac{1}{N} \sum_{i=1}^N (x_i – \mu)^2
\]
(標本分散は分母が \( n – 1 \) になる点に注意)
特徴
ばらつきの大きさを数値化できるが、単位が元データの二乗になる。
大きい値ほど、データの散らばりが大きいことを示す。
使いどころ
統計解析の基礎であり、正規分布や回帰分析の枠組みでも重要。
変動係数、標準偏差などの関連指標とあわせて使う。
応用例
テスト点数の標本分散を求め、クラスごとに成績のばらつきを比較する。
生産ラインの製品寸法の安定度合いを評価するとき。
留意点
外れ値に影響を受けやすい(ズレを二乗しているため)。
不偏分散(標本分散)を使うか母分散を使うかで分母が異なるので混同しないように。