外れ値 / Outlier

定義

データ全体の中で、他の多くの値から極端にかけ離れた観測値。分布の一般的傾向を外れている。

特徴

データの平均や分散などの統計量に大きく影響する。

計測ミスや異常値、あるいは本当に極端な現象を示す場合がある。

使いどころ(扱い)

計測エラーが疑われる場合は除外や修正を検討。

本質的に貴重な情報(異常検知など)の場合、むしろフォーカスして分析する。

応用例

生産工程で突然大きな誤差を出す製品を発見し、機械異常を特定する。

トレンド分析で、時系列に突然のスパイクがある場合に注目する。

留意点

「外れ値=悪」というわけではなく、状況や文脈に応じて扱い方を決めることが重要。

外れ値の判断基準(±3SDルール、箱ひげ図の1.5×IQRルールなど)は一意ではない。

  • URLをコピーしました!
  • URLをコピーしました!
目次