Trimmed Mean(トリム平均) / Trimmed Mean

定義

データの上位と下位の一定割合(例:5%ずつ)を切り落としてから算術平均を求める方法。

外れ値の影響を抑えた平均。

特徴

外れ値を完全に「除外」するので、極端値に左右されにくい。

トリムする割合によって結果が変化し、捨てるデータが多いほど頑健になるが情報量は減る。

使いどころ

大きな外れ値やノイズがあるデータで、中央値よりはもう少し情報を活かしたい場合。

採点や審査で極端に甘い・厳しい評価を排除するなど。

応用例

10%トリム平均:上位5%、下位5%をカットし、残り90%のデータで平均を計算。フィギュアスケートの採点などで近い考え方が使われることも。

給料データで、上位の超高所得者と下位の極低所得者を除いて「標準的な層の平均」を算出。

留意点

トリムの割合が恣意的になる場合、操作的に平均を改変できてしまうリスク。

トリムをどの程度行うか、明確な根拠やルールを示す必要がある。

  • URLをコピーしました!
  • URLをコピーしました!
目次