定義
データの上位と下位の一定割合(例:5%ずつ)を切り落としてから算術平均を求める方法。
外れ値の影響を抑えた平均。
特徴
外れ値を完全に「除外」するので、極端値に左右されにくい。
トリムする割合によって結果が変化し、捨てるデータが多いほど頑健になるが情報量は減る。
使いどころ
大きな外れ値やノイズがあるデータで、中央値よりはもう少し情報を活かしたい場合。
採点や審査で極端に甘い・厳しい評価を排除するなど。
応用例
10%トリム平均:上位5%、下位5%をカットし、残り90%のデータで平均を計算。フィギュアスケートの採点などで近い考え方が使われることも。
給料データで、上位の超高所得者と下位の極低所得者を除いて「標準的な層の平均」を算出。
留意点
トリムの割合が恣意的になる場合、操作的に平均を改変できてしまうリスク。
トリムをどの程度行うか、明確な根拠やルールを示す必要がある。