定義
データを小さい方から順に並べ、4等分になるように区切る3つのポイント(\( Q_1, Q_2, Q_3 \))。
\( Q_2 \) は中央値と同義。
特徴
・四分位数を用いると、データの下位25%・中央50%・上位25%の領域がどのあたりにあるかを把握しやすい。
・四分位範囲(IQR = \( Q_3 – Q_1 \))は外れ値に比較的強い(頑健な)ばらつき指標。
使いどころ
・箱ひげ図の描画や外れ値の判定(1.5×IQR ルールなど)に使われる。
・分布の真ん中50%がどの範囲に入っているかを直感的につかみたいとき。
応用例
・「第1四分位数が50点、第3四分位数が80点なら、真ん中の50%の生徒は50〜80点の間に集中している」と判断。
・給与分布で、「25%の人は月給30万円以下、75%の人は月給45万円以下」といった解釈。
留意点
・整数データか小数データか、サンプル数が奇数か偶数かで四分位数の計算方法(補間など)に細かい差がある。
・分布の形状によっては、上位側や下位側に極端な値があってもIQR自体は頑健。