四分位数 / Quartiles

定義

データを小さい方から順に並べ、4等分になるように区切る3つのポイント(\( Q_1, Q_2, Q_3 \))。

\( Q_2 \) は中央値と同義。

特徴

・四分位数を用いると、データの下位25%・中央50%・上位25%の領域がどのあたりにあるかを把握しやすい。

・四分位範囲(IQR = \( Q_3 – Q_1 \))は外れ値に比較的強い(頑健な)ばらつき指標。

使いどころ

・箱ひげ図の描画や外れ値の判定(1.5×IQR ルールなど)に使われる。

・分布の真ん中50%がどの範囲に入っているかを直感的につかみたいとき。

応用例

・「第1四分位数が50点、第3四分位数が80点なら、真ん中の50%の生徒は50〜80点の間に集中している」と判断。

・給与分布で、「25%の人は月給30万円以下、75%の人は月給45万円以下」といった解釈。

留意点

・整数データか小数データか、サンプル数が奇数か偶数かで四分位数の計算方法(補間など)に細かい差がある。

・分布の形状によっては、上位側や下位側に極端な値があってもIQR自体は頑健。

  • URLをコピーしました!
  • URLをコピーしました!
目次