概要
四分位数は、データを「下から 25%」「50%」「75%」という 4 つの区間に区切る“しきい値”です。
Excel の QUARTILE 関数は、その四分位数(第1〜第3四分位数と最小・最大)を一発で求められる統計関数です。
「成績のばらつき」「売上分布」「外れ値の検出」など、データの“散らばり方”をざっくりつかみたいときに、とてもよく使われます。
QUARTILE 関数の基本
構文と引数の意味
QUARTILE の基本構文は次のとおりです。
=QUARTILE(配列, 四分位)
- 配列:対象となるデータ範囲
- 四分位:0〜4 の整数
四分位の指定は、こう対応します。
- 0:最小値(MIN に相当)
- 1:第1四分位数(下位 25% の境目)
- 2:第2四分位数(中央値=50% の境目)
- 3:第3四分位数(上位 25% 手前=75% の境目)
- 4:最大値(MAX に相当)
たとえば、テストの点数が B2:B101 に入っているとき、
=QUARTILE($B$2:$B$101, 1)
は「第1四分位数(下位 25% の境目)」を返します。
新しい関数との関係
QUARTILE は互換性関数で、現在は QUARTILE.INC / QUARTILE.EXC が推奨版です。
基本的な使い方は同じなので、まずは QUARTILE で考え方をつかめば十分です。
四分位数のイメージ
データを 4 つの箱に分ける感覚
四分位数は、データを小さい順に並べて、ざっくり 4 つの箱に分けるイメージです。
- 第1四分位数:下から 25% の境目
- 第2四分位数:真ん中(中央値)
- 第3四分位数:上から 25% の手前の境目
たとえば、100 人分の点数があるとき、
- 第1四分位数:下位 25 人と、それ以外の境目
- 第2四分位数:下位 50 人と上位 50 人の境目(中央値)
- 第3四分位数:下位 75 人と上位 25 人の境目
というイメージになります。
外れ値検出との関係(IQR)
四分位数からは「四分位範囲(IQR)」も計算できます。
IQR = 第3四分位数 − 第1四分位数
この IQR を使って、
- 下限:第1四分位数 − 1.5×IQR
- 上限:第3四分位数 + 1.5×IQR
の外側にある値を「外れ値候補」として見る、というのが統計でよく使われる考え方です。
コード例とテンプレート
基本例:テスト点数の四分位数を求める
テストの点数が B2:B101 に入っているとします。
このとき、次のように書けます。
第1四分位数(下位 25% の境目):
=QUARTILE($B$2:$B$101, 1)
第2四分位数(中央値):
=QUARTILE($B$2:$B$101, 2)
第3四分位数(上位 25% 手前の境目):
=QUARTILE($B$2:$B$101, 3)
これらを別々のセルに入れておけば、分布の“下・真ん中・上”が一目でわかります。
四分位数を一覧で出すテンプレート
たとえば、E 列に「四分位番号」、F 列に「値」を並べたいとします。
E2:0
E3:1
E4:2
E5:3
E6:4
このとき、F2 に次の式を書きます。
=QUARTILE($B$2:$B$101, E2)
これを F6 までコピーすると、
- F2:最小値
- F3:第1四分位数
- F4:第2四分位数(中央値)
- F5:第3四分位数
- F6:最大値
という「5 数要約」が一気に出せます。
IQR と外れ値判定の下限・上限
四分位数を使って、外れ値の目安を出す例です。
たとえば、
C2:第1四分位数(=QUARTILE($B$2:$B$101,1))
C3:第3四分位数(=QUARTILE($B$2:$B$101,3))
としておき、C4 に IQR を計算します。
=C3-C2
下限(外れ値候補の下側境界)を D2 に:
=C2 - 1.5*$C$4
上限(外れ値候補の上側境界)を D3 に:
=C3 + 1.5*$C$4
こうしておけば、「この範囲から外れている値は要チェック」といった判断がしやすくなります。
実務での使いどころ
分布の“ざっくりした形”をつかむ
平均だけでは、「偏っているのか」「真ん中に固まっているのか」が見えにくいことがあります。
四分位数を出しておくと、
- 下側に長いのか
- 上側に長いのか
- 真ん中にギュッと詰まっているのか
といった“形”が見えてきます。
評価・ランク分けの補助線として
たとえば、社員の評価や顧客ランクを決めるときに、
- 第1四分位数未満:要フォロー
- 第2〜第3四分位数:標準
- 第3四分位数以上:優秀
のように、四分位数を「区切り線」として使うこともできます。
例題
問題1
B2:B101 にテストの点数が入っています。
第1四分位数・第2四分位数・第3四分位数を、それぞれ別セルに求めたいとします。
- 第1四分位数を求める式
- 第2四分位数(中央値)を求める式
- 第3四分位数を求める式
を、QUARTILE を使って書いてください。
問題2
B2:B101 のデータについて、E2 に 0、E3 に 1、E4 に 2、E5 に 3、E6 に 4 を入力し、
F2:F6 に「最小値〜最大値までの 5 つの要約値」を表示したいとします。
F2 に書くべき式を答え、その式を F6 までコピーすると、F2〜F6 にそれぞれ何が表示されるか説明してください。
問題3
B2:B101 のデータについて、C2 に第1四分位数、C3 に第3四分位数を QUARTILE で求めました。
C4 に IQR(四分位範囲)を計算し、D2 に「下限」、D3 に「上限」を計算して外れ値候補を見つけたいとします。
C4、D2、D3 にそれぞれどのような式を書けばよいか答えてください。
問題4
QUARTILE の第 2 引数には 0〜4 の整数を指定します。
もし 5 や -1 を指定した場合、どのような結果(エラー)が返ってくるか、またその理由を説明してください。
問題5
QUARTILE と AVERAGE は、どちらもデータを要約する関数ですが、役割が違います。
「平均」と「四分位数」がそれぞれどんな場面に向いているかを、
「中心を 1 つの数字で知りたい」ときと、「分布の広がりや偏りを知りたい」ときの違いに着目して、自分の言葉で整理してみてください。
