Excel関数 逆引き集 | 四分位数 → QUARTILE

Excel
スポンサーリンク

概要

四分位数は、データを「下から 25%」「50%」「75%」という 4 つの区間に区切る“しきい値”です。
Excel の QUARTILE 関数は、その四分位数(第1〜第3四分位数と最小・最大)を一発で求められる統計関数です。

「成績のばらつき」「売上分布」「外れ値の検出」など、データの“散らばり方”をざっくりつかみたいときに、とてもよく使われます。


QUARTILE 関数の基本

構文と引数の意味

QUARTILE の基本構文は次のとおりです。

=QUARTILE(配列, 四分位)
  • 配列:対象となるデータ範囲
  • 四分位:0〜4 の整数

四分位の指定は、こう対応します。

  • 0:最小値(MIN に相当)
  • 1:第1四分位数(下位 25% の境目)
  • 2:第2四分位数(中央値=50% の境目)
  • 3:第3四分位数(上位 25% 手前=75% の境目)
  • 4:最大値(MAX に相当)

たとえば、テストの点数が B2:B101 に入っているとき、

=QUARTILE($B$2:$B$101, 1)

は「第1四分位数(下位 25% の境目)」を返します。

新しい関数との関係

QUARTILE は互換性関数で、現在は QUARTILE.INC / QUARTILE.EXC が推奨版です。
基本的な使い方は同じなので、まずは QUARTILE で考え方をつかめば十分です。


四分位数のイメージ

データを 4 つの箱に分ける感覚

四分位数は、データを小さい順に並べて、ざっくり 4 つの箱に分けるイメージです。

  • 第1四分位数:下から 25% の境目
  • 第2四分位数:真ん中(中央値)
  • 第3四分位数:上から 25% の手前の境目

たとえば、100 人分の点数があるとき、

  • 第1四分位数:下位 25 人と、それ以外の境目
  • 第2四分位数:下位 50 人と上位 50 人の境目(中央値)
  • 第3四分位数:下位 75 人と上位 25 人の境目

というイメージになります。

外れ値検出との関係(IQR)

四分位数からは「四分位範囲(IQR)」も計算できます。

IQR = 第3四分位数 − 第1四分位数

この IQR を使って、

  • 下限:第1四分位数 − 1.5×IQR
  • 上限:第3四分位数 + 1.5×IQR

の外側にある値を「外れ値候補」として見る、というのが統計でよく使われる考え方です。


コード例とテンプレート

基本例:テスト点数の四分位数を求める

テストの点数が B2:B101 に入っているとします。
このとき、次のように書けます。

第1四分位数(下位 25% の境目):

=QUARTILE($B$2:$B$101, 1)

第2四分位数(中央値):

=QUARTILE($B$2:$B$101, 2)

第3四分位数(上位 25% 手前の境目):

=QUARTILE($B$2:$B$101, 3)

これらを別々のセルに入れておけば、分布の“下・真ん中・上”が一目でわかります。

四分位数を一覧で出すテンプレート

たとえば、E 列に「四分位番号」、F 列に「値」を並べたいとします。

E2:0
E3:1
E4:2
E5:3
E6:4

このとき、F2 に次の式を書きます。

=QUARTILE($B$2:$B$101, E2)

これを F6 までコピーすると、

  • F2:最小値
  • F3:第1四分位数
  • F4:第2四分位数(中央値)
  • F5:第3四分位数
  • F6:最大値

という「5 数要約」が一気に出せます。

IQR と外れ値判定の下限・上限

四分位数を使って、外れ値の目安を出す例です。
たとえば、

C2:第1四分位数(=QUARTILE($B$2:$B$101,1)
C3:第3四分位数(=QUARTILE($B$2:$B$101,3)

としておき、C4 に IQR を計算します。

=C3-C2

下限(外れ値候補の下側境界)を D2 に:

=C2 - 1.5*$C$4

上限(外れ値候補の上側境界)を D3 に:

=C3 + 1.5*$C$4

こうしておけば、「この範囲から外れている値は要チェック」といった判断がしやすくなります。


実務での使いどころ

分布の“ざっくりした形”をつかむ

平均だけでは、「偏っているのか」「真ん中に固まっているのか」が見えにくいことがあります。
四分位数を出しておくと、

  • 下側に長いのか
  • 上側に長いのか
  • 真ん中にギュッと詰まっているのか

といった“形”が見えてきます。

評価・ランク分けの補助線として

たとえば、社員の評価や顧客ランクを決めるときに、

  • 第1四分位数未満:要フォロー
  • 第2〜第3四分位数:標準
  • 第3四分位数以上:優秀

のように、四分位数を「区切り線」として使うこともできます。


例題

問題1

B2:B101 にテストの点数が入っています。
第1四分位数・第2四分位数・第3四分位数を、それぞれ別セルに求めたいとします。

  1. 第1四分位数を求める式
  2. 第2四分位数(中央値)を求める式
  3. 第3四分位数を求める式

を、QUARTILE を使って書いてください。

問題2

B2:B101 のデータについて、E2 に 0、E3 に 1、E4 に 2、E5 に 3、E6 に 4 を入力し、
F2:F6 に「最小値〜最大値までの 5 つの要約値」を表示したいとします。

F2 に書くべき式を答え、その式を F6 までコピーすると、F2〜F6 にそれぞれ何が表示されるか説明してください。

問題3

B2:B101 のデータについて、C2 に第1四分位数、C3 に第3四分位数を QUARTILE で求めました。
C4 に IQR(四分位範囲)を計算し、D2 に「下限」、D3 に「上限」を計算して外れ値候補を見つけたいとします。

C4、D2、D3 にそれぞれどのような式を書けばよいか答えてください。

問題4

QUARTILE の第 2 引数には 0〜4 の整数を指定します。
もし 5 や -1 を指定した場合、どのような結果(エラー)が返ってくるか、またその理由を説明してください。

問題5

QUARTILEAVERAGE は、どちらもデータを要約する関数ですが、役割が違います。
「平均」と「四分位数」がそれぞれどんな場面に向いているかを、
「中心を 1 つの数字で知りたい」ときと、「分布の広がりや偏りを知りたい」ときの違いに着目して、自分の言葉で整理してみてください。

タイトルとURLをコピーしました