概要
パーセンタイルは、「データを小さい順に並べたとき、全体のうち何%の位置にある値か」を表す指標です。
Excel の PERCENTILE 関数は、その「k パーセンタイル」にあたる値を返す統計関数です。
たとえば「80パーセンタイル」は、「全体の 80%のデータがその値以下になる境目」のことです。
成績の合否ライン、給与の上位○%、外れ値検出など、「どこを境目にするか」を決めたい場面でよく使われます。
PERCENTILE 関数の基本
構文と意味
PERCENTILE の基本構文はこうです。
=PERCENTILE(配列, 率)
- 配列:パーセンタイルを求めたいデータ範囲
- 率:0〜1 の間の小数(例:0.9 → 90パーセンタイル)
たとえば、
=PERCENTILE(C2:C100, 0.9)
なら、「C2:C100 のデータの 90 パーセンタイル(上位 10%の境目)」を返します。
新しい関数との関係
PERCENTILE は「互換性関数」で、現在はより新しい PERCENTILE.INC / PERCENTILE.EXC が推奨されています。
ただし、既存ブックとの互換性のために今も使えますし、基本的な使い方は同じです。
直感でつかむパーセンタイル
「何%の人がここまでに入るか」という境目
たとえば、テストの点数が 100 人分あるとします。=PERCENTILE(点数範囲, 0.8) は、「上から 20 人目と 21 人目の境目」のようなイメージです。
- その値以下に、全体の 80% が含まれる
- その値以上に、全体の 20% が含まれる
という「境界線」を数値で返してくれます。
四分位点との違い
四分位点(25%・50%・75%)は、パーセンタイルの特別版です。
たとえば「第 3 四分位」は 75 パーセンタイルに相当します。
PERCENTILE を使えば、25%・50%・75%だけでなく、
10%・90%・95%など、任意の割合の境目を柔軟に求められます。
コード例とテンプレート
基本例:テストの上位 10%ラインを求める
テストの点数が B2:B101 に入っているとします。
「上位 10%の合格ライン」を知りたいときは、こう書きます。
=PERCENTILE($B$2:$B$101, 0.9)
これで、「全体の 90% がその値以下になる点数」が返ってきます。
この値を「合格ライン」として使えば、「上位 10%」を機械的に判定できます。
給与の上位 25%の境目を求める
給与データが D2:D200 にあるとします。
「上位 25% に入る給与の境目」を知りたいときは、こうです。
=PERCENTILE($D$2:$D$200, 0.75)
75 パーセンタイルなので、「全体の 75% がその値以下」という境目になります。
この値より上の人たちが「上位 25%」というイメージです。
パーセンタイルを可変にするテンプレート
パーセンタイルの割合をセルで指定しておくと、柔軟に変えられます。
たとえば、
- B2:B101:データ
- E2:0.1(10%)
- E3:0.25(25%)
- E4:0.5(50%)
として、F2 に次の式を書きます。
=PERCENTILE($B$2:$B$101, E2)
これを F4 までコピーすれば、10%・25%・50%…と、
いろいろなパーセンタイルを一気に計算できます。
実務での使いどころ
合否ライン・評価ラインの設定
- テストの「上位 30% を A 評価にする」
- KPI の「上位 10% をハイパフォーマーとみなす」
といったとき、PERCENTILE で境目を数値として出しておくと、
感覚ではなく「データに基づいたライン設定」ができます。
外れ値の検出
たとえば、5%パーセンタイルと 95%パーセンタイルを求めて、
その範囲から外れている値を「外れ値候補」としてチェックする、といった使い方もあります。
例題
問題1
B2:B101 にテストの点数が入っています。
「上位 10% の合格ライン」を PERCENTILE で求めたいとき、どのような式を書けばよいでしょうか。
また、その結果の値が「全体の何%の位置」を表しているのか、言葉で説明してください。
問題2
D2:D200 に社員の年収データがあります。
「上位 25% に入る年収の境目」を求めたいとき、どのような式を書けばよいでしょうか。
そのうえで、「その値より上の人たちは全体のどのくらいの割合か」を説明してください。
問題3
B2:B101 のデータについて、E2 に 0.1、E3 に 0.5、E4 に 0.9 を入力し、
F2:F4 にそれぞれ 10%・50%・90%パーセンタイルを表示したいとします。
F2 に書くべき式を答え、その式を F3・F4 にコピーすると何が起こるかを説明してください。
問題4
PERCENTILE の第 2 引数「率」は 0〜1 の範囲で指定する必要があります。
もし 1.2 や -0.1 を指定した場合、どのようなエラーになるか、またその理由を説明してください。
問題5
PERCENTILE と「単純な平均(AVERAGE)」は、どちらもデータを要約する指標ですが、意味合いが違います。
「平均」と「パーセンタイル」がそれぞれどんな場面に向いているか、
「中心を知りたい」「境目を決めたい」といった観点から、自分の言葉で整理してみてください。
