概要
「中央値」は、データを小さい順に並べたときの“真ん中の値”です。
Excel では MEDIAN 関数で一発で求められます。
平均(AVERAGE)は「合計 ÷ 個数」なので、極端に大きい値・小さい値に引っ張られやすいですが、
中央値は「真ん中の位置」だけを見るので、外れ値の影響を受けにくい、という大きな特徴があります。
MEDIAN 関数の基本
構文と意味
MEDIAN の基本構文はとてもシンプルです。
=MEDIAN(数値1, [数値2], …)
または
=MEDIAN(範囲)
指定した数値や範囲の「中央値」を返します。
- データ個数が奇数:真ん中の 1 つの値
- データ個数が偶数:真ん中 2 つの平均値
を返す、という動きをします。
簡単なイメージ
たとえば、点数が
50, 60, 70, 80, 90
の 5 つなら、並べるとすでに小さい順なので、真ん中は 70 → 中央値は 70。
点数が
50, 60, 80, 90
の 4 つなら、真ん中 2 つは 60 と 80 → (60+80)/2=70 → 中央値は 70。
この「真ん中を取る」処理を、MEDIAN が自動でやってくれます。
基本的なコード例
単一範囲の中央値
テストの点数が B2:B11 に入っているとします。
このとき、中央値を求めるには、次のように書きます。
=MEDIAN($B$2:$B$11)
これだけで、B2:B11 の「真ん中の値」が返ってきます。
複数範囲・複数引数も指定できる
範囲を複数指定することもできます。
=MEDIAN(B2:B11, D2:D11)
あるいは、個別の値と範囲を混ぜても構いません。
=MEDIAN(B2:B11, 0, 100)
ただし、実務では「1 つの範囲」を渡す形がいちばん読みやすいので、まずはそれに慣れるのがおすすめです。
平均との違いと使い分け
外れ値に強いのが中央値
たとえば、次の 5 人の年収を考えます。
300 万、320 万、340 万、360 万、5000 万
平均を取ると、
(300+320+340+360+5000) ÷ 5 = 1,264 万
となり、「典型的な人の年収」としてはかなりズレた数字になります。
一方、中央値は「真ん中の値」なので 340 万です。
こちらの方が、「多くの人がどのあたりか」を表す指標としてはしっくりきます。
このように、極端な値が混ざるデータでは、中央値の方が“現実感のある代表値”になりやすいです。
いつ中央値を使うとよいか
- 外れ値が混ざりやすいデータ(年収、アクセス数、売上など)
- 「典型的な 1 人」を知りたいとき
- 平均だと感覚的にズレると感じるとき
こういう場面では、AVERAGE と並べて MEDIAN も出しておくと、データの理解が一気に深まります。
実務でのテンプレート
テストの中央値を求めるテンプレート
B2:B101 にテストの点数が入っているとき、中央値はこうです。
=MEDIAN($B$2:$B$101)
平均と並べて表示するなら、たとえば:
- C2:
=AVERAGE($B$2:$B$101) - C3:
=MEDIAN($B$2:$B$101)
として、「平均」と「中央値」をセットで見ると、分布の偏りが見えてきます。
部署ごとの中央値を出す応用(簡易版)
部署ごとに中央値を出したい場合は、本来はフィルターやピボットテーブルが便利ですが、
シンプルな例として「部署ごとに別列に点数を持っている」ケースなら、列ごとに MEDIAN を書くだけです。
- B 列:営業部の点数 →
=MEDIAN(B2:B101) - C 列:開発部の点数 →
=MEDIAN(C2:C101)
このように、列ごとに中央値を出して比較すると、
「どの部署の“真ん中”が高いか」が一目でわかります。
例題
問題1
B2:B10 に 9 人分のテスト点数が入っています。
この範囲の中央値を求める式を、MEDIAN を使って書いてください。
また、「中央値」がどのように決まるかを、データを小さい順に並べるイメージで説明してください。
問題2
次の 5 つの値があります。
300、320、340、360、5000
- この 5 つの平均値を計算してください。
MEDIANを使って中央値を求める式を書き、その結果がいくつになるか答えてください。- 平均と中央値のどちらが「典型的な 1 人」を表していると感じるか、自分の言葉で説明してください。
問題3
B2:B11 と D2:D11 に、それぞれ別グループの測定値が入っています。
この 2 つのグループをまとめて 1 つの集合とみなし、その中央値を求めたいとします。
MEDIAN を使って、その中央値を求める式を書いてください。
また、その式が「2 つの範囲をどう扱っているか」を説明してください。
問題4
B2:B101 のデータについて、C2 に平均、C3 に中央値を表示しました。
C2:=AVERAGE($B$2:$B$101)
C3:=MEDIAN($B$2:$B$101)
この 2 つの値を見比べたとき、「平均の方がずっと大きい(または小さい)」場合、
データの分布にどのような特徴がありそうか、自分の言葉で考察してみてください。
問題5
MEDIAN と QUARTILE は、どちらも「並べたときの位置」に注目する統計関数です。
中央値(第2四分位数)と、第1・第3四分位数の関係を踏まえて、
「中央値だけを見る場合」と「四分位数も合わせて見る場合」で、データの理解にどんな差が出るかを整理してみてください。
