概要
最頻値は、データの中で「いちばんよく出てくる値」です。
Excel では MODE.SNGL 関数を使うと、「最も頻度の高い 1 つの値」を簡単に取り出せます。
平均(AVERAGE)は「真ん中の大きさ」、中央値(MEDIAN)は「位置の真ん中」、
最頻値(MODE.SNGL)は「いちばんよく現れる値」という、少し違う“代表値”を教えてくれます。
MODE.SNGL 関数の基本
構文と動き
MODE.SNGL の構文は次のとおりです。
=MODE.SNGL(数値1, [数値2], …)
または
=MODE.SNGL(範囲)
指定した数値や範囲の中から、「出現回数が最も多い 1 つの値」を返します。
もし最頻値が存在しない(すべての値が 1 回ずつしか出てこない)場合は、#N/A エラーになります。
基本的なコード例
単一範囲の最頻値を求める
テストの点数が B2:B11 に入っていて、「いちばん多い点数」を知りたいとします。
このとき、最頻値を求める式は次のとおりです。
=MODE.SNGL($B$2:$B$11)
たとえば、B2:B11 が
60, 70, 70, 80, 90, 70, 60, 50, 70, 80
のようなデータなら、最も多く出てくるのは 70 なので、結果は 70 になります。
複数範囲や値をまとめて扱う
範囲を複数指定することもできます。
=MODE.SNGL(B2:B11, D2:D11)
あるいは、個別の値と範囲を混ぜても構いません。
=MODE.SNGL(B2:B11, 0, 100)
ただし、読みやすさとミス防止の観点から、まずは「1 つの範囲」を渡す形に慣れておくのがおすすめです。
最頻値の意味と使いどころ
「いちばん多いパターン」を知る指標
最頻値は、「よくあるパターン」を知りたいときに役立ちます。
例えば、アンケートの満足度(1〜5 段階)で、
平均は 3.6、最頻値は 5 だったとします。
この場合、「数字としての真ん中は 3.6 だけど、“いちばん多い回答”は 5(とても満足)」という読み方ができます。
つまり、「多くの人はとても満足しているが、一部の低い評価が平均を少し下げている」といった状況が見えてきます。
平均・中央値との違い
平均は「全体のバランス」、中央値は「真ん中の位置」、最頻値は「いちばん多い値」。
同じデータでも、この 3 つは違う顔を見せます。
例えば、テストの点数が
60, 60, 60, 90, 100
だった場合、
平均は (60+60+60+90+100) ÷ 5 = 74
中央値は 60(真ん中の値)
最頻値は 60(いちばん多い)
となります。
「多くの人は 60 点だけど、一部の高得点者が平均を押し上げている」という状況が、最頻値を見ると直感的に分かります。
実務でのテンプレート
テストで「よく出る点数」を知る
B2:B101 にテストの点数が入っているとき、「いちばん多い点数」は次のように求めます。
=MODE.SNGL($B$2:$B$101)
同じシートで、平均や中央値も並べると、例えば次のようになります。
C2:=AVERAGE($B$2:$B$101)(平均)
C3:=MEDIAN($B$2:$B$101)(中央値)
C4:=MODE.SNGL($B$2:$B$101)(最頻値)
これで、「真ん中」「位置の真ん中」「いちばん多い点数」が一目で比較できます。
アンケートの「最も選ばれた評価」を知る
5 段階評価のアンケート結果が B2:B501 に入っているとします(1〜5 の整数)。
このとき、「最も多く選ばれた評価」を知るには、次のように書きます。
=MODE.SNGL($B$2:$B$501)
結果が 4 なら「4 がいちばん多い」、5 なら「5 がいちばん多い」ということです。
平均だけでは見えにくい「一番よく選ばれた選択肢」を、シンプルに取り出せます。
例題
問題1
B2:B11 に次の 10 個の点数が入っています。
60, 70, 70, 80, 90, 70, 60, 50, 70, 80
- この範囲の最頻値を求める式を、
MODE.SNGLを使って書いてください。 - 実際にどの値が最頻値になるかを、出現回数を数えるイメージで説明してください。
問題2
次の 5 つの値があります。
60, 60, 60, 90, 100
- この 5 つの平均値、中央値、最頻値をそれぞれ手で求めてください。
- 同じ結果を得るための
AVERAGE、MEDIAN、MODE.SNGLの式を書いてください。 - このデータの「典型的な点数」を表すのに、あなたはどの指標がしっくり来るか、自分の言葉で説明してください。
問題3
B2:B501 に 5 段階評価(1〜5)のアンケート結果が入っています。
この中で「最も多く選ばれた評価」を求める式を、MODE.SNGL を使って書いてください。
また、その結果が 5 だった場合と 3 だった場合で、アンケートの印象がどう変わるかを言葉で説明してください。
問題4
B2:B11 に入っている 10 個の値が、すべてバラバラで 1 回ずつしか出てこないとします。
このとき、MODE.SNGL($B$2:$B$11) はどのような結果になるかを答えてください。
また、その結果になる理由を、「最頻値の定義」と結びつけて説明してください。
問題5
最頻値は「いちばん多い値」なので、連続的な測定値(身長、体重、売上など)よりも、
「選択肢が限られているデータ(評価、ランク、カテゴリ)」で特に力を発揮します。
あなたが扱っている、またはイメージしやすいデータを 1 つ挙げ、
そのデータで最頻値を出すと、どんな気づきが得られそうかを自分の言葉で整理してみてください。
