Excel関数 逆引き集 | 標準化 → (値-平均)/標準偏差

Excel
スポンサーリンク

概要

ここでいう「標準化」は、
ある値が「平均からどれくらい離れているか」を、標準偏差という“ものさし”で割って表現することです。

数式の形はこうでした。

=(値 - 平均) / 標準偏差

この値は「Zスコア」とも呼ばれ、
0 なら「ちょうど平均」、プラスなら「平均より上」、マイナスなら「平均より下」という意味になります。
バラバラな単位・スケールのデータを、同じ土俵で比較したいときにとても便利です。


標準化の考え方

「平均から何個分の標準偏差だけ離れているか」

標準化のイメージは一言でいうと、
「平均からどれくらい離れているかを、標準偏差“何個分”で表す」です。

たとえば、
平均 70 点、標準偏差 10 点のテストで、80 点を取った人は、

  • 平均からの差:80−70=10
  • 標準偏差で割る:10÷10=1

となり、「Zスコア=1」、つまり「平均より標準偏差 1 個分だけ上」という意味になります。

同じく、60 点なら、

  • 差:60−70=-10
  • 割る:-10÷10=-1

で、「平均より標準偏差 1 個分だけ下(Z=-1)」という解釈になります。


Excel での標準化の書き方

A2:A10 のデータを標準化する基本形

たとえば、A2:A10 にテストの点数が入っているとします。
このとき、A2 の値を標準化して B2 に出したいなら、次のように書けます。

=(A2 - AVERAGE($A$2:$A$10)) / STDEV.P($A$2:$A$10)

ポイントは 2 つです。

  1. AVERAGE で「平均」を求める
  2. STDEV.P(または STDEV.S)で「標準偏差」を求める

それを (値 - 平均) / 標準偏差 の形に当てはめています。
$ を付けて絶対参照にしておけば、B2 の式を下にコピーするだけで、A2:A10 の全データを一気に標準化できます。

標準偏差の関数はどれを使う?

Excel には標準偏差の関数がいくつかありますが、よく使うのはこの 2 つです。

=STDEV.P(範囲)   ' 母集団全体とみなすとき
=STDEV.S(範囲)   ' 標本(サンプル)とみなすとき

厳密な統計の話をしない前提なら、どちらか一方に統一しておけば十分です。
「とりあえず全部のデータが手元にある」という感覚なら STDEV.P を使う、と覚えておくとシンプルです。


平均・標準偏差を別セルに出してから標準化する

読みやすくするための分割

式を読みやすくするために、平均と標準偏差を先にセルに出しておく方法もよく使います。

たとえば、
A2:A10 にデータがあるとして、

D1: =AVERAGE(A2:A10)   ' 平均
D2: =STDEV.P(A2:A10)   ' 標準偏差

としておきます。

このとき、B2 の標準化はこう書けます。

=(A2 - $D$1) / $D$2

D1・D2 を見れば「何を基準にしているか」が一目でわかるので、
あとからシートを読む人にも親切な設計になります。


標準化した値の解釈と使いどころ

Zスコアのざっくりした読み方

標準化した値(Zスコア)は、ざっくり次のように読むことが多いです。

  • 0 付近:平均的
  • 1 以上:平均よりかなり高い
  • -1 以下:平均よりかなり低い

たとえば、
テスト A とテスト B があって、点数の分布も満点も違うとき、
それぞれのテストで標準化して Zスコアにしておけば、
「どっちのテストで相対的に頑張れているか」を同じ物差しで比べられます。

複数指標をまとめて評価するとき

売上、利益率、満足度など、単位もスケールも違う指標を「総合スコア」にしたいとき、
それぞれを標準化してから足し合わせる、というやり方もあります。

たとえば、
売上の Zスコアを C 列、利益率の Zスコアを D 列に入れておき、
総合スコアを E 列でこう計算します。

=C2 + D2

あるいは重み付けしたければ、

=C2*0.6 + D2*0.4

のようにして、「売上 6 割・利益率 4 割」の総合評価にすることもできます。


例題

問題1

A2:A10 にテストの点数が入っています。
この範囲の平均と標準偏差を使って、A2 の値を標準化した結果を B2 に表示したいとします。
B2 に書くべき式を、AVERAGE と STDEV.P を使って答えてください。

問題2

A2:A10 のデータについて、平均を D1、標準偏差を D2 に計算しておくことにしました。
D1 と D2 にそれぞれどのような式を書けばよいか、また、そのうえで B2 に「A2 の標準化値(Zスコア)」を計算する式をどう書けばよいか答えてください。

問題3

あるテストの平均点が 70 点、標準偏差が 8 点でした。
このとき、80 点を取った人と、60 点を取った人の Zスコアはいくつになるか、
「(値−平均)/標準偏差」の式を使って計算し、言葉でも意味を説明してください。

問題4

売上(A 列)と利益率(B 列)という 2 つの指標を、それぞれ標準化してから総合スコアを作りたいとします。
売上の Zスコアを C 列、利益率の Zスコアを D 列に入れたうえで、
「売上 60%・利益率 40%」の重みで総合スコアを E2 に計算する式を書いてください。

問題5

標準化の式

=(値 - 平均) / 標準偏差

を使うとき、「標準偏差が 0(すべての値が同じ)」だとどのような問題が起こるでしょうか。
その場合にエラーを避けるための工夫(たとえば IF を使った分岐)を、自分なりの式で提案してみてください。

タイトルとURLをコピーしました