概要
ここでいう「標準化」は、
ある値が「平均からどれくらい離れているか」を、標準偏差という“ものさし”で割って表現することです。
数式の形はこうでした。
=(値 - 平均) / 標準偏差
この値は「Zスコア」とも呼ばれ、
0 なら「ちょうど平均」、プラスなら「平均より上」、マイナスなら「平均より下」という意味になります。
バラバラな単位・スケールのデータを、同じ土俵で比較したいときにとても便利です。
標準化の考え方
「平均から何個分の標準偏差だけ離れているか」
標準化のイメージは一言でいうと、
「平均からどれくらい離れているかを、標準偏差“何個分”で表す」です。
たとえば、
平均 70 点、標準偏差 10 点のテストで、80 点を取った人は、
- 平均からの差:80−70=10
- 標準偏差で割る:10÷10=1
となり、「Zスコア=1」、つまり「平均より標準偏差 1 個分だけ上」という意味になります。
同じく、60 点なら、
- 差:60−70=-10
- 割る:-10÷10=-1
で、「平均より標準偏差 1 個分だけ下(Z=-1)」という解釈になります。
Excel での標準化の書き方
A2:A10 のデータを標準化する基本形
たとえば、A2:A10 にテストの点数が入っているとします。
このとき、A2 の値を標準化して B2 に出したいなら、次のように書けます。
=(A2 - AVERAGE($A$2:$A$10)) / STDEV.P($A$2:$A$10)
ポイントは 2 つです。
- AVERAGE で「平均」を求める
- STDEV.P(または STDEV.S)で「標準偏差」を求める
それを (値 - 平均) / 標準偏差 の形に当てはめています。
$ を付けて絶対参照にしておけば、B2 の式を下にコピーするだけで、A2:A10 の全データを一気に標準化できます。
標準偏差の関数はどれを使う?
Excel には標準偏差の関数がいくつかありますが、よく使うのはこの 2 つです。
=STDEV.P(範囲) ' 母集団全体とみなすとき
=STDEV.S(範囲) ' 標本(サンプル)とみなすとき
厳密な統計の話をしない前提なら、どちらか一方に統一しておけば十分です。
「とりあえず全部のデータが手元にある」という感覚なら STDEV.P を使う、と覚えておくとシンプルです。
平均・標準偏差を別セルに出してから標準化する
読みやすくするための分割
式を読みやすくするために、平均と標準偏差を先にセルに出しておく方法もよく使います。
たとえば、
A2:A10 にデータがあるとして、
D1: =AVERAGE(A2:A10) ' 平均
D2: =STDEV.P(A2:A10) ' 標準偏差
としておきます。
このとき、B2 の標準化はこう書けます。
=(A2 - $D$1) / $D$2
D1・D2 を見れば「何を基準にしているか」が一目でわかるので、
あとからシートを読む人にも親切な設計になります。
標準化した値の解釈と使いどころ
Zスコアのざっくりした読み方
標準化した値(Zスコア)は、ざっくり次のように読むことが多いです。
- 0 付近:平均的
- 1 以上:平均よりかなり高い
- -1 以下:平均よりかなり低い
たとえば、
テスト A とテスト B があって、点数の分布も満点も違うとき、
それぞれのテストで標準化して Zスコアにしておけば、
「どっちのテストで相対的に頑張れているか」を同じ物差しで比べられます。
複数指標をまとめて評価するとき
売上、利益率、満足度など、単位もスケールも違う指標を「総合スコア」にしたいとき、
それぞれを標準化してから足し合わせる、というやり方もあります。
たとえば、
売上の Zスコアを C 列、利益率の Zスコアを D 列に入れておき、
総合スコアを E 列でこう計算します。
=C2 + D2
あるいは重み付けしたければ、
=C2*0.6 + D2*0.4
のようにして、「売上 6 割・利益率 4 割」の総合評価にすることもできます。
例題
問題1
A2:A10 にテストの点数が入っています。
この範囲の平均と標準偏差を使って、A2 の値を標準化した結果を B2 に表示したいとします。
B2 に書くべき式を、AVERAGE と STDEV.P を使って答えてください。
問題2
A2:A10 のデータについて、平均を D1、標準偏差を D2 に計算しておくことにしました。
D1 と D2 にそれぞれどのような式を書けばよいか、また、そのうえで B2 に「A2 の標準化値(Zスコア)」を計算する式をどう書けばよいか答えてください。
問題3
あるテストの平均点が 70 点、標準偏差が 8 点でした。
このとき、80 点を取った人と、60 点を取った人の Zスコアはいくつになるか、
「(値−平均)/標準偏差」の式を使って計算し、言葉でも意味を説明してください。
問題4
売上(A 列)と利益率(B 列)という 2 つの指標を、それぞれ標準化してから総合スコアを作りたいとします。
売上の Zスコアを C 列、利益率の Zスコアを D 列に入れたうえで、
「売上 60%・利益率 40%」の重みで総合スコアを E2 に計算する式を書いてください。
問題5
標準化の式
=(値 - 平均) / 標準偏差
を使うとき、「標準偏差が 0(すべての値が同じ)」だとどのような問題が起こるでしょうか。
その場合にエラーを避けるための工夫(たとえば IF を使った分岐)を、自分なりの式で提案してみてください。
