概要
「標準偏差」は、データが平均のまわりにどれくらい散らばっているか(バラつきの大きさ)を、元の単位のまま表した指標です。
Excel では、母集団全体の標準偏差を求めるときに STDEV.P 関数を使います。
分散(VAR.P)は「バラつきの二乗の平均」でしたが、その平方根を取ったものが標準偏差で、「点」「円」「円/秒」など、元のデータと同じ単位で解釈できるのが大きなメリットです。
STDEV.P 関数の基本
構文と意味
STDEV.P の基本構文は次のとおりです。
=STDEV.P(数値1, [数値2], …)
または
=STDEV.P(範囲)
指定した数値や範囲について、母集団標準偏差を返します。
イメージとしては、「各データが平均からどれくらい離れているか」を二乗して平均し(分散)、その平方根を取ったものです。
数式で書くと、母集団標準偏差は次のようなイメージです。
ここで
(x_i):各データ
(\bar{x}):平均
(N):データの個数
です。
STDEV.P と STDEV.S の違い(ざっくり)
Excel には STDEV.P と STDEV.S があります。STDEV.P は「母集団全体の標準偏差」(分母が (N))、STDEV.S は「標本から母集団を推定する標準偏差」(分母が (N-1))です。
厳密な統計の話は一旦置いておいて、
「全部のデータがそろっている前提なら STDEV.P」
「一部のサンプルから推定したいなら STDEV.S」
くらいのイメージで使い分けるとよいです。
基本的なコード例
単一範囲の標準偏差を求める
テストの点数が B2:B11 に入っているとします。
このとき、標準偏差を求めるには次のように書きます。
=STDEV.P($B$2:$B$11)
これで、「B2:B11 の点数が平均のまわりにどれくらい散らばっているか」が 1 つの数値として返ってきます。
値が大きいほど「バラつきが大きい」、小さいほど「そろっている」というイメージです。
複数範囲・複数引数も指定できる
範囲を複数指定することもできます。
=STDEV.P(B2:B11, D2:D11)
あるいは、個別の値と範囲を混ぜても構いません。
=STDEV.P(B2:B11, 0, 100)
ただし、実務では「1 つの範囲」を渡す形がいちばん読みやすいので、まずはそれに慣れるのがおすすめです。
標準偏差の直感的なイメージ
同じ平均でも標準偏差は変わる
次の 2 つのクラスを考えてみます。
クラスA:60, 60, 60, 60, 60
クラスB:40, 50, 60, 70, 80
どちらも平均は 60 です。
しかし、クラスAは全員 60 点で「まったくバラつきがない」、クラスBは「低い人も高い人もいる」状態です。
STDEV.P を計算すると、
クラスA:標準偏差は 0(全員同じなのでバラつきゼロ)
クラスB:標準偏差は 0 より大きい値(バラつきあり)
となり、「同じ平均でも、標準偏差を見るとクラスの雰囲気が違う」ことがわかります。
単位が元のデータと同じだから直感的
分散は「点²」「cm²」のように二乗の単位を持つため、数値の大きさを直感的に解釈しづらいことがあります。
標準偏差は分散の平方根なので、元のデータと同じ単位(点、cm、円など)になり、
「平均からだいたいこのくらいズレている」とイメージしやすくなります。
実務でのテンプレート
テストの標準偏差を求めるテンプレート
B2:B101 にテストの点数が入っているとき、標準偏差はこうです。
=STDEV.P($B$2:$B$101)
平均と並べて表示するなら、たとえば:
C2: =AVERAGE($B$2:$B$101) ' 平均
C3: =STDEV.P($B$2:$B$101) ' 標準偏差
として、「真ん中」と「バラつき」をセットで見ると、クラスの特徴がよく見えてきます。
部署ごとの安定度を比較する
部署ごとに別列に売上がある場合、列ごとに STDEV.P を書くだけで、安定度の比較ができます。
B 列:営業部の売上 → =STDEV.P(B2:B101)
C 列:開発部の売上 → =STDEV.P(C2:C101)
標準偏差が大きい部署は「数字の上下が激しい」、小さい部署は「安定している」といった見方ができます。
例題
問題1
B2:B6 に次の 5 つの点数が入っています。
60, 60, 60, 60, 60
この範囲の標準偏差を STDEV.P で求める式を書き、その結果がいくつになるか答えてください。
また、その結果から「このクラスのバラつき」がどういう状態かを言葉で説明してください。
問題2
B2:B6 に次の 5 つの点数が入っています。
40, 50, 60, 70, 80
- この範囲の平均を
AVERAGEで求める式を書き、結果がいくつになるか答えてください。 - 同じ範囲の標準偏差を
STDEV.Pで求める式を書き、問題1のクラスと比べて「どちらがバラつきが大きいか」を説明してください。
問題3
B2:B11 と D2:D11 に、それぞれ別グループの測定値が入っています。
この 2 つのグループをまとめて 1 つの集合とみなし、その標準偏差を求めたいとします。
STDEV.P を使って、その標準偏差を求める式を書いてください。
また、その式が「2 つの範囲をどう扱っているか」を説明してください。
問題4
B2:B101 のデータについて、C2 に平均、C3 に標準偏差を表示しました。
C2:=AVERAGE($B$2:$B$101)
C3:=STDEV.P($B$2:$B$101)
この 2 つの値を見比べたとき、「標準偏差がとても大きい」場合、データの分布にどのような特徴がありそうか、自分の言葉で考察してみてください。
問題5
VAR.P と STDEV.P は、どちらも「バラつき」を表す関数です。
分散と標準偏差の関係(標準偏差は分散の平方根)を踏まえて、
「分散で見る場合」と「標準偏差で見る場合」で、解釈のしやすさにどんな違いがあるかを、自分の言葉で整理してみてください。
