Excel関数 逆引き集 | 相関係数 → CORREL

Excel
スポンサーリンク

概要

相関係数は、2つの数値データの「一緒に増えたり減ったりする度合い」を −1〜1 の範囲で表す指標です。
Excel では CORREL 関数を使うと、2つの範囲の相関係数を一発で計算できます。

値が

  • 1 に近い → 片方が増えるともう片方も増えやすい(正の相関)
  • −1 に近い → 片方が増えるともう片方は減りやすい(負の相関)
  • 0 に近い → 関係が弱い(ほぼ相関なし)

というイメージで読み取ります。


CORREL 関数の基本

構文と意味

CORREL の構文はとてもシンプルです。

=CORREL(配列1, 配列2)

配列1 と 配列2 には、同じ長さの数値データの範囲を指定します。
「配列1 の値」と「配列2 の値」が、行ごとにペアになっている前提です(例:A2 と B2、A3 と B3 …)。

この 2 つのデータの「線形的な関係の強さと向き」を、−1〜1 の相関係数として返します。


直感でつかむ相関係数

正の相関・負の相関・相関なし

イメージをざっくり言うと、こんな感じです。

  • 正の相関:勉強時間が長いほど点数が高い、広告費が多いほど売上が増える
  • 負の相関:価格が高いほど売上数量が減る、睡眠時間が短いほど集中力が落ちる
  • 相関なし:靴のサイズとテストの点数のように、ほぼ関係がない

相関係数は、この「関係の強さと向き」を数字で表したものです。

相関係数の読み方の目安

厳密なルールではありませんが、ざっくりした目安としては、

  • 0.7 以上:かなり強い相関
  • 0.3〜0.7:そこそこ相関あり
  • 0〜0.3:弱い相関(ほぼなしに近い)

といった感覚で見ることが多いです。
もちろん、データの内容や目的によって解釈は変わります。


コード例とテンプレート

基本例:勉強時間とテスト点数の相関

次のような表を考えます。

A 列:勉強時間(時間)
B 列:テストの点数

A2:A31 に 30 人分の勉強時間、B2:B31 に 30 人分の点数が入っているとします。
このとき、相関係数を求めるには、どこかのセルに次のように書きます。

=CORREL($A$2:$A$31, $B$2:$B$31)

これで、「勉強時間」と「点数」の相関係数が −1〜1 の範囲で返ってきます。
0.8 などの大きな正の値なら、「よく勉強する人ほど点数が高い傾向が強い」と読めます。

売上と広告費の相関

C 列:広告費
D 列:売上

C2:C13 に 12 ヶ月分の広告費、D2:D13 に 12 ヶ月分の売上が入っているとします。
このとき、相関係数は次のように求められます。

=CORREL($C$2:$C$13, $D$2:$D$13)

0.6〜0.7 程度の正の相関が出れば、「広告費を増やすと売上も増えやすい傾向がある」といった読み方ができます。


実務での使いどころと注意点

「関係がありそう」を数字で確かめる

相関係数は、なんとなく「関係ありそう」と感じている 2 つの指標について、
それが本当に一緒に動いているのかを数字で確かめるのに向いています。

例えば、
売上と来店客数、
離職率と残業時間、
満足度スコアとリピート率、
などの組み合わせで CORREL を使うと、「感覚」が「数値」になります。

「相関=因果関係」ではない

とても大事なポイントとして、
相関が高いからといって「片方が原因で、もう片方が結果」とは限りません。

たとえば、「アイスの売上」と「熱中症の件数」は強い正の相関がありますが、
アイスが熱中症を引き起こしているわけではなく、「気温」という共通の要因があるだけ、ということもあります。

CORREL はあくまで「一緒に動いているかどうか」を見る道具であって、
「どちらが原因か」を決める道具ではない、ということは頭の片隅に置いておくと安心です。


例題

問題1

A2:A31 に 30 人分の「勉強時間(時間)」、B2:B31 に同じ 30 人分の「テスト点数」が入っています。
この 2 つのデータの相関係数を求める式を、CORREL を使って書いてください。
また、その結果が 0.85 だった場合、「勉強時間と点数の関係」をどのように解釈できるか、自分の言葉で説明してください。

問題2

C2:C13 に 12 ヶ月分の「広告費」、D2:D13 に同じ 12 ヶ月分の「売上」が入っています。
この 2 つのデータの相関係数を求める式を書き、その結果が 0.1 だった場合と 0.7 だった場合で、
広告費と売上の関係をどう読み分けるかを説明してください。

問題3

相関係数が −0.75 という結果になったとします。
このとき、「2 つの変数の関係」はどのような傾向にあると言えそうかを説明してください。
また、「負の相関」が現れそうな現実の例を 1 つ挙げてみてください。

問題4

CORREL で相関係数を計算するとき、配列1 と配列2 の「行数(データ数)」が一致していないとエラーになります。
なぜ同じ長さである必要があるのかを、「1 行ごとにペアになっている」という視点から説明してください。

問題5

相関係数が高い 2 つの指標があったとします。
それを見てすぐに「A が B の原因だ」と決めつけてしまうのは危険です。
「相関」と「因果」の違いを、自分の言葉で整理しながら、
CORREL の結果をどのようなスタンスで受け取るべきかを書いてみてください。

タイトルとURLをコピーしました