相関係数とは何か、具体的な例で確認

二つの現象、データに相関関係があるかどうかを数学的に求めることができ、相関係数と言います。
計算は面倒なのですが、Excelに「CORREL」というワークシート関数があり、これを使えば簡単に求められます。

A 1 2 3 4 5 6 7 8 9 10
B 1 2 3 4 5 6 7 8 9 10

この場合、配列Aと配列Bの相関係数は1.0になります。
両方とも全く同じ値の場合はこうなります。

A 1 2 3 4  5  6  7  8  9 10
B 2 4 6 8 10 12 14 16 18 20

B=A*2の場合、相関関係があると言えます。
相関係数はやはり1.0になります。

A  1  2  3  4  5  6  7  8  9 10
B 11 12 13 14 15 16 17 18 19 20

B=A+10の場合、これも相関関係があると言えます。
相関係数はやはり1.0になります。

A  1 2 3 4 5 6 7 8 9 10
B 10 9 8 7 6 5 4 3 2  1

AとBが全く逆に動く場合、これも相関関係があると言えます。
ただし相関係数は-1.0になります。

つまり相関関係がある場合は1.0、逆の相関関係がある場合は-1.0となります。
一方、相関関係がない場合は0.0になります。

A   1   2   3   4   5   6   7   8   9  10
B 465 364 272 167 311 331 101 746 633 439

Aは順番ですが、Bはランダムです。これは相関関係がありません。
実際に相関係数を調べると0.36となり、0.0に近付きます。
「0.36は、0.0から結構、離れているのではないか」と思われるかもしれません。実はランダムの場合、要素が10個では相関係数を0.0にするのは難しいのです。要素を増やす必要があります。

A 1 2 3 4 5 6 7 8 9 10
B 5 4 3 2 1 1 2 3 4  5

Bを前半を降順、後半を昇順にしました。この場合、要素が10個でも相関係数は0.0になります。

コメント

タイトルとURLをコピーしました