二つの現象、データに相関関係があるかどうかを数学的に求めることができ、相関係数と言います。
計算は面倒なのですが、Excelに「CORREL」というワークシート関数があり、これを使えば簡単に求められます。
A 1 2 3 4 5 6 7 8 9 10 B 1 2 3 4 5 6 7 8 9 10
この場合、配列Aと配列Bの相関係数は1.0になります。
両方とも全く同じ値の場合はこうなります。
A 1 2 3 4 5 6 7 8 9 10 B 2 4 6 8 10 12 14 16 18 20
B=A*2の場合、相関関係があると言えます。
相関係数はやはり1.0になります。
A 1 2 3 4 5 6 7 8 9 10 B 11 12 13 14 15 16 17 18 19 20
B=A+10の場合、これも相関関係があると言えます。
相関係数はやはり1.0になります。
A 1 2 3 4 5 6 7 8 9 10 B 10 9 8 7 6 5 4 3 2 1
AとBが全く逆に動く場合、これも相関関係があると言えます。
ただし相関係数は-1.0になります。
つまり相関関係がある場合は1.0、逆の相関関係がある場合は-1.0となります。
一方、相関関係がない場合は0.0になります。
A 1 2 3 4 5 6 7 8 9 10 B 465 364 272 167 311 331 101 746 633 439
Aは順番ですが、Bはランダムです。これは相関関係がありません。
実際に相関係数を調べると0.36となり、0.0に近付きます。
「0.36は、0.0から結構、離れているのではないか」と思われるかもしれません。実はランダムの場合、要素が10個では相関係数を0.0にするのは難しいのです。要素を増やす必要があります。
A 1 2 3 4 5 6 7 8 9 10 B 5 4 3 2 1 1 2 3 4 5
Bを前半を降順、後半を昇順にしました。この場合、要素が10個でも相関係数は0.0になります。
コメント