• 標本共分散:2つの変数の標本平均からの偏差の積の平均cov(x,y)
    sum(xの各要素-xの平均値)*(yの各要素-yの平均値)/xまたはyの要素数
    標本共分散の式
  • 標本相関係数:標本共分散を各変数の分散で割ったもの。
    直線の関係の強さを-1~1であらわす。cor(x,y)
    標本相関係数の式
  • 標本共分散と標本関数係数の関係を下図で説明する。
    身長と体重の標本分散と標本相関係数を求めている。
    身長をmとcmの2つの単位の場合で共分散を求めると、結果は2.25と225で違っていることがわかる。
    これでは単位が変わっただけで共分散の値が変わってしまう。そこで単位の影響を受けない
    相関係数をcor()で求めることで、相関の強さを単位の影響を受けずに求めることができる。
    covは、引数をtall_mの場合とtall_cmの場合と変えても、結果は同じになっている。

    cor() cov()