2変数の関係
目次
基本統計量
データのばらつき
2変数の関係
相関を求める練習
課題
標本共分散:2つの変数の標本平均からの偏差の積の平均cov(x,y)
sum(xの各要素-xの平均値)*(yの各要素-yの平均値)/xまたはyの要素数
標本相関係数:標本共分散を各変数の分散で割ったもの。
直線の関係の強さを-1~1であらわす。cor(x,y)
標本共分散と標本関数係数の関係を下図で説明する。
身長と体重の標本分散と標本相関係数を求めている。
身長をmとcmの2つの単位の場合で共分散を求めると、結果は2.25と225で違っていることがわかる。
これでは単位が変わっただけで共分散の値が変わってしまう。そこで単位の影響を受けない
相関係数をcor()で求めることで、相関の強さを単位の影響を受けずに求めることができる。
covは、引数をtall_mの場合とtall_cmの場合と変えても、結果は同じになっている。