相关系数是衡量两个变量之间线性相关程度的统计量,其计算公式为:
\[ r = \frac{Cov(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} \]
其中:
\(r\) 是相关系数;
\(Cov(X,Y)\) 是变量 \(X\) 和 \(Y\) 的协方差;
\(D(X)\) 和 \(D(Y)\) 分别是变量 \(X\) 和 \(Y\) 的方差。
相关系数的值介于 -1 和 1 之间,其中:
\(r = 1\) 表示完全正相关;
\(r = -1\) 表示完全负相关;
\(r = 0\) 表示没有线性关系。
相关系数越接近 \(1\) 或 \(-1\),表示两个变量的线性关系越强;越接近 \(0\),表示两个变量之间没有明显的线性关系。
需要注意的是,相关系数只能衡量线性关系,不能反映非线性关系。此外,相关系数不是等距或等比变量,它只能比较大小,不能直接做加减乘除运算