相关系数r是用来衡量两个变量之间线性关系强度和方向的统计量,其计算公式如下:
```
r = Cov(X, Y) / (SD(X) * SD(Y))
```
其中:
`Cov(X, Y)` 表示变量X和Y的协方差;
`SD(X)` 和 `SD(Y)` 分别表示变量X和Y的标准差;
`n` 表示样本量,即数据点的数量。
具体计算步骤如下:
1. 计算协方差 `Cov(X, Y)`,其公式为:
```
Cov(X, Y) = Σ[(Xi - X平均值) * (Yi - Y平均值)] / n
```
2. 分别计算变量X和Y的标准差 `SD(X)` 和 `SD(Y)`,其公式为:
```
SD(X) = √[Σ(Xi - X平均值)² / n]
SD(Y) = √[Σ(Yi - Y平均值)² / n]
```
3. 将计算得到的协方差和标准差代入相关系数的公式中,得到相关系数r的值。
相关系数r的取值范围是 `[-1, 1]`:
`r = 1` 表示两个变量完全正相关;
`r = -1` 表示两个变量完全负相关;
`r = 0` 表示两个变量之间没有线性关系。
需要注意的是,相关系数只能衡量线性关系,不能反映非线性关系。此外,相关系数不代表因果关系