如何计算两组变量的皮尔逊系数,举例说明
时间: 2024-05-25 16:15:29 浏览: 6
皮尔逊系数是评价两个变量之间线性相关程度的一种方法。它的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无相关性。
为了计算两组变量的皮尔逊系数,需要先将它们的数据进行标准化处理,即将每个数据点减去其所在组的平均值,再除以该组的标准差。然后,将两组变量标准化后的数据点一一对应,计算它们的乘积之和,再除以数据点的总数减1即可得到皮尔逊系数。具体公式如下:
r = ∑(x - x̄)(y - ȳ) / [(n-1) * s_x * s_y]
其中,r表示皮尔逊系数,x和y分别表示两组变量,x̄和ȳ分别表示两组变量的平均值,s_x和s_y分别表示两组变量的标准差,n表示数据点的总数。
举例来说,假设有两组变量x和y,它们的数据如下:
x = [3, 5, 7, 9, 11]
y = [2, 4, 6, 8, 10]
首先,需要计算x和y的平均值和标准差:
x̄ = (3+5+7+9+11) / 5 = 7
ȳ = (2+4+6+8+10) / 5 = 6
s_x = sqrt([(3-7)^2 + (5-7)^2 + (7-7)^2 + (9-7)^2 + (11-7)^2] / (5-1)) = 3.16
s_y = sqrt([(2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2] / (5-1)) = 2.83
然后,将x和y标准化后的数据点一一对应,计算它们的乘积之和:
∑(x - x̄)(y - ȳ) = (3-7)*(2-6) + (5-7)*(4-6) + (7-7)*(6-6) + (9-7)*(8-6) + (11-7)*(10-6) = 20
最后,将乘积之和除以数据点的总数减1即可得到皮尔逊系数:
r = ∑(x - x̄)(y - ȳ) / [(n-1) * s_x * s_y] = 20 / (4 * 3.16 * 2.83) = 0.99
因为结果接近于1,说明x和y之间存在很强的正相关关系。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)