什么叫pearson相关系数,用简单的小例子说明他的含义以及计算过程
时间: 2023-08-17 09:05:05 浏览: 70
Pearson相关系数是一种用于衡量两个变量之间线性关系强度的统计量。它的取值范围为-1到1之间,值越接近于1或-1,表示两个变量的线性关系越强;值越接近于0,表示两个变量之间的线性关系越弱。
举个例子,我们想要了解身高和体重之间的相关性。假设我们有一个样本数据集,其中包含了10个人的身高和体重数据如下:
```
身高(cm) 体重(kg)
170 65
165 56
180 75
175 68
160 50
150 45
185 80
190 85
155 52
162 58
```
为了计算这两个变量之间的相关系数,我们可以按照以下步骤进行:
1. 分别计算身高和体重的平均数。在这个例子中,身高的平均数为171.2,体重的平均数为63.4。
2. 计算每个人的身高和体重与平均数之间的差值。例如,第一个人的身高为170,平均身高为171.2,因此其差值为-1.2;体重同理。
3. 将每个人的身高和体重的差值相乘,然后将结果求和。例如,第一个人的身高差值为-1.2,体重差值为1.6,两者相乘得到-1.92。将所有人的身高和体重差值相乘并求和得到-30.84。
4. 计算每个人的身高和体重与平均数之间的差值的平方,然后将结果求和。例如,第一个人的身高差值为-1.2,平方为1.44;体重同理。将所有人的身高和体重差值平方并求和得到472.56。
5. 将步骤3中得到的结果除以步骤4中得到的结果的平方根。在这个例子中,步骤4中得到的结果的平方根为21.73,因此步骤3中得到的结果除以21.73得到-1.42。
6. 得到的结果就是身高和体重之间的Pearson相关系数,也就是-1.42。由于取值范围为-1到1之间,因此这个结果表示身高和体重之间存在一个强烈的负相关关系。
需要注意的是,Pearson相关系数只能用于衡量两个变量之间的线性关系,如果两个变量之间的关系不是线性的,那么计算出来的结果可能不准确。此外,Pearson相关系数只能衡量两个变量之间的关系,不能用于衡量多个变量之间的关系。