皮尔逊相关系数的计算
时间: 2023-11-22 09:05:57 浏览: 141
Python 余弦相似度与皮尔逊相关系数 计算实例
皮尔逊相关系数是用来衡量两个变量之间线性关系强度和方向的统计量。它的计算公式为:
![Pearson correlation formula](https://wikimedia.org/api/rest_v1/media/math/render/svg/7678e3a9ade73c381d2d7b0056b77a4b253fbaeb)
其中,x 和 y 分别是两个变量的观察值,μx 和 μy 是它们的均值,σx 和 σy 是它们的标准差。这个公式可以用来计算样本相关系数(使用样本均值和样本标准差)或者总体相关系数(使用总体均值和总体标准差)。
计算过程可以分为以下几个步骤:
1. 计算 x 和 y 的均值,记为 x̄ 和 ȳ。
2. 计算 x 和 y 的标准差,记为 sx 和 sy。
3. 将 x 和 y 的观察值减去各自的均值,得到差值 dx 和 dy。
4. 将 dx 和 dy 分别除以相应的标准差,得到标准化后的差值 z_x 和 z_y。
5. 将 z_x 和 z_y 对应位置相乘得到乘积 z_xy。
6. 求取乘积 z_xy 的均值,即为皮尔逊相关系数 r。
请注意,计算中要确保两个变量的样本大小相同,并且要注意处理可能存在的缺失值或异常值。
阅读全文