皮尔逊相关系数/热力图python
时间: 2024-09-22 22:02:46 浏览: 61
皮尔逊相关系数(Pearson correlation coefficient),也称为皮尔逊积差相关系数,是一种衡量两个变量之间线性关系强度和方向的统计量,其值范围从-1到+1,其中0表示无相关性,正数表示正向相关,负数表示负向相关。
在Python中,你可以使用`scipy.stats`库中的`pearsonr()`函数来计算皮尔逊相关系数。例如:
```python
from scipy import stats
# 假设你有两个数组 x 和 y
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
# 计算皮尔逊相关系数和p值
corr, p_value = stats.pearsonr(x, y)
print("皮尔逊相关系数:", corr)
```
至于热力图(Heatmap),它是一种可视化工具,用于展示数值数据矩阵中元素间的相似度或关联程度。在Python中,你可以使用seaborn或matplotlib等库来创建热力图,如`heatmap`函数,配合皮尔逊相关系数来呈现数据的相关性。假设我们有一个二维数组data:
```python
import seaborn as sns
import numpy as np
# 创建随机数据
data = np.random.rand(10, 10)
# 使用seaborn绘制热力图
sns.heatmap(data, annot=True, cmap='coolwarm', center=0,
cbar_kws={'label': '皮尔逊相关系数'})
plt.show()
```
这里,`cmap='coolwarm'`指定了颜色映射方案,`center=0`将颜色对齐到零,`annot=True`显示每个单元格的值。
阅读全文