pandas中corr
时间: 2024-10-29 07:18:10 浏览: 21
数据特征分析:相关性分析(Pandas中的corr方法)
在Pandas库中,`corr()`函数是一个非常常用的数据分析工具,主要用于计算DataFrame或Series中两个或多个列之间的一致性或相关性。它基于Pearson相关系数(默认)或其他内积公式(如Spearman秩相关或Kendall Tau)来衡量数值型数据之间的线性相关程度。
当你调用`df.corr()`时,它会返回一个矩阵,其中行和列对应于DataFrame的每一列,矩阵的元素表示两列之间的相关系数。这个矩阵是对称的,意味着如果A列和B列的相关系数是0.8,那么B列和A列的相关系数也将是0.8。
`corr()`函数还可以接受其他参数,如`method`参数用于指定相关性计算方法(如默认的"pearson",还有"kendall"、"spearman"等)。对于非数值类型的列,`corr()`会忽略它们。
例如:
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [4, 5, 6, 7], 'C': ['a', 'b', 'c', 'd']})
correlation_matrix = df.corr()
```
这将返回一个显示'A'、'B'列间相关性的矩阵。
阅读全文