dataframe. corr怎么用
时间: 2023-07-05 18:11:19 浏览: 129
dataframe.corr()是Pandas中DataFrame对象的一个方法,用于计算DataFrame中列之间的相关性。具体用法如下:
1.默认情况下,DataFrame.corr()计算所有列对之间的相关性。
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
print(df.corr())
```
输出:
```
A B C
A 1.0 1.0 1.0
B 1.0 1.0 1.0
C 1.0 1.0 1.0
```
2.可以通过参数method指定使用哪种相关系数计算方法,支持的方法有pearson、kendall和spearman。
```python
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]})
print(df.corr(method='pearson'))
```
输出:
```
A B C
A 1.0 1.0 1.0
B 1.0 1.0 1.0
C 1.0 1.0 1.0
```
3.可以通过参数min_periods指定计算相关性所需的最小非空观测数。
```python
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(10, 3), columns=['A', 'B', 'C'])
df.iloc[3:5, 0] = np.nan
df.iloc[4:6, 1] = np.nan
df.iloc[5:8, 2] = np.nan
print(df.corr(min_periods=5))
```
输出:
```
A B C
A 1.000000 -0.259638 -0.907272
B -0.259638 1.000000 0.040044
C -0.907272 0.040044 1.000000
```
以上就是使用DataFrame.corr()计算DataFrame中列之间相关性的方法。
阅读全文