皮尔逊相关系数 特征选择python
时间: 2023-11-05 21:04:26 浏览: 175
皮尔森相关系数1的python代码
在Python中,可以使用SciPy库中的`pearsonr()`函数来计算皮尔逊相关系数。首先,确保已经安装了SciPy库,然后可以按照以下步骤进行特征选择:
1. 导入所需的库:
```python
import pandas as pd
import numpy as np
from scipy.stats import pearsonr
```
2. 加载数据集:
```python
data = pd.read_csv('data.csv') # 假设数据保存在名为'data.csv'的文件中
```
3. 选择要计算相关系数的特征列:
```python
feature_columns = ['feature1', 'feature2', 'feature3'] # 假设有三个特征:feature1,feature2和feature3
```
4. 计算皮尔逊相关系数:
```python
correlation_coeffs = []
for col in feature_columns:
corr, _ = pearsonr(data[col], data['target']) # 假设'target'是目标变量
correlation_coeffs.append(abs(corr))
# 打印每个特征对目标变量的相关系数
for i, col in enumerate(feature_columns):
print(f"Correlation coefficient between {col} and target: {correlation_coeffs[i]}")
```
以上代码将计算每个特征与目标变量之间的皮尔逊相关系数,并打印出结果。可以根据相关系数的大小来选择与目标变量相关性较强的特征。
阅读全文