特征选择辅助印第安人糖尿病诊断,用递归特征消除(RFE),和逻辑回归进行分类预测 python代码
时间: 2024-02-12 19:07:54 浏览: 85
糖尿病预测Python
5星 · 资源好评率100%
好的,以下是示例代码:
```python
# 导入需要的库
import pandas as pd
from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression
# 读取数据
data = pd.read_csv('diabetes.csv')
# 分割数据集
X = data.drop('Outcome', axis=1)
y = data['Outcome']
# 特征选择
model = LogisticRegression()
rfe = RFE(model, n_features_to_select=3)
X_rfe = rfe.fit_transform(X, y)
# 输出选择的特征
print("选择的特征:", X.columns[rfe.support_])
# 模型训练
model.fit(X_rfe, y)
# 预测
sample_data = [[5, 166, 72, 19, 175, 25.8, 0.587, 51]]
sample_data_rfe = rfe.transform(sample_data)
prediction = model.predict(sample_data_rfe)
# 输出预测结果
if prediction == 1:
print("糖尿病检测结果:阳性")
else:
print("糖尿病检测结果:阴性")
```
注意,这只是一个示例代码,具体的数据集和特征选择参数需要根据实际情况进行调整。
阅读全文