Python代码实现:1、数据文件seeds.csv 。 2、构造logistic regression 模型 3、 参考demo.py, 构造roc曲线,计算F1,准确率。
时间: 2023-06-17 14:04:55 浏览: 129
Model2_Seeds小麦数据品种聚类探索.zip
以下是你需要的代码实现:
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_curve, f1_score, accuracy_score
# 读取数据
data = pd.read_csv('seeds.csv')
# 划分特征和标签
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 构造模型并训练
model = LogisticRegression()
model.fit(X, y)
# 计算预测结果
y_pred = model.predict(X)
y_pred_prob = model.predict_proba(X)[:, 1]
# 计算F1和准确率
f1 = f1_score(y, y_pred)
accuracy = accuracy_score(y, y_pred)
# 构造ROC曲线
fpr, tpr, thresholds = roc_curve(y, y_pred_prob)
plt.plot(fpr, tpr)
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve')
plt.show()
print('F1 score: {:.2f}'.format(f1))
print('Accuracy: {:.2f}%'.format(accuracy*100))
```
你需要将代码保存为.py文件,并将seeds.csv数据文件与.py文件放在同一目录下运行。
阅读全文