KNN算法和决策树算法进行心脏病预测的模型评估Roc曲线和AUC
时间: 2024-03-02 13:54:07 浏览: 68
使用机器学习识别心脏病预测
以下是KNN算法和决策树算法进行心脏病预测的模型评估ROC曲线和AUC的Python代码:
```python
# 导入模块和数据集
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import roc_curve, auc
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
data = load_breast_cancer()
X = data.data
y = data.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# KNN算法
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)
knn_y_score = knn.predict_proba(X_test)[:, 1]
fpr_knn, tpr_knn, thresholds_knn = roc_curve(y_test, knn_y_score)
roc_auc_knn = auc(fpr_knn, tpr_knn)
# 决策树算法
dt = DecisionTreeClassifier(max_depth=3, random_state=42)
dt.fit(X_train, y_train)
dt_y_score = dt.predict_proba(X_test)[:, 1]
fpr_dt, tpr_dt, thresholds_dt = roc_curve(y_test, dt_y_score)
roc_auc_dt = auc(fpr_dt, tpr_dt)
# 绘制ROC曲线
lw = 2
plt.plot(fpr_knn, tpr_knn, color='darkorange', lw=lw, label='KNN算法 (AUC = %0.2f)' % roc_auc_knn)
plt.plot(fpr_dt, tpr_dt, color='green', lw=lw, label='决策树算法 (AUC = %0.2f)' % roc_auc_dt)
plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('假正率')
plt.ylabel('真正率')
plt.title('ROC曲线')
plt.legend(loc="lower right")
plt.show()
```
请注意,这里使用了 Sklearn 中的“乳腺癌”数据集来进行演示。你可以根据自己的数据集进行适当的修改。
阅读全文