jupyter绘制roc曲线
时间: 2024-05-20 08:09:29 浏览: 162
Jupyter是一个交互式笔记本,支持多种编程语言,包括Python。Jupyter Notebook可用于数据分析、数据可视化、机器学习等方面的工作。绘制ROC曲线是二分类问题中的一项重要工作,可以用于评估分类模型的性能。
下面是使用Python和Jupyter Notebook绘制ROC曲线的基本步骤:
1. 导入需要的库和数据集。
```python
import pandas as pd
import numpy as np
from sklearn import metrics
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=1000, n_classes=2, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
2. 训练一个分类模型并预测测试集的结果。
```python
model = LogisticRegression()
model.fit(X_train, y_train)
y_pred_proba = model.predict_proba(X_test)[:,1]
```
3. 计算ROC曲线的参数。
```python
fpr, tpr, thresholds = metrics.roc_curve(y_test, y_pred_proba)
roc_auc = metrics.auc(fpr, tpr)
```
4. 绘制ROC曲线。
```python
import matplotlib.pyplot as plt
plt.title('Receiver Operating Characteristic')
plt.plot(fpr, tpr, 'b', label = 'AUC = %0.2f' % roc_auc)
plt.legend(loc = 'lower right')
plt.plot([0, 1], [0, 1],'r--')
plt.xlim([0, 1])
plt.ylim([0, 1])
plt.ylabel('True Positive Rate')
plt.xlabel('False Positive Rate')
plt.show()
```
阅读全文