决策树模型的评价指标,python代码
时间: 2024-08-12 14:10:02 浏览: 119
决策树模型的评价指标主要用来衡量模型的性能和泛化能力,以下是一些常用的指标:
1. 准确率(Accuracy): 最基本的性能度量,表示分类正确的样本数占总样本数的比例。
2. 精确率(Precision): 对于某一类别,被模型预测为该类别的样本中,实际确实是该类别的比例。
3. 召回率(Recall): 对于某一类别,实际属于该类别的样本中,被模型正确预测为该类别的比例。
4. F1分数(F1 Score): 精确率和召回率的调和平均数,综合了两者的表现。
5. AUC-ROC曲线:ROC曲线下的面积(Area Under Curve),用于评估二分类模型的整体性能。
6. 均方误差(Mean Squared Error, MSE): 回归问题中常用,计算预测值与真实值之差的平方的平均。
7. R²得分:也称为决定系数,回归问题中衡量模型拟合优度的一个统计量。
在Python中,`sklearn`库提供了计算这些指标的函数。例如,使用`classification_report`函数计算分类报告,包括精确率、召回率和F1分数:
```python
from sklearn.metrics import classification_report
# 假设y_true是真实标签,y_pred是预测标签
report = classification_report(y_true, y_pred)
print(report)
```
对于回归任务,可以使用`mean_squared_error`或`r2_score`:
```python
from sklearn.metrics import mean_squared_error, r2_score
# 假设y_true是真实值,y_pred是预测值
mse = mean_squared_error(y_true, y_pred)
r2 = r2_score(y_true, y_pred)
print("Mean Squared Error:", mse)
print("R² Score:", r2)
```
阅读全文