随机森林预测模型评估 python
时间: 2024-05-25 22:09:05 浏览: 188
随机森林是一种常用的机器学习算法,它是基于决策树构建的一种集成学习算法。在使用随机森林预测模型时,我们需要对其进行评估以确定其性能和准确性。常用的评估指标包括:
1. 准确率(Accuracy):分类正确的样本数占总样本数的比例。
2. 精确率(Precision):在所有预测为正例的样本中,真正为正例的样本数占比。
3. 召回率(Recall):在所有真正为正例的样本中,被预测为正例的样本数占比。
4. F1值:综合考虑了精确率和召回率,是它们的调和平均数。
在 Python 中,可以使用 scikit-learn 库中的 classification_report 函数对随机森林预测模型进行评估。下面是一个示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3)
rfc = RandomForestClassifier(n_estimators=10)
rfc.fit(X_train, y_train)
y_pred = rfc.predict(X_test)
report = classification_report(y_test, y_pred)
print(report)
```
以上代码中,我们使用了 iris 数据集进行训练和测试,并使用了 n_estimators=10 的随机森林分类器。最后使用 classification_report 函数打印出了模型的评估报告。
阅读全文