随机森林怎么使用交叉验证训练集和测试集 python代码
时间: 2024-05-01 08:17:24 浏览: 109
决策树、随机森林和极度随机森林的交叉验证评分的python代码
这个问题可以回答,以下是使用交叉验证训练集和测试集的随机森林的Python代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_score
# 假设数据已经被分为 X_train, X_test, y_train, y_test
# 训练随机森林分类器
rfc = RandomForestClassifier(n_estimators=10)
rfc.fit(X_train, y_train)
# 使用交叉验证评估性能
scores = cross_val_score(estimator=rfc, X=X_train, y=y_train, cv=5)
print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() * 2))
# 在测试集上评估性能
accuracy = rfc.score(X_test, y_test)
print("Accuracy on test set: %0.2f" % accuracy)
```
在以上代码中,我们首先使用训练集训练了一个随机森林分类器,并使用交叉验证来评估其性能。接着,我们使用测试集对训练好的模型进行了评估。
阅读全文