随机森林 sklearn
时间: 2023-10-04 20:04:39 浏览: 97
RForest.rar_rforest_机器学习sklearn中随机森林的实现
随机森林是一种集成学习算法,它通过构建多个决策树来进行预测。在sklearn库中,可以使用RandomForestClassifier(用于分类问题)和RandomForestRegressor(用于回归问题)来实现随机森林算法。
这里是一个使用随机森林进行分类的示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 生成一些示例数据
X, y = make_classification(n_samples=1000, n_features=4, random_state=0, shuffle=False)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 创建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=0)
# 在训练集上拟合模型
clf.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = clf.predict(X_test)
# 输出预测结果
print(y_pred)
```
你可以根据实际问题调整随机森林的参数,如n_estimators(决策树的数量),max_depth(决策树的最大深度)等。同时,sklearn还提供了其他用于评估模型性能的函数和工具,例如accuracy_score、confusion_matrix等。
阅读全文