随机森林参数优化调包代码
时间: 2024-04-18 18:22:56 浏览: 82
当进行随机森林参数优化时,可以使用网格搜索(Grid Search)或者随机搜索(Random Search)的方法来寻找最佳参数组合。下面是一个使用网格搜索的示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
# 定义参数范围
param_grid = {
'n_estimators': [100, 200, 300],
'max_depth': [None, 5, 10],
'min_samples_split': [2, 5, 10],
'min_samples_leaf': [1, 2, 4]
}
# 创建随机森林分类器
rf = RandomForestClassifier()
# 使用网格搜索进行参数优化
grid_search = GridSearchCV(estimator=rf, param_grid=param_grid, cv=5)
grid_search.fit(X_train, y_train)
# 输出最佳参数组合和对应的模型评分
print("Best parameters found: ", grid_search.best_params_)
print("Best score: ", grid_search.best_score_)
```
在上述代码中,我们首先定义了一些参数的范围,例如`n_estimators`表示决策树的数量,`max_depth`表示决策树的最大深度等。然后创建了一个随机森林分类器`rf`,并使用`GridSearchCV`进行网格搜索。最后输出了找到的最佳参数组合和对应的模型评分。
阅读全文