GridSearchCV函数解析
时间: 2023-11-11 13:02:54 浏览: 90
GridSearchCV函数是sklearn库中的一种网格搜索算法,可以用于对模型的超参数进行调优。
函数的主要参数包括:
1. estimator:使用的分类器,比如RandomForestClassifier()。
2. param_grid:需要优化的参数字典,比如{'n_estimators': [10, 20, 30]}。
3. scoring:模型评价标准,默认为None,即使用estimator的误差估计函数。
4. cv:交叉验证参数,默认为None,使用默认的3折交叉验证。
5. n_jobs:并行数,int类型,-1表示使用全部处理器。
6. verbose:日志冗长度,int类型。
7. refit:默认为True,程序将在搜索参数结束后,用最佳参数结果再次fit一遍全部数据集。
函数的返回值包括:
1. best_params_:最佳参数的组合。
2. best_score_:最佳结果得分。
3. best_estimator_:最佳模型。
示例代码如下:
```python
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier
param_grid = {
'n_estimators': [10, 20, 30],
'max_depth': [5, 10, 15]
}
rfc = RandomForestClassifier()
clf = GridSearchCV(rfc, param_grid=param_grid, cv=3)
clf.fit(X_train, y_train)
print(clf.best_params_)
print(clf.best_score_)
print(clf.best_estimator_)
```
阅读全文