GridSearchCV使用
时间: 2024-03-01 16:46:06 浏览: 27
GridSearchCV是一种用于系统地遍历多种参数组合以及模型的方法,以便于找到最佳模型的技术。下面是GridSearchCV的使用方法:
1. 导入所需的库和模型
```python
from sklearn.model_selection import GridSearchCV
from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
```
2. 定义Pipeline和参数字典
```python
pipeline = Pipeline([
('clf', SVC(kernel='rbf', gamma=0.1))
])
parameters = {
'clf__C': (0.1, 1, 10),
'clf__gamma': (0.1, 0.01)
}
```
3. 创建GridSearchCV对象
```python
grid_search = GridSearchCV(pipeline, parameters, n_jobs=-1, verbose=1, scoring='accuracy', cv=5)
```
4. 训练模型并输出最佳参数和得分
```python
grid_search.fit(X_train, y_train)
print("Best score: %0.3f" % grid_search.best_score_)
print("Best parameters set:")
best_parameters = grid_search.best_estimator_.get_params()
for param_name in sorted(parameters.keys()):
print("\t%s: %r" % (param_name, best_parameters[param_name]))
```
其中,Pipeline是一种将多个步骤组合在一起的方法,可以将数据预处理、特征提取和分类器等步骤组合在一起。参数字典中的键是Pipeline中的步骤名称和参数名称的组合,值是要搜索的参数值的列表。GridSearchCV对象将Pipeline和参数字典作为输入,并使用交叉验证来评估每个参数组合的性能。最后,输出最佳参数和得分。