bagging = BaggingClassifier(n_estimators=10)
时间: 2024-02-09 15:08:43 浏览: 24
这行代码创建了一个基于Bagging算法的分类器对象。`n_estimators`参数指定了使用多少个基分类器进行集成,这里设置为10个。可以通过设置其他参数来调整模型的性能和效果,例如:
- `base_estimator`:指定使用的基分类器,默认为决策树分类器。
- `max_samples`:指定每个基分类器在训练时从原始数据集中进行有放回抽样的样本数,用于构建不同的训练数据集。
- `max_features`:指定每个基分类器在训练时从原始数据集中进行有放回抽样的特征数,用于构建不同的特征子集。
- `bootstrap`:指定是否使用Bootstrap抽样方法进行有放回抽样,默认为True。
可以通过调用`fit()`方法来训练Bagging分类器,并使用`predict()`方法来进行预测。例如:
```python
from sklearn.datasets import load_iris
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
# 加载鸢尾花数据集
iris = load_iris()
X, y = iris.data, iris.target
# 构建基分类器
dtc = DecisionTreeClassifier()
# 构建Bagging分类器
bagging = BaggingClassifier(base_estimator=dtc, n_estimators=10)
# 训练模型
bagging.fit(X, y)
# 预测新样本
new_sample = [[5.1, 3.5, 1.4, 0.2]]
prediction = bagging.predict(new_sample)
print(prediction)
```
在上面的代码中,我们加载了鸢尾花数据集,并构建了一个基于决策树分类器的Bagging分类器,使用`fit()`方法训练模型,然后使用`predict()`方法对新样本进行预测。