bagging代码李沐
时间: 2025-01-17 21:05:28 浏览: 25
Bagging,全称Bootstrap Aggregating,是机器学习中一种集成学习的技术,由Leo Breiman提出,主要用于决策树等模型的并行训练。它的核心思想是通过从原始数据集中有放回地抽样创建许多小样本集(bootstrapped samples),然后针对每个子样本集独立训练一个模型。在Python中,Scikit-Learn库提供了一个简单易用的接口来进行bagging。
李沐(Ming Liu)是一位知名的开源贡献者,他在scikit-learn项目中对bagging算法的实现做出了重要贡献。在Scikit-Learn中,可以使用ensemble
模块下的BaggingClassifier
和BaggingRegressor
类来应用bagging方法于分类和回归任务上,比如:
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
# 创建基础模型(例如决策树)
base_estimator = DecisionTreeClassifier()
# 使用bagging
bag_clf = BaggingClassifier(base_estimator=base_estimator,
n_estimators=100, # 训练多少个决策树
max_samples=0.7, # 每次抽取样本的比例
random_state=42) # 设置随机种子保证结果可复现
# 训练模型
bag_clf.fit(X_train, y_train)
# 预测
y_pred = bag_clf.predict(X_test)
相关推荐

















