集成学习bagging运行python代码
时间: 2024-10-07 22:05:31 浏览: 25
集成学习中的Bagging(Bootstrap Aggregating),也称为自助法(Bootstrap aggregating)或随机森林(Random Forest),是一种通过构建多个决策树并结合它们的预测结果来提高模型稳定性和预测准确性的技术。在Python中,可以使用Scikit-Learn库来实现Bagging算法,如随机森林。
以下是使用scikit-learn实现随机森林的一个简单例子:
```python
# 导入所需的库
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建随机森林分类器
rf = RandomForestClassifier(n_estimators=100, # 树的数量
random_state=42) # 设置随机种子保证结果可复现
# 训练模型
rf.fit(X_train, y_train)
# 预测
y_pred = rf.predict(X_test)
# 性能评估
print("Accuracy:", np.mean(y_pred == y_test))
# 如果你想保存模型,可以这样做
# from joblib import dump
# dump(rf, 'random_forest_model.joblib')
```
在这个代码片段中,我们首先加载了一个经典的鸢尾花数据集,然后划分数据为训练集和测试集。接着创建一个随机森林分类器,并训练它。最后,我们用测试集来评估模型的性能。
阅读全文