集成学习几个模型python代码
时间: 2024-12-15 08:12:22 浏览: 2
集成学习是一种通过结合多个弱模型来创建强大预测模型的技术。在Python中,常用的集成学习库如Scikit-learn提供了多种集成算法的实现。这里简单介绍两个常见的集成模型及其代码示例:
1. **随机森林(Random Forest)**:
```python
from sklearn.ensemble import RandomForestClassifier
import pandas as pd
# 假设df_data是数据集,'target'列是目标变量
X = df_data.drop('target', axis=1)
y = df_data['target']
# 创建并训练随机森林模型
model = RandomForestClassifier(n_estimators=100) # n_estimators设定树的数量
model.fit(X, y)
# 对新的数据进行预测
new_data = ... # 新的数据实例
prediction = model.predict(new_data)
```
2. **梯度提升机(Gradient Boosting Machine, GBM)**:
```python
from sklearn.ensemble import GradientBoostingClassifier
import xgboost as xgb
# 使用XGBClassifier作为GBM的例子,假设数据格式同上
model = xgb.XGBClassifier(n_estimators=100, learning_rate=0.1) # 参数设置
model.fit(X, y)
# 预测
prediction = model.predict(new_data)
```
在实际应用中,记得先对数据进行预处理,如编码分类变量、填充缺失值等。
阅读全文