随机森林模型及python代码
时间: 2024-09-18 20:15:19 浏览: 47
随机森林(Random Forest)是一种集成学习算法,它由一系列决策树组成,每个决策树都是对数据的一个独立预测。在训练过程中,随机森林通过构建众多决策树并对它们的结果取平均或多数投票来进行最终预测,这样可以降低单棵树过拟合的风险,并提高整体模型的稳定性和性能。
在Python中,我们可以使用scikit-learn库中的`RandomForestClassifier`(对于分类任务)或`RandomForestRegressor`(对于回归任务)来实现随机森林模型。下面是一个简单的随机森林分类器的例子:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练随机森林模型
rf_model = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=42)
rf_model.fit(X_train, y_train)
# 使用模型进行预测
predictions = rf_model.predict(X_test)
```
在这个例子中,我们设置了100棵决策树(n_estimators)、最大深度为2(max_depth),然后将训练数据输入模型进行训练,最后使用测试集数据进行预测。
阅读全文