随机森林算法 python
时间: 2023-10-24 19:23:21 浏览: 103
随机森林是一种基于决策树的集成学习算法,它可以用于分类和回归问题,并且具有很好的泛化能力和抗干扰能力。在 Python 中,我们可以使用 scikit-learn 库来实现随机森林算法。
以下是一个简单的随机森林分类器的 Python 代码示例:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
# 创建一个分类问题的数据集
X, y = make_classification(n_samples=1000, n_features=4, n_informative=2, n_redundant=0, random_state=0, shuffle=False)
# 创建一个随机森林分类器
clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)
# 训练分类器
clf.fit(X, y)
# 使用分类器进行预测
print(clf.predict([[0, 0, 0, 0]]))
```
在上面的示例中,我们使用 `make_classification` 函数生成一个分类问题的数据集,然后创建一个由 100 棵树组成的随机森林分类器,并对其进行训练。最后,我们使用分类器对新的样本进行预测,并输出预测结果。
除了分类问题外,随机森林还可以用于回归问题,只需要使用 `RandomForestRegressor` 类而不是 `RandomForestClassifier` 类即可。
阅读全文