随机森林森林 sklearn
时间: 2023-08-09 08:06:03 浏览: 70
随机森林是一种集成学习算法,用于解决分类和回归问题。它基于决策树的集合,通过随机选择特征子集和样本子集来构建多个决策树,并通过投票或平均预测结果来做出最终的预测。
在sklearn库中,你可以使用`sklearn.ensemble`模块中的`RandomForestClassifier`类来构建随机森林分类器,或使用`RandomForestRegressor`类构建随机森林回归器。这些类提供了许多参数来调整模型的行为,例如树的数量、每棵树的最大深度等。
下面是一个使用随机森林分类器的示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载鸢尾花数据集
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2)
# 构建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, max_depth=2)
# 拟合模型
clf.fit(X_train, y_train)
# 预测
y_pred = clf.predict(X_test)
# 评估模型
accuracy = clf.score(X_test, y_test)
print("Accuracy:", accuracy)
```
这是一个简单的随机森林分类器示例,它使用鸢尾花数据集进行训练和测试,并输出预测准确率。你可以根据自己的需求调整参数以及应用于其他数据集。