随机森林数据划分代码
时间: 2024-04-25 22:19:23 浏览: 62
随机森林代码
4星 · 用户满意度95%
随机森林是一种集成学习算法,它由多个决策树组成。在随机森林中,数据划分是构建决策树的关键步骤之一。下面是一个简单的随机森林数据划分的代码示例:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
# 假设我们有一个特征矩阵 X 和目标变量 y
# 将数据划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建随机森林分类器
rf = RandomForestClassifier()
# 在训练集上拟合模型
rf.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = rf.predict(X_test)
```
以上代码使用了`sklearn`库中的`RandomForestClassifier`类来创建随机森林分类器,并使用`train_test_split`函数将数据划分为训练集和测试集。然后,使用训练集对随机森林进行拟合,最后使用测试集进行预测。
阅读全文