随机森林怎么用测试集和训练集python
时间: 2023-09-06 13:07:13 浏览: 148
Python分割训练集和测试集的方法示例
随机森林可以使用sklearn库中的RandomForestClassifier类来实现。使用前需要将数据集划分为训练集和测试集。代码实现如下:
```
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
# 假设X为特征集,y为标签集,test_size为测试集占比
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# 实例化一个随机森林分类器,并将训练集数据传给fit函数训练
rfc = RandomForestClassifier(n_estimators=100)
rfc.fit(X_train, y_train)
# 使用测试集数据进行预测
y_pred = rfc.predict(X_test)
```
其中n_estimators指定了随机森林的树的数量。训练后可以使用predict函数进行预测,y_pred即为预测结果。
阅读全文