X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=42) print(y_test) # 创建随机森林模型 rf = RandomForestClassifier(random_state=42, n_estimators=2000)
时间: 2023-11-06 14:42:21 浏览: 65
使用sklearn的cross_val_score进行交叉验证实例
这段代码展示了如何使用随机森林模型进行分类任务。
首先,使用`train_test_split`函数将数据集`X`和目标变量`y`划分为训练集和测试集。`test_size=0.4`表示测试集占总数据集的40%,而`random_state=42`确保每次运行代码时得到相同的训练集和测试集。
接下来,打印出测试集的目标变量`y_test`,以便查看测试集中的真实标签。
然后,使用`RandomForestClassifier`类创建一个随机森林分类器对象`rf`。这里设置了`random_state=42`以确保模型可复现性,并且设定了`n_estimators=2000`来指定随机森林中树的数量。
随机森林模型是一种集成学习方法,通过组合多个决策树来进行预测。每个决策树都是基于不同的随机子样本和特征子集构建的,最终的预测结果是基于所有树的投票或平均值得出的。这种集成方法可以提高模型的准确性和鲁棒性。
请注意,这只是随机森林模型的创建过程,还需要进行训练和预测步骤才能完成整个分类任务。
阅读全文