首页随机森林数模python

随机森林数模python

时间: 2024-03-25 07:34:23 浏览: 14

随机森林是一种集成学习方法，它由多个决策树组成。每个决策树都是独立训练的，通过对输入样本进行随机有放回抽样（bootstrap）和随机特征选择，来构建不同的决策树。最终的预测结果是由所有决策树的预测结果综合得出的。在Python中，可以使用scikit-learn库来实现随机森林算法。下面是一个简单的随机森林分类器的示例代码： ```python from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 创建随机森林分类器 rf = RandomForestClassifier(n_estimators=100, random_state=42) # 训练模型 rf.fit(X_train, y_train) # 预测 y_pred = rf.predict(X_test) # 评估模型准确率 accuracy = accuracy_score(y_test, y_pred) print("Accuracy:", accuracy) ``` 上述代码中，首先导入了需要的库，然后加载了一个经典的鸢尾花数据集。接着，将数据集划分为训练集和测试集，然后创建了一个包含100个决策树的随机森林分类器。通过调用`fit`方法对模型进行训练，然后使用测试集进行预测，并计算准确率。