首页Python实现随机森林

Python实现随机森林

时间: 2023-11-19 08:04:37 浏览: 94

随机森林是一种经典的机器学习算法，它基于多个决策树的集成进行分类或回归。在Python中，我们可以使用scikit-learn库来实现随机森林。下面是一个简单的例子： ```python from sklearn.ensemble import RandomForestClassifier from sklearn.datasets import make_classification from sklearn.model_selection import train_test_split # 生成一些随机数据 X, y = make_classification(n_samples=1000, n_features=4, n_informative=2, n_redundant=0, random_state=0, shuffle=False) # 将数据集拆分为训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0) # 创建一个随机森林分类器 clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0) # 训练模型 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) # 计算准确率 accuracy = clf.score(X_test, y_test) print("Accuracy:", accuracy) ``` 在上面的例子中，我们使用`make_classification`函数生成了一些随机数据，并将其拆分为训练集和测试集。然后，我们创建了一个随机森林分类器，并使用训练集对其进行训练。最后，我们使用测试集进行预测，并计算了模型的准确率。需要注意的是，随机森林的性能通常取决于树的数量和深度等超参数的选择。在实践中，我们需要通过交叉验证等方法来选择最优的超参数组合。

阅读全文