Python实现随机森林
时间: 2023-11-19 08:04:37 浏览: 94
随机森林是一种经典的机器学习算法,它基于多个决策树的集成进行分类或回归。
在Python中,我们可以使用scikit-learn库来实现随机森林。下面是一个简单的例子:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 生成一些随机数据
X, y = make_classification(n_samples=1000, n_features=4, n_informative=2, n_redundant=0, random_state=0, shuffle=False)
# 将数据集拆分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 创建一个随机森林分类器
clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = clf.score(X_test, y_test)
print("Accuracy:", accuracy)
```
在上面的例子中,我们使用`make_classification`函数生成了一些随机数据,并将其拆分为训练集和测试集。然后,我们创建了一个随机森林分类器,并使用训练集对其进行训练。最后,我们使用测试集进行预测,并计算了模型的准确率。
需要注意的是,随机森林的性能通常取决于树的数量和深度等超参数的选择。在实践中,我们需要通过交叉验证等方法来选择最优的超参数组合。
阅读全文