随机森林算法的简单python代码
时间: 2024-05-12 20:11:46 浏览: 98
随机森林是一种集成学习方法,它由多个决策树组成。以下是随机森林的简单Python代码:
```python
# 导入必要的库
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 生成模拟数据
X, y = make_classification(n_samples=1000, n_features=4,
n_informative=2, n_redundant=0,
random_state=0, shuffle=False)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 定义随机森林模型并训练
clf = RandomForestClassifier(n_estimators=100, max_depth=2, random_state=0)
clf.fit(X_train, y_train)
# 预测测试集结果
y_pred = clf.predict(X_test)
# 输出模型准确率
print("Accuracy:", clf.score(X_test, y_test))
```
以上代码中,首先使用`make_classification`函数生成了一个包含4个特征的模拟数据集,并将其划分为训练集和测试集。然后定义了一个随机森林分类器,其中`n_estimators`指定了决策树的数量,`max_depth`指定了每个决策树的最大深度。接着使用`fit`函数对模型进行训练,并使用`predict`函数对测试集进行预测。最后输出模型的准确率。
阅读全文