随机深林python
时间: 2023-12-29 12:26:46 浏览: 60
随机森林Python
5星 · 资源好评率100%
随机森林是一种集成学习算法,它通过组合多个决策树来进行分类或回归任务。每个决策树都是在随机选择的数据子集上训练的,并且在每个节点上只考虑随机选择的特征子集。这种随机性的引入使得随机森林具有很好的泛化能力和抗噪能力。
以下是一个使用Python实现随机森林分类的例子:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
# 创建一个随机的分类数据集
X, y = make_classification(n_samples=1000, n_features=10, random_state=42)
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建一个随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=42)
# 在训练集上训练随机森林分类器
clf.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = clf.predict(X_test)
# 输出预测结果
print("预测结果:", y_pred)
# 输出模型的准确率
print("模型准确率:", clf.score(X_test, y_test))
```
这个例子中,我们使用`sklearn`库中的`RandomForestClassifier`类来创建一个随机森林分类器。我们使用`make_classification`函数生成一个随机的分类数据集,并将数据集划分为训练集和测试集。然后,我们使用训练集来训练随机森林分类器,并在测试集上进行预测。最后,我们输出预测结果和模型的准确率。
阅读全文