Python随机森林案例。
时间: 2024-12-13 09:09:26 浏览: 3
Python中的随机森林是一种集成学习算法,它由一系列决策树组成。每个决策树都是基于训练数据集的一个随机子集(即bootstrap样本)和一部分特征(也是随机选择的)。当预测时,所有树会投票给出结果,最常见的结果就是最终预测。
下面是一个简单的随机森林案例,假设我们要用它来进行分类任务,比如鸢尾花数据集(Iris dataset):
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
# 加载数据
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练随机森林模型
rf_model = RandomForestClassifier(n_estimators=100, max_depth=5)
rf_model.fit(X_train, y_train)
# 预测
predictions = rf_model.predict(X_test)
# 评估模型性能
from sklearn.metrics import accuracy_score
accuracy = accuracy_score(y_test, predictions)
print("Accuracy:", accuracy)
```
在这个例子中,我们首先导入所需的库,然后加载数据并划分成训练集和测试集。接着创建了一个随机森林分类器,设置了100棵树和最大深度为5。通过`fit`函数对数据进行训练,最后用`predict`进行预测,并计算了准确率作为模型性能的度量。
阅读全文