能否提供一个关于随机森林算法的实际案例代码及其对应的典型数据集
时间: 2024-12-15 17:16:35 浏览: 1
随机森林算法是一种集成学习方法,它通过构建多个决策树并取其平均预测结果来提高模型的稳定性和准确度。下面是一个简单的Python示例,使用scikit-learn库实现随机森林分类器。这里我们使用经典的鸢尾花数据集(Iris dataset),它包含三种不同类型的鸢尾花的测量值。
```python
# 导入所需的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 加载数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建随机森林分类器
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
# 训练模型
rf_model.fit(X_train, y_train)
# 预测测试集
y_pred = rf_model.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
#
阅读全文