python随机森林分类鸢尾花
时间: 2024-09-25 16:00:42 浏览: 34
随机森林分类算法python
Python中的随机森林(Random Forest)是一种集成学习算法,它通过构建众多决策树并将它们的结果结合在一起来进行预测。在机器学习领域,特别是用于分类任务时,它可以有效地处理高维数据,并能够处理缺失值。例如,在鸢尾花(Iris)数据集上,随机森林可以用来识别三种不同类型的鸢尾花(Setosa、Versicolour和Virginica)。
鸢尾花数据集是一个经典的示例,通常用于初学者入门机器学习。在Python中,我们可以使用scikit-learn库中的`sklearn.ensemble.RandomForestClassifier`来创建随机森林模型。首先,你需要加载数据(如iris.loaders.load_iris()),然后对特征进行预处理,接着划分训练集和测试集,最后使用`fit()`方法训练模型,`predict()`方法做预测,评估性能通常会用到交叉验证和accuracy_score等函数。
下面是一个简单的例子:
```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练随机森林模型
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)
# 预测
y_pred = rf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
阅读全文