首页基于决策树的鸢尾花数据集分类并训练

基于决策树的鸢尾花数据集分类并训练

时间: 2024-12-20 07:23:43 浏览: 69

基于决策树的鸢尾花数据集分类通常是在机器学习入门教程中常见的例子，它是使用Python的scikit-learn库来进行的。决策树是一种监督学习算法，特别适合处理分类任务，如鸢尾花数据集。该数据集包含三种类型的鸢尾花（Setosa、Versicolour和Virginica）的测量值。首先，你需要做的是导入所需的库，如`sklearn.datasets`用于加载数据，`sklearn.model_selection`用于划分训练集和测试集，`sklearn.tree`用于创建决策树模型： ```python import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split from sklearn.tree import DecisionTreeClassifier # 加载鸢尾花数据 iris = datasets.load_iris() X = iris.data # 特征 y = iris.target # 类别标签 # 划分数据集（例如70%训练，30%测试） X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 创建决策树分类器 clf = DecisionTreeClassifier() # 使用训练数据拟合模型 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) ``` 接下来，你可以评估模型的性能，比如查看混淆矩阵或计算准确率等指标。

阅读全文