基于鸢尾花数据集编写程序实现决策树算法输出分类结果
时间: 2024-12-10 13:31:53 浏览: 14
python实现决策树莺尾花(代码+数据集) Jupyter Notebook打开.ipynb文件
基于鸢尾花数据集(Iris dataset)实现决策树算法通常涉及以下几个步骤:
1. **导入库**:首先,你需要导入必要的机器学习和数据分析库,如Python的`scikit-learn`,它包含了鸢尾花数据集和多种预建的分类算法。
```python
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
```
2. **加载数据**:使用`load_iris()`函数加载鸢尾花数据集,并查看其属性。
```python
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
3. **数据预处理**:划分训练集和测试集,以便评估模型性能。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
4. **创建并训练决策树模型**:创建`DecisionTreeClassifier`实例,并用训练数据拟合。
```python
tree_model = DecisionTreeClassifier(random_state=42)
tree_model.fit(X_train, y_train)
```
5. **预测及评估**:用测试集数据进行预测,然后计算准确率。
```python
y_pred = tree_model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
6. **输出分类结果**:打印出每个样本的预测类别。
```python
for i in range(len(y_test)):
print(f"Sample {i+1}: Predicted class - {y_pred[i]}")
```
阅读全文