基于鸢尾花数据集编写程序,实现决策树算法、输出分类结果
时间: 2024-12-10 07:33:23 浏览: 13
基于鸢尾花数据集(Iris dataset)编写程序并应用决策树算法通常涉及以下几个步骤:
1. **导入库和数据**:首先需要导入必要的库,如`sklearn`(scikit-learn)用于机器学习,以及`pandas`处理数据。然后加载鸢尾花数据集,可以使用`load_iris`函数。
```python
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report
```
2. **数据预处理**:将数据集分为特征(X)和目标变量(y),然后分割成训练集和测试集。
```python
data = load_iris()
X = data.data
y = data.target
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
3. **模型构建**:创建一个`DecisionTreeClassifier`实例,并对其进行训练。
```python
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
```
4. **预测与评估**:使用训练好的模型对测试集进行预测,并计算分类报告以了解模型性能。
```python
y_pred = clf.predict(X_test)
print("Classification Report:\n", classification_report(y_test, y_pred))
```
5. **输出分类结果**:最后,输出每个样本在测试集上的预测类别。
```python
for i, pred in enumerate(y_pred):
print(f"Sample {i+1}: Actual - {y_test[i]}, Predicted - {pred}")
```
阅读全文