利用鸢尾花数据集进行决策树构建和预测 1、导入库 2、获取数据集 3、数据划分 4、构建决策树 5、决策树可视化 6、预测准确率
时间: 2023-10-20 08:19:58 浏览: 77
好的,以下是利用鸢尾花数据集进行决策树构建和预测的 Python 代码:
```python
# 1、导入库
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.tree import export_graphviz
import graphviz
# 2、获取数据集
iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = pd.DataFrame(iris.target, columns=['target'])
# 3、数据划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 4、构建决策树
dtc = DecisionTreeClassifier()
dtc.fit(X_train, y_train)
# 5、决策树可视化
dot_data = export_graphviz(dtc, out_file=None, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True, special_characters=True)
graph = graphviz.Source(dot_data)
graph.render("iris")
# 6、预测准确率
print("训练集准确率:", dtc.score(X_train, y_train))
print("测试集准确率:", dtc.score(X_test, y_test))
```
代码解释:
1. 导入需要的库。
2. 使用`load_iris()`函数获取鸢尾花数据集。将特征数据存入`X`中,将目标数据存入`y`中。
3. 使用`train_test_split()`函数将数据集划分为训练集和测试集。
4. 创建决策树分类器对象`DecisionTreeClassifier()`,并使用`fit()`函数拟合训练集数据。
5. 使用`export_graphviz()`函数生成决策树可视化图,并使用`graphviz`库进行展示。
6. 输出训练集和测试集的预测准确率。
希望这可以帮助到您!
阅读全文