from sklearn import tree, datasets 2. from sklearn model selection import train test_split 3. wine=datasets.load_wine0 4、print("紅酒数据集中的健:Ing ".format(wine.keys()) 5, X=wine. data :,:21 6, y=wine.target 7. X train, X test,y _train,y _ test train_ test_split(X,y) 8, clf-tree.DecisionTreeClassifier(max depth=5) 9, clf. fit(X_ train,y _train) 10, score=clf.score(X test,y_test)
时间: 2023-12-24 08:21:29 浏览: 119
Python数据集乳腺癌数据集(from sklearn.datasets import load-breast-cancer)
5星 · 资源好评率100%
这段代码是用来对 wine 数据集进行决策树分类的。其中:
1. 第一行导入了 sklearn 库中的 tree 和 datasets 模块。
2. 第二行导入了 train_test_split 函数,用于将数据集分割成训练集和测试集。
3. 第三行加载了 wine 数据集。
4. 第四行打印出了 wine 数据集中的键名。
5. 第五行将数据集中除了最后一列以外的所有列作为特征向量 X。
6. 第六行将数据集最后一列作为标签向量 y。
7. 第七行使用 train_test_split 函数将 X 和 y 分别划分为训练集和测试集。
8. 第八行创建了一个深度为 5 的决策树分类器。
9. 第九行使用训练集对分类器进行训练。
10. 第十行计算了分类器在测试集上的准确率并将其赋值给变量 score。
阅读全文