利用葡萄酒数据集,训练集和测试集的比例为8:2代码并生成决策树
时间: 2024-12-18 22:32:58 浏览: 4
机器学习-决策树(以西瓜数据集为例)
5星 · 资源好评率100%
在Python中,我们可以使用sklearn库来构建决策树模型,并利用葡萄酒数据集(如UCI Machine Learning Repository中的Wine Dataset)。这里是一个简单的例子,假设你已经安装了所需的库:
```python
# 导入所需库
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 加载葡萄酒数据集
wine_data = load_wine()
X = wine_data.data
y = wine_data.target
# 将数据划分为训练集和测试集(80%训练,20%测试)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建决策树分类器
clf = DecisionTreeClassifier()
# 使用训练集训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy on the test set:", accuracy)
# 可视化决策树(如果需要,可以使用plot_tree函数)
# from sklearn.tree import plot_tree
# plot_tree(clf, filled=True) # 如果你使用Jupyter notebook运行,记得先导入matplotlib
阅读全文