sklearn中load_wine
时间: 2024-11-24 09:26:05 浏览: 26
在sklearn库中,`load_wine`函数用于加载经典的葡萄酒品质数据集,这是一个多类分类任务的数据集,常用于决策树算法的学习和实验。以下是如何使用这个数据集并展示`max_depth`参数对决策树模型性能影响的一个示例[^1]:
```python
from sklearn.datasets import load_wine
from sklearn.tree import DecisionTreeClassifier
import matplotlib.pyplot as plt
# 加载数据
data = load_wine()
x_train, x_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.2, random_state=42)
# 设置不同的max_depth值来训练决策树
test_scores = []
for max_depth in range(1, 11):
clf = DecisionTreeClassifier(criterion='entropy', max_depth=max_depth, random_state=30)
clf.fit(x_train, y_train)
scores = clf.score(x_test, y_test)
test_scores.append(scores)
plt.plot(range(1, 11), test_scores, color='r', label='max_depth')
plt.xlabel('Max Depth')
plt.ylabel('Accuracy')
plt.title('Impact of Max Depth on Decision Tree Performance')
plt.legend()
plt.show()
# 演示如何应用决策树到测试数据上
print("Apply to test data:", clf.apply(x_test))
# 显示预测结果
print("Predicted classes:", clf.predict(x_test))
```
相关问题--:
1. 如何在sklearn中查看其他预置数据集?
2. 决策树模型的max_depth如何影响其复杂度与过拟合?
3. SVM分类模型的`classification_report`函数具体展示了哪些信息?
阅读全文