python葡萄酒数据集分类代码
时间: 2024-12-27 14:09:27 浏览: 0
在Python中,我们通常使用scikit-learn库来进行葡萄酒数据集的分类任务,这是一个常用的数据分析和机器学习工具包。以下是一个简单的例子,展示了如何使用支持向量机(SVM)对葡萄酒进行分类:
```python
# 导入所需的库
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import classification_report
# 加载葡萄酒数据集
wine = datasets.load_wine()
X = wine.data
y = wine.target
# 数据预处理:特征缩放
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)
# 创建SVM分类器
svm_classifier = SVC(kernel='linear') # 或者尝试其他内核如 'rbf', 'poly'
# 训练模型
svm_classifier.fit(X_train, y_train)
# 预测
y_pred = svm_classifier.predict(X_test)
# 评估性能
print(classification_report(y_test, y_pred, target_names=wine.target_names))
```
在这个例子中,我们首先加载了葡萄酒数据集,然后将其分为特征(X)和目标变量(y)。通过标准化处理,我们确保所有特征都在相同的尺度上。接着,我们将数据划分为训练集和测试集。使用SVC创建了一个支持向量机分类器,并在训练集上拟合它。最后,我们预测了测试集的结果并生成了一份分类报告,展示模型的准确性和细节。
阅读全文