jupeter编程:基于Scikit-learn自带的白酒数据集完成机器学习的数据准备工作,并将代码填入答案框中。要求如下:(1)加载Scikit-learn自带的白酒数据集;(2)获取数据集的特征(X)和标签(Y)并打印X和Y的大小;(3)将数据集划分为训练集和测试集,并打印训练集和测试集的大小;(4)选择数据集的两个特征,并绘制数据集散点图(scatter))
时间: 2023-07-09 21:23:43 浏览: 99
以下是基于Scikit-learn自带的白酒数据集完成机器学习的数据准备工作的代码:
```python
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# 加载白酒数据集
wine = load_wine()
# 获取数据集的特征(X)和标签(Y)并打印X和Y的大小
X = wine.data
Y = wine.target
print("X的大小:", X.shape)
print("Y的大小:", Y.shape)
# 将数据集划分为训练集和测试集,并打印训练集和测试集的大小
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=0)
print("X_train的大小:", X_train.shape)
print("Y_train的大小:", Y_train.shape)
print("X_test的大小:", X_test.shape)
print("Y_test的大小:", Y_test.shape)
# 选择数据集的两个特征,并绘制数据集散点图(scatter)
plt.scatter(X[:, 0], X[:, 1], c=Y)
plt.xlabel('Alcohol')
plt.ylabel('Malic acid')
plt.show()
```
注意:在绘制散点图时,我选择了数据集的前两个特征,即`Alcohol`和`Malic acid`。你可以根据需要选择不同的特征进行绘图。
阅读全文