首页jupeter编程：基于Scikit-learn自带的白酒数据集完成机器学习的数据准备工作，并将代码填入答案框中。要求如下：（1）加载Scikit-learn自带的白酒数据集；（2）获取数据集的特征（X)和标签（Y）并打印X和Y的大小；（3）将数据集划分为训练集和测试集，并打印训练集和测试集的大小；（4）选择数据集的两个特征，并绘制数据集散点图（scatter)）

jupeter编程：基于Scikit-learn自带的白酒数据集完成机器学习的数据准备工作，并将代码填入答案框中。要求如下：（1）加载Scikit-learn自带的白酒数据集；（2）获取数据集的特征（X)和标签（Y）并打印X和Y的大小；（3）将数据集划分为训练集和测试集，并打印训练集和测试集的大小；（4）选择数据集的两个特征，并绘制数据集散点图（scatter)）

时间: 2023-07-09 21:23:43 浏览: 99

以下是基于Scikit-learn自带的白酒数据集完成机器学习的数据准备工作的代码： ```python from sklearn.datasets import load_wine from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt # 加载白酒数据集 wine = load_wine() # 获取数据集的特征(X)和标签(Y)并打印X和Y的大小 X = wine.data Y = wine.target print("X的大小:", X.shape) print("Y的大小:", Y.shape) # 将数据集划分为训练集和测试集，并打印训练集和测试集的大小 X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=0) print("X_train的大小:", X_train.shape) print("Y_train的大小:", Y_train.shape) print("X_test的大小:", X_test.shape) print("Y_test的大小:", Y_test.shape) # 选择数据集的两个特征，并绘制数据集散点图(scatter) plt.scatter(X[:, 0], X[:, 1], c=Y) plt.xlabel('Alcohol') plt.ylabel('Malic acid') plt.show() ``` 注意：在绘制散点图时，我选择了数据集的前两个特征，即`Alcohol`和`Malic acid`。你可以根据需要选择不同的特征进行绘图。

阅读全文