使用python语言载入mnist数据,划分训练集和测试集
时间: 2023-07-02 21:19:24 浏览: 242
好的,我可以帮你解答这个问题。下面是使用Python载入MNIST数据并划分训练集和测试集的示例代码:
```python
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_openml
# 载入MNIST数据
mnist = fetch_openml('mnist_784', version=1, cache=True)
X = mnist.data
y = mnist.target
# 将标签转换为整数类型
y = y.astype(np.uint8)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 输出训练集和测试集的形状
print('The shape of X_train is:', X_train.shape)
print('The shape of X_test is:', X_test.shape)
print('The shape of y_train is:', y_train.shape)
print('The shape of y_test is:', y_test.shape)
```
在上述代码中,首先使用sklearn的fetch_openml函数载入MNIST数据集。接着,将标签转换为整数类型,并使用train_test_split函数划分训练集和测试集,其中test_size参数指定了测试集的比例,random_state参数指定了随机种子,以保证每次划分的结果一致。最后,输出训练集和测试集的形状,以检查划分是否正确。
阅读全文