python代码载入stl10数据集的训练集和测试集
时间: 2024-02-06 19:03:56 浏览: 169
python 划分数据集为训练集和测试集的方法
可以使用Python中的NumPy和SciPy库来载入STL-10数据集的训练集和测试集,具体实现可以参考以下代码:
```
import numpy as np
from scipy.io import loadmat
def load_stl10_data():
# Load the data
train_data = loadmat('train.mat')
test_data = loadmat('test.mat')
# Extract the image and label data
X_train = np.transpose(train_data['X'], (3, 0, 1, 2))
y_train = np.squeeze(train_data['y']) - 1
X_test = np.transpose(test_data['X'], (3, 0, 1, 2))
y_test = np.squeeze(test_data['y']) - 1
return X_train, y_train, X_test, y_test
# Usage
X_train, y_train, X_test, y_test = load_stl10_data()
```
这段代码会从train.mat和test.mat文件中载入STL-10数据集的训练集和测试集,然后将其转换为NumPy数组格式,并返回X_train、y_train、X_test和y_test。这些数组包含了图像数据和对应的标签,可以用于训练和测试机器学习模型。
阅读全文