（1）导入邮政编码数据集，输出数据与其中邮政编码的类别；数据集说明：手写体阿拉伯数字以文本文件格式存储，数据为 16 乘 16 的灰度点阵值，存放在 1 至 256 列上。第 0 列为灰度点阵数据对应的实际数字。（2）随机选取其中的 25 个数据，完成邮政编码数据的可视化操作；（3）利用 sklearn 中的“train_test_split（）”按照 6：4 的比例划分训练集（X_train,Y_train）与测试集（X_test,Y_test），并记录划分后训练集与测试集的数量。

时间: 2024-03-20 22:45:34 浏览: 89

好的，下面是针对您提出的问题的代码示例： 1. 导入并输出邮政编码数据集及其类别 ```python import pandas as pd # 读取数据集 data = pd.read_csv('邮政编码数据集.csv', header=None) # 输出数据集 print('数据集：') print(data.head()) # 输出类别 groups = data.groupby(0) print('类别：') for name, group in groups: print('邮政编码', name, '共有', len(group), '个样本') ``` 2. 随机选取 25 个数据并可视化 ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt # 读取数据集 data = pd.read_csv('邮政编码数据集.csv', header=None) # 随机选取 25 个样本 indices = np.random.choice(len(data), size=25, replace=False) samples = data.iloc[indices, 1:].values.reshape(-1, 16, 16) # 可视化 fig, axes = plt.subplots(5, 5, figsize=(8, 8)) for i, ax in enumerate(axes.flat): ax.imshow(samples[i], cmap='gray') ax.set_xticks([]) ax.set_yticks([]) plt.show() ``` 3. 划分训练集和测试集 ```python from sklearn.model_selection import train_test_split # 读取数据集 data = pd.read_csv('邮政编码数据集.csv', header=None) # 划分训练集和测试集 X = data.iloc[:, 1:].values y = data.iloc[:, 0].values X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=42) # 输出划分后的训练集和测试集数量 print('训练集数量：', len(X_train)) print('测试集数量：', len(X_test)) ``` 希望这些代码示例能够对您有所帮助。

阅读全文

相关推荐

计算机视觉之分图像类数据集：手写数学符号和阿拉伯数字分类数据集（20分类）

计算机视觉分类数据集：手写数字10分类数据集

MNIST数据集-手写体数字的图片数据集

（1）导入邮政编码数据集，输出数据与其中邮政编码的类别； 数据集说明：手写体阿拉伯数字以文本文件格式存储，数据为 16 乘 16 的灰度点阵值，存放在 1 至 256 列上。第 0 列为灰度点阵数据对应的实 际数字。

YOLO 数据集：手写26字母和数字图像检测（38类）【包含划分好的数据集、类别class文件、数据可视化脚本】

英语手写体数据集图片及文本文档数据集.zip

识别手写体数据集 识别手写体数据集

手写体数字集-数据集

深度学习数据集：手写数字识别图像分类（包括划分好的数据【文件夹保存】、类别json文件、可视化python脚本）

MNIST手写体数字数据集

数字手写体识别数据集

MNIST手写体数字识别数据集

手写体数字图片训练数据集

Data-Science-Arabic-Handwritten-Digits-Recognition:Kaggle的阿拉伯文手写数字数据集的解决方案

计算机视觉之图像数据集：手写藏文字母数据集

PMU-UD:乌尔都语/阿拉伯数字的手写数据集-开源

计算机视觉分类数据集：手写英文字母26分类数据集

MNIST手写体数字数据集.zip

掌握MNIST数据集：手写数字的神经网络训练基石

(源码)基于QT框架的云存储系统.zip

最新推荐

Pytorch使用MNIST数据集实现CGAN和生成指定的数字方式

基于多分类非线性SVM（+交叉验证法）的MNIST手写数据集训练（无框架）算法

tensorflow实现残差网络方式(mnist数据集)

使用tensorflow实现VGG网络,训练mnist数据集方式

手写数字识别：实验报告

黑板风格计算机毕业答辩PPT模板下载

管理建模和仿真的文件

提升点阵式液晶显示屏效率技术

在SoC芯片的射频测试中，ATE设备通常如何执行系统级测试以保证芯片量产的质量和性能一致？

CodeSandbox实现ListView快速创建指南

（1）导入邮政编码数据集，输出数据与其中邮政编码的类别；数据集说明：手写体阿拉伯数字以文本文件格式存储，数据为 16 乘 16 的灰度点阵值，存放在 1 至 256 列上。第 0 列为灰度点阵数据对应的实际数字。

识别手写体数据集识别手写体数据集