深度学习Caffe：MNIST数据集转换详解

caffe

char

111 浏览量更新于2024-08-30 收藏 84KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"深度学习caffe–手写字体识别例程（五）—— convert_mnist_data.cpp文件详解" 在深度学习框架Caffe中，`convert_mnist_data.cpp`是用于处理MNIST手写数字数据集的关键工具，它将原始的二进制文件转换为适合训练神经网络的数据库格式，如LMDB或LevelDB。这一过程对于有效加载和预处理数据至关重要，因为这些数据库格式能够高效地存储和检索大量样本，是Caffe训练模型时常用的数据输入方式。在上文提到的命令中，`convert_mnist_data.bin`接收三个参数：训练图像文件、训练标签文件以及目标数据库的路径，并通过`--backend`参数指定要使用的数据库类型。在源代码中，这个命令是由`convert_mnist_data.cpp`中的功能实现的。文件开头的`#include`指令引入了必要的库，如`iostream`用于输入输出，`fstream`处理文件流，`google/protobuf/io/coded_stream.h`处理协议缓冲区的编码流，`caffe.proto`包含了Caffe的协议缓冲区定义，`caffe/util/db.h`和`caffe/util/format.h`则是Caffe数据库操作和数据格式转换的接口。 `#ifdef defined(USE_LEVELDB) && defined(USE_LMDB)`是一个条件编译指令，确保在Caffe编译时启用了LevelDB和LMDB支持。这是因为这两个数据库系统分别有各自的库文件，需要在编译时链接。如果未启用，程序不会执行数据库转换部分的代码，这通常意味着Caffe只被配置为支持一种数据库系统。 `convert_mnist_data.cpp`的主要工作流程包括： 1. 读取MNIST数据集的二进制文件，这些文件通常包含两部分：图像数据和对应的标签数据。 2. 解析图像数据和标签数据，将其转换为Caffe的Blobs，这是Caffe中用于存储多维数组的数据结构。 3. 使用Caffe的`db::DB`接口创建新的数据库连接，可以是LMDB或LevelDB。 4. 将Blobs中的数据逐条写入数据库，每个样本作为一个键值对，键通常是样本的索引，值是样本的数据和标签。 5. 最后，关闭数据库连接，转换完成。整个过程中，`convert_mnist_data.cpp`通过`caffe::Datum`类来封装每个MNIST样本，它包含了图像数据和对应的标签。然后，借助`caffe::db:: transaction`对象，将`Datum`序列化并写入数据库。这个过程实现了将原始MNIST数据集转化为Caffe可直接读取的格式，为后续的深度学习模型训练提供了便利。 `convert_mnist_data.cpp`是Caffe中用于数据预处理的重要工具，它将MNIST数据集转换为高效、易于读取的数据库格式，使得深度学习模型能够快速、有效地进行训练。理解这一工具的工作原理有助于更好地掌握Caffe的训练流程，以及如何自定义数据预处理步骤。

资源详情

资源推荐

深度学习深度学习caffe–手写字体识别例程（五）手写字体识别例程（五）——

convert_mnist_data.cpp文件详解文件详解

我们在《深度学习caffe–手写字体识别例程（四）》中，用到了convert_mnist_data.bin文件进行数据集格式的转换，命

令如下

$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte \

$DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}

它的作用是将mnist数据集转换为lmdb或leveldb格式的文件，以便用于深度学习的训练。这篇文章我们就来研究

convert_mnist_data.bin这个文件是如何实现的。convert_mnist_data.bin文件的源文件在example/mnist/目录下，文件名为

convert_mnist_data.cpp，由于这个文件中的代码比较长，我们下面把代码贴出来，并在每行或几行的代码下面进行解释。

#include

#if defined(USE_LEVELDB) && defined(USE_LMDB)

#include

#endif

#include

#include // NOLINT(readability/streams)

#include

#include "boost/scoped_ptr.hpp"

#include "caffe/proto/caffe.pb.h"

#include "caffe/util/db.hpp"

#include "caffe/util/format.hpp"

这些代码是文件包含的头文件，是文件中需要使用到的头文件。

#if defined(USE_LEVELDB) && defined(USE_LMDB)

这是一个判断的宏，如果满足判断条件，则编译下方的代码，否则编译#else下面的代码。我们总览这个文件，发现#else

在文件的结尾处，只包含了几行代码。这个宏的根本作用在于，判断是否定义了USE_LEVELDB和USE_LMDB，如果定义了

则进行文件格式转换的操作，否则，不操作。这两个宏是在编译caffe源码的时候定义的。

using namespace caffe; // NOLINT(build/namespaces)

using boost::scoped_ptr;

using std::string;

这3行是这个文件需要用到的库。

DEFINE_string(backend, "lmdb", "The backend for storing the result");

这行代码在这个文件中没能找到DEFINE_string的定义。其实它是在gflags.h文件中定义的，这个文件

在/usr/include/gflags/目录下，有兴趣可以打开文件研究一下，DEFINE_string是一个宏定义，这里我们只介绍一下它的作用。

调用DEFINE_string之后，会生成基于backend生成一个变量FLAGS_backend，并且变量的取值为“lmdb”，"The backend for

storing the result"是这个变量的说明。

uint32_t swap_endian(uint32_t val) {

val = ((val <> 8) & 0xFF00FF);

return (val <> 16);

}

这段代码是一个函数，它的作用是对32位的整形变量进行大小端转换，在《深度学习caffe--手写字体识别例程（三）》

中，我们介绍了，在mnist数据集中，多字节的数据是按照大端模式存储的，也就是数据的高字节存在低地址，如果我们进行

数据读取数据读出来之后，字节顺序是反的。比如一个32字节的数据0x12345678，它在mnist文件中存储时，相对地址0地址

为12，1地址为34，2地址为56，3地址为78。当从文件中读取32位的数据时，读出来的是0x78563412，与原始数据正好是反

的。所以需要用这个函数进行转换。

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38611812

粉丝: 4
资源: 933

深度学习Caffe：MNIST数据集转换详解

convert_mnist_data.cpp

cpp_torch:它是基于libtorch的tiny-dnn。 只有libtorch，深度学习框架以外的没有标题的标头

unrecognized arguments: checkpoints/mask_rcnn_r50_caffe_fpn_1x_coco_bbox_mAP-0.38__segm_mAP-0.344_20200504_231812-0ebd1859.pth

caffe_16_2020_11_14.zip

cv2.dnn.readNetFromCaffe(r"C:\Users\liyu\dnn\deploy.prototxt", r"C:\Users\liyu\dnn\res10_300x300_ssd_iter_140000_fp16.caffemodel") 解释一下这个函数

给我提供五段可以使用的将.pt权重文件转化为.weights文件的代码，并且注明应该安装的包

ImportError: cannot import name 'caffe2_xavier_init' from 'mmcv.cnn' (D:\anaconda\envs\yolo8\lib\site-packages\mmcv\cnn\__init__.py)

Error loading "D:\anaconda\envs\yolov5\lib\site-packages\torch\lib\cudnn_cnn_infer64_8.dll" or one of its dependencies.

cv2.error: OpenCV(4.7.0) D:\a\opencv-python\opencv-python\opencv\modules\dnn\src\caffe\caffe_io.cpp:1126: error: (-2:Unspecified error) FAILED: fs.is_open(). Can't open "deploy.prototxt" in function 'cv::dnn::ReadProtoFromTextFile'

res10_300x300_ssd_iter_140000_fp16.caffemodel 怎么吧图片处理成300*300

D:\Anaconda\envs\pytorch-CycleGAN-and-pix2pix\Lib\site-packages\torch\lib\caffe2_detectron_ops_gpu.dll"

res10_300x300_ssd_iter_140000.caffemodel

Error loading "D:\Users\ASUS\anaconda3\lib\site-packages\torch\lib\caffe2_detectron_ops_gpu.dll" or one of its dependencies.

Error loading "C:\Users\Lenovo\.conda\envs\py36\lib\site-packages\torch\lib\caffe2_detectron_ops_gpu.dll" or one of its dependencies.

res10_300x300_ssd_iter_140000.caffemodel是什么

cannot import name 'ImageFolder' from 'folder' (C:\Users\Lenovo\.conda\envs\pytorch\lib\site-packages\folder\__init__.py)

最新资源

cpp_torch:它是基于libtorch的tiny-dnn。只有libtorch，深度学习框架以外的没有标题的标头

ImportError: cannot import name 'caffe2_xavier_init' from 'mmcv.cnn' (D:\anaconda\envs\yolo8\lib\site-packages\mmcv\cnn\init.py)

cannot import name 'ImageFolder' from 'folder' (C:\Users\Lenovo\.conda\envs\pytorch\lib\site-packages\folder\init.py)