Python界面下使用预训练Imagnet模型进行图形分类详解

需积分: 0 99 浏览量更新于2024-08-05 收藏 243KB PDF 举报

本篇学习笔记由薛开宇于2014年7月24日撰写，主要针对如何在Python界面上利用预训练的ImageNet模型对图像进行分类。ImageNet是一个大规模的图像识别数据集，而Caffe是一个流行的深度学习框架，这篇笔记的重点在于演示如何通过Caffe的Python接口在实际应用中进行图像分类。首先，作者建议使用IPython Notebook作为开发平台，因为它提供了丰富的功能和交互性。Caffe的Python接口位于`caffe/caffe/pycaffe.py`中，支持Python和Matlab两种编程语言，但这里选择Python是因为其更为灵活。准备工作与前一篇读书笔记中的步骤相似，但具体细节未在此处赘述。在代码部分，作者开始导入必要的库，如`numpy`、`matplotlib`以及Caffe的相关模块。然后设置了环境变量`caffe_root`，并将其指向Caffe安装目录，同时定义了模型定义文件（`imagenet_deploy.prototxt`）、预训练权重文件（`caffe_reference_imagenet_model`）以及待分类的图像文件（`bird11.jpeg`）的路径。接下来，进入了关键步骤1.2：加载网络与输入图片。通过`caffe.Classifier`类，可以方便地加载预训练的ImageNet模型。这个类已经处理好了网络结构和参数配置，包括输入图片的预处理，如减去特定的均值值（这是为了纠正数据集中的偏移），以及可能的RGB通道顺序调整（因为ImageNet数据集的标准可能与用户的图片不同）。加载网络后，用户可以调用`classify`方法来对指定的图像进行分类。薛开宇在这篇笔记中分享了如何在Python环境中使用Caffe进行ImageNet模型的图像分类，包括必要的库导入、环境设置以及具体操作流程。这对于希望在实际项目中应用深度学习进行图像识别的开发者来说，是一份实用的技术指南。

读书笔记 6 在 python 界面上用训练好的 Imagenet 模型去分类图形

2014.7.24 薛开宇

本篇是对前面第 5 个读书笔记的一个补充。讲一下在 python 界面上分类的一些细节。

注意，本笔记的代码由原文复制过来，再复制过去 ipython 可能会有些格式上的错误，

建议使用原文（本文最后）的代码进行复制使用。

1.1 开始

在终端输入：

ipython notebook

启动编辑平台。

Caffe 提供一个普遍的 python 接口用来接 caffe 的模型。该网络在 python/caffe/pycaffe.py

中。

我们可以用 python 和 matlab 进行分类，然而，python 拥有更多功能，因此，我们在这

里使用它，对于 matlab，可以参考 matlab/caffe/matcaffe_demo.m.

然后，准备工作和读书笔记 5 一样，这里不描述了。

首先，以下一段指令：

import numpy as np

import matplotlib.pyplot as plt

%matplotlib inline

caffe_root = '/home/xuekaiyu/caffe-master/'# this file is expected to be in {caffe_root}/examples

import sys

sys.path.insert(0, caffe_root + 'python')

import caffe

# Set the right path to your model definition file, pretrained model weights,

#设置好模型路径，和想分类的图像

# and the image you would like to classify.

MODEL_FILE = caffe_root+'examples/imagenet/imagenet_deploy.prototxt'

PRETRAINED = caffe_root+'examples/imagenet/caffe_reference_imagenet_model'

IMAGE_FILE = caffe_root+'examples/images/bird11.jpeg'

1.2 加载网络与输入图片

加载一个网络很简单，caffe.Classifier 已经帮你设置好一切，注意输入预处理的参数配

置，减去均值的文件的设置，输入的 RGB 频道的交换（ImageNet model’s 是 BGR），还有输

入时候乘以一定的特征比例以达到从【0，1】到【256】的目的。

net = caffe.Classifier(MODEL_FILE, PRETRAINED,

mean_file=caffe_root+'python/caffe/imagenet/ilsvrc_2012_mean.npy',

channel_swap=(2,1,0),

input_scale=255)

下载后可阅读完整内容，剩余3页未读，立即下载

whph

粉丝: 28
资源: 305

Python界面下使用预训练Imagnet模型进行图形分类详解

学习笔记3_用自己的数据训练和测试-薛开宇1

学习笔记2_用一个预训练模型提取特征-薛开宇1

学习笔记1_CIFAR-10在caffe上进行训练与学习-薛开宇1

学习笔记4_学习搭建自己的网络——MNIST在caffe上进行训练与学习-薛开宇1

学习笔记7_如何改变模型参数将提取出的大量特征用全卷积的分类器表示-薛开宇1

学习笔记5_逐层可视化图像特征-薛开宇1

caffe学习笔记1CIFAR-10在caffe上进行训练与学习-薛开宇1

caffe学习笔记3用自己的数据训练和测试-薛开宇1

caffe学习笔记1-7-完整版-薛开宇

CNN学习入门-薛开宇

最新资源