微调AlexNet进行车牌识别

94 浏览量更新于2024-08-30 收藏 153KB PDF 举报

“Day03 paddle车牌识别”是一个关于使用百度Paddle进行车牌识别的教程，主要涉及AlexNet模型的微调以及深度学习的基本步骤。在车牌识别任务中，深度学习通常涉及以下关键知识点： 1. 数据标签处理：在这个阶段，你需要对数据集进行预处理，包括对图像进行清洗、归一化、缩放等操作，以适应模型输入。在案例中，数据集包含65个类别的车牌字符，每类有大约500张20x20像素的黑白图片。数据集被整理成训练集和测试集，通过`train_data.list`和`test_data.list`文件进行管理。 2. 构建网络模型：AlexNet是一个经典的卷积神经网络（CNN），最初在ImageNet大赛中取得突破性成果。在车牌识别中，AlexNet可以被微调以适应更小分辨率的图像和更多的类别。微调通常意味着保留部分预训练权重，并调整或替换某些层以适应新的任务需求。 3. 规划网络超参数：在构建模型后，需要设定超参数，如学习率、批次大小、优化器类型、损失函数等。这些超参数的选择会影响模型的训练速度和性能。例如，对于小图像，可能需要较小的卷积核大小和步长，以及适应类别数量的全连接层。 4. 训练与评估模型：使用训练数据对模型进行迭代训练，同时在验证集上监控模型的性能，以防止过拟合。PaddlePaddle提供了如`fluid.dygraph`模块来实现动态图计算，可以方便地进行训练和评估。例如，可以使用`Pool2D`和`Conv2D`进行池化和卷积操作，`Linear`用于全连接层。在代码中，还引入了`numpy`、`paddle`、`PIL`、`cv2`和`matplotlib`等库，它们分别用于数值计算、深度学习框架、图像处理、OpenCV图像操作和数据可视化。此外，`os`和`multiprocessing`库用于文件管理和并行计算，提高数据加载效率。在实际操作中，还需要注意数据增强、模型保存和恢复、模型融合等技术，以进一步提升模型的泛化能力。同时，根据GPU或CPU的可用资源调整批处理大小和训练配置也是十分重要的。在训练过程中，监控训练日志，分析损失曲线和准确率变化，可以帮助调整模型和优化训练过程。

Day03 paddle车牌识别车牌识别

继续我们的百度paddle学习，这次我们我们的项目跟上次其实差别不大，不过这次的数据图片分辨率比较小，而且类别更多，我们我们接下来学习一下微调

AlexNet，使得它更加适合我们的数据集训练

还是那句话深度学习不外乎四个步骤：

1. 数据标签处理

2. 构建网络模型

3. 规划网络超参

4. 训练评估模型

首先导入需要的库

import numpy as np

import paddle as paddle

import paddle.fluid as fluid

from PIL import Image

import cv2

import matplotlib.pyplot as plt

import os

from multiprocessing import cpu_count

from paddle.fluid.dygraph import Pool2D,Conv2D

from paddle.fluid.dygraph import Linear

一数据标签处理一数据标签处理

paddle为大家准备的车牌数据集有65个类别，每个类别有500±张黑白图片，分辨率为20×20.数据集链接

首先是数据集处理

# 生成车牌字符图像列表

data_path = 'dataset'#此处为你的数据集解压路径

character_folders = os.listdir(data_path)

label = 0

LABEL_temp = {}

if(os.path.exists('./train_data.list')):

os.remove('./train_data.list')

if(os.path.exists('./test_data.list')):

os.remove('./test_data.list')

for character_folder in character_folders:

with open('./train_data.list', 'a') as f_train:

with open('./test_data.list', 'a') as f_test:

if character_folder == '.DS_Store' or character_folder == '.ipynb_checkpoints' or character_folder == 'data23617':

continue

print(character_folder + " " + str(label))

LABEL_temp[str(label)] = character_folder #存储一下标签的对应关系

character_imgs = os.listdir(os.path.join(data_path, character_folder))

for i in range(len(character_imgs)):

if i%10 == 0:

f_test.write(os.path.join(os.path.join(data_path, character_folder), character_imgs[i]) + " " + str(label) + '')

else:

f_train.write(os.path.join(os.path.join(data_path, character_folder), character_imgs[i]) + " " + str(label) + '')

label = label + 1

print('图像列表已生成')

讲图片路径及文件夹标签写到list文件方便读取，接下来使用paddle的reader模块制作训练集和测试集

# 用上一步生成的图像列表定义车牌字符训练集和测试集的reader

def data_mapper(sample):

img, label = sample

img = paddle.dataset.image.load_image(file=img, is_color=False)

img = img.flatten().astype('float32') / 255.0

return img, label

def data_reader(data_list_path):

def reader():

with open(data_list_path, 'r') as f:

lines = f.readlines()

for line in lines:

img, label = line.split(' ')

yield img, int(label)

return paddle.reader.xmap_readers(data_mapper, reader, cpu_count(), 1024)

# 用于训练的数据提供器

train_reader = paddle.batch(reader=paddle.reader.shuffle(reader=data_reader('./train_data.list'), buf_size=4096), batch_size=128)

# 用于测试的数据提供器

test_reader = paddle.batch(reader=data_reader('./test_data.list'), batch_size=128)

由于数据集较手势识别更加庞大，这里的我把buf_size设为4096，batch_size设置为128

构建神经网络构建神经网络

这里我们以典型的AlexNet构建我们的神经网络结构，并进行微调

构建代码如下：

#定义CNN网络

class AlexNet(fluid.dygraph.Layer):

def __init__(self, name_scope, num_classes=65):

super(AlexNet, self).__init__(name_scope)

name_scope = self.full_name()

#在conv1中我将filter_size改成了3，stride改为了2，padding改为2，目的是使得图片卷积后尺度不变，(20+2*2(padding参数)-3(filter_size))/2(stride)+1 = 11(10.5+1向下取整）其他地方对照

conv1

self.conv1 = Conv2D(num_channels=1, num_filters=96, filter_size=3, stride=2, padding=2, act='relu')

self.pool1 = Pool2D(pool_size=2, pool_stride=2, pool_type='max')

self.conv2 = Conv2D(num_channels=96, num_filters=256, filter_size=3, stride=1, padding=2, act='relu')

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38622427

粉丝: 0
资源: 951

微调AlexNet进行车牌识别

卷积神经网络车牌识别

百度PaddlePaddle >>> 8. 用卷积神经网络玩转—车牌识别

百度paddle学习日记（三)—–车牌识别

paddle-lite 车牌识别

paddle手势识别dnn

飞桨ocr+车牌识别

paddle 文本识别 onnx c#

paddle声纹识别

paddle批量识别图片

paddle人脸识别代码

最新资源