"HLS加速研究：Tiny-yolo卷积神经网络"

需积分: 0 8 浏览量更新于2023-12-23 1 收藏 3.78MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

本篇论文是基于硬件语言综合（HLS）的Tiny Yolo卷积神经网络加速研究，由重庆大学通信工程学院张丽丽硕士所著。文章分为五个章节，包括绪论、卷积神经网络的基本理论及加速研究、基于HLS的Tiny Yolo卷积神经网络加速设计、实验验证及性能分析、结论与展望。在绪论部分，张丽丽介绍了课题研究的背景和意义，探讨了卷积神经网络的研究现状，并概述了论文的主要工作与章节安排。其中，对卷积神经网络（CNN）进行了介绍，阐述了其基本理论和发展历程，强调了CNN在计算机视觉和模式识别领域的重要性。随后，张丽丽明确了本文的研究目标和意义，即通过使用HLS对Tiny Yolo卷积神经网络进行加速，从而提高其实时性和性能。作为绪论的结束，对论文后续章节的安排做了简要概括。第二章为卷积神经网络的基本理论及加速研究。在这一部分，张丽丽首先介绍了CNN的基本结构和工作原理，详细阐述了卷积层、池化层和全连接层等核心组件的作用和计算过程。接着，她探讨了目前CNN加速的研究现状和常见的加速方法，比如硬件加速和软件优化等。通过与现有研究成果的比较分析，张丽丽指出了现有加速方法存在的局限性和可改进之处，为后续章节的研究奠定了理论基础。第三章为基于HLS的Tiny Yolo卷积神经网络加速设计。在这一章中，张丽丽详细介绍了HLS的基本原理和设计流程，阐述了HLS在CNN加速中的应用潜力。她提出了基于HLS的Tiny Yolo加速设计方案，包括网络模型压缩、并行计算优化和硬件架构设计等关键技术。通过具体的实验和案例分析，张丽丽验证了该设计方案的可行性和有效性，展示了其在提升Tiny Yolo网络性能方面的潜力。第四章为实验验证及性能分析。在这一部分，张丽丽详细描述了实验环境和数据集的选择，展示了基于HLS的Tiny Yolo加速方案在目标检测和图像识别任务中的性能表现。通过与未加速的Tiny Yolo网络进行对比实验，她验证了加速设计的有效性，并对加速后网络的性能进行了深入分析和评估。实验结果表明，基于HLS的Tiny Yolo卷积神经网络加速方案在提升网络速度和准确性方面取得了显著的成果。最后一章为结论与展望。在这一部分，张丽丽总结了整个论文的研究工作和成果，强调了基于HLS的Tiny Yolo卷积神经网络加速研究的创新性和重要性。她提出了当前研究工作存在的不足之处和未来的研究方向，为相关领域的后续研究提供了有益的启示。最后，张丽丽对本文的研究工作和成果进行了全面的总结和展望，为读者提供了进一步研究的思路和方向。综上所述，张丽丽在本文中通过对基于HLS的Tiny Yolo卷积神经网络加速的全面研究和实验验证，取得了一系列重要的研究成果。她的研究工作不仅在理论上有重要的创新性和前瞻性，而且在实际应用中具有显著的推广和应用价值。本文的发表将对相关领域的学术研究和工程应用产生一定的积极影响，为深入开展Tiny Yolo卷积神经网络加速研究提供了有价值的借鉴和参考。

资源详情

资源推荐

重庆大学硕士学位论文 1 绪论

第五章：结论与展望。结合各章节及实验结论对全文进行总结，并对以后的

研究工作进行了展望。

重庆大学硕士学位论文 2 卷积神经网络的基本理论及加速研究现状

2 卷积神经网络的基本理论及加速研究现状

2.1 卷积神经网络的概述

卷积神经网络 CNN（Convolution Neural Networks），本质上是一种多层感知

器，由生物学家通过研究猫的视觉皮层一步一步发展起来的

[24]

。视觉皮层细胞里

面的结构非常复杂，并且视觉皮层细胞对视觉输入空间子区域的敏感度极高，用

这样的方式平铺覆盖了整个视野区域，因此被称为感受野。对这些细胞进行有效

区分，分为简单细胞和复杂细胞两种类型。简单细胞对来自感受野范围内边缘刺

激的模式产生最大程度的响应，而复杂细胞的接受域较大，如果对复杂细胞进行

刺激的位置是确定的，那么复杂细胞就具有局部不变性。可以把处于神经网络中

的每个神经元节点都看作是线性的一维排列结构，层与层的每个神经元节点之间

的连接均是全部连接。但是，卷积神经网络里面层与层间神经元节点的连接并不

是全连接形式，而是在充分利用层间局部空间相关性的基础上，将上层的神经元

节点和相邻每层的神经元节点连接起来，被称为局部连接。卷积层的卷积滤波器

需要在整个感受野中执行重复操作，并对输入的图像进行实时卷积，卷积结果便

构成了输入图像的特征图，并以一定的规则提取图像的局部特征，这就是卷积神

经网络的权值共享。每个卷积滤波器采用相同偏置和权重矩阵，实现相同的参数

共享。卷积神经网络是一种特殊的能够对图像进行识别的方式，是一种非常有效

的带有前向反馈的网络。CNN 最初的主要目标是识别二维图形，因为它的网络结

构对平移、比例缩放、倾斜或其他形式具有高度不变性。现在，卷积神经网络结

构已被广泛应用在机器视觉、模式识别、视频监控和图像搜索等领域。

2.1.1 卷积神经网络的结构

图像通过输入层进入卷积神经网络，然后通过一系列隐藏层的转换,最后输出,

每个隐藏层都由一组神经元组成，每个神经元和前一层神经元的连接都是完全连

接，且单层神经元的功能是完全独立地，不存在任何连接共享。最后的全连接层

作为输出层，实现分类功能并输出分类的分值。

对于完全连接结构的神经网络在 CIFAR-10 训练集中，图片的大小为 32*32*3

（即 32 宽 32 高 3 颜色通道），第一隐藏层的神经元个数是 32*32*3=3072 个，这

个数字看起来能够接受，但这种全连接的结构不能适应更大的图片，比如一个大

小为 200*200*3 的图片，会产生 200*200*3=120000 个神经元。显而易见，这种完

全连接结构会造成很大的浪费，且过多的参数容易导致过拟合。

卷积神经网络的巨大优势在于对巨量图片的输入，能以一种更加合理的方式

限制其结构。卷积神经网络不同于一般神经网络结构，其各层安排在了长、宽、

重庆大学硕士学位论文 2 卷积神经网络的基本理论及加速研究现状

高三个维度上。我们可以看到，一层的神经元只连接到它前面层的小区域内，这

不同于上面所说的完全连接方式。作为多层神经网络之一的卷积神经网络，其结

构如图 2.1 所示。

图 2.1 卷积网络基本构型

Fig 2.1 The basic configuration of convolution network

输入图像通过 3 个不同的卷积过滤器后生成 3 个不同的特征映射图(即 C1 层)，

每个特征图的大小与输入大小一致，为了降低特征图的分辨率，在 C1 层之后进行

了池化操作，接着以 sigmoid 函数作为激活函数生成分辨率较低的特征映射图，然

后重复该过程得到 S4 层的特征图，最后将这些特征图的像素值连接成一个向量作

为神经网络的输出。

卷积神经网络的核心部分是特征提取和特征映射，在特征提取的时候每个神

经元与前一层的局部感受区域相连，然后提取局部特征；进行特征映射时所有神

经元共享权值，以此减少了整个神经网络的参数数量。而使用 sigmoid 函数对神经

元进行激活时，很大程度上保证了特征的位移不变性。将特征提取和特征映射结

合在一起，使得神经网络能够容忍输入样本的畸变进而提高网络的泛化能力。

利用映射面上共享权值的神经元，减少网络自由参数的个数，降低了网络参

数选择的难度。卷积神经网络中每一个卷积层后都有一个池化层，这个池化层是

用来求局部平均和二次提取，正是这种特有的两次特征抽取结构使网络对输入样

本有较高的畸变容忍能力。

卷积层和池化层是卷积神经网络两个重要的部分。卷积，对输入数据采用若

干个过滤器，每个过滤器对整个输入进行特征提取得到一个特征。例如，图像的

第一卷积层采用 4 个 6*6 过滤器，可获取 4 种特征，对图像使用一个过滤器之后

得到的结果，称为特征图谱。因此，特征图谱的数量与过滤器的数量一致。如果

前面的输入层也是一个卷积层，那么过滤器的输入就相当于前一层的所有特征图

剩余68页未读，继续阅读

马李灵珊

粉丝: 40
资源: 297

会员权益专享

"HLS加速研究：Tiny-yolo卷积神经网络"

YOLOv2_HLS.zip

CNN VivadoHLS

基于HLS的高效深度卷积神经网络FPGA实现方法1

基于HLS的高效深度卷积神经网络fpga实现方法

HLS 加速卷积神经网络

hls卷积神经网络实现

vivadohlsdsp_FPGA硬件加速学习vivado hls-----------------卷积加速

写一个在vitis HLS上用c语言开发的卷积神经网络加速器的代码

HLS加速YOLO卷积层

HLS卷积神经网络算子实现

android hls_key_info_file key_info_file

HLS ARRAY_PARTITION

hls java_如何使用nginx播放HLS流？

基于FPGA卷积神经网络的宿舍人脸检测

基于FPGA的yolov5卷积神经网络的目标检测 项目概况1000字

请给出vitis hls fft_demo代码

pynq跑卷积神经网络

javacv hls_key_info

ffmpeg 中在哪注册ff_hls_demuxer

ffmpeg 命令 -hls_wrap

会员权益专享

最新资源

基于FPGA的yolov5卷积神经网络的目标检测项目概况1000字