HLS加速YOLO卷积层
时间: 2023-10-03 14:06:07 浏览: 127
基于HLS的Tiny_yolo卷积神经网络加速研究_张丽丽(2019-09-15-22-18_read)1
通过引用可以得知,对于HLS加速YOLO卷积层,可以使用一种高效普适性的加速器IP核。这个IP核可以用于硬件加速,并根据YOLO v2算法的不同网络层的运算功能进行硬件设计优化。在这个加速器IP核中,卷积层、池化层和重排序层的运算都会使用到同一IP核。该加速器IP核会从DRAM中持续读取数据并存储在不同的缓存单元中,在输出特征图数据复用的方式下完成不同的运算,并将最终的结果写回DRAM。对于数据复用策略,可以通过加载每个输出特征映射的权重,在计算开始之前进行数据复用,以减少访存降低时延。此外,还可以对输入特征图进行数据复用,即重复使用同一块输入特征图进行计算,并在所有卷积核计算完成后再更新输入数据。层融合是将YOLO v2的主要网络层融合到一起,将占据大部分运算量的卷积层和池化层都看作卷积运算,将路由层和重排序层视为存储重新整理,并在PL侧实现这些网络层。最后,通过高层次综合(High-level Synthesis,HLS)工具,可以将电路设计规范的算法级或行为级描述转化为电路结构描述的方法和过程,实现软件算法设计的硬件加速和硬件电路设计的抽象级设计和验证。使用Xilinx公司的Vivado HLS工具,可以将C、C++或SystemC语言编写的算法综合成VHDL或Verilog HDL语言的RTL代码,从而更高效地完成设计和仿真。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [目标检测YOLO实战应用案例100讲-基于FPGA的目标检测硬件加速技术及其应用研究](https://blog.csdn.net/qq_36130719/article/details/130768007)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文