FPGA深度学习加速器：inna1.0自适应映射技术解析

需积分: 5 96 浏览量更新于2024-11-15 收藏 365.2MB ZIP 举报

资源摘要信息:"inna1.0是一个基于FPGA的CNN自适应映射技术。该技术在FPGA板卡上设计深度学习加速器，并对其进行了优化，旨在实现业界领先的性能和功耗指标。其核心映射技术采用了宏指令的Look-Aside Acceleration框架，实现了快速部署、软硬件协同优化，并支持多种卷积操作，无需主机干预即可执行。项目的软件部分专注于实现CNN映射编译器和CNN量化器。CNN映射编译器从TensorFlow模型文件解析生成CNN计算图模型，并根据这个计算图和现有的CNN加速库单元，选择相应的CNN库单元，生成硬件结构和调度器配置参数，实现计算、片上存储、片上带宽和片外带宽的均衡优化，以达到最优的计算性能。而CNN量化器则将模型的权重文件进行8位定点量化，以适应FPGA的DSP计算能力，在保证精度的前提下减少存储需求，提高处理速度，降低功耗。" 1. FPGA基础与应用 - FPGA（现场可编程门阵列）是一种可以通过编程来配置的集成电路，允许用户在不同的硬件逻辑之间重新编程。 - FPGA在深度学习领域中主要用于加速器设计，因其可编程性、高并行性和低延迟的特点，适用于快速执行复杂的算法。 2. 深度学习加速器 - 深度学习加速器是专门为执行深度学习算法优化的硬件加速器，与传统处理器相比，在执行深度学习任务时能够提供更高的效率。 - FPGA是设计深度学习加速器的常用硬件平台，通过其可配置性能够定制硬件逻辑以适应特定的算法需求。 ***N自适应映射技术 - CNN（卷积神经网络）是深度学习中的一种重要网络结构，广泛应用于图像和视频分析等任务。 - 自适应映射技术能够根据CNN模型的特点和计算需求，将模型映射到硬件资源上，实现高效执行。 4. Look-Aside Acceleration框架 - Look-Aside Acceleration是一种加速技术，它允许加速器在无需CPU干预的情况下独立执行任务。 - 该框架通过旁路加速方式，减少主机CPU的负担，降低通信开销，提升整体性能。 5. 软硬件协同优化 - 软硬件协同优化是指硬件和软件一起设计，以实现性能的最优化。 - 这种方法要求硬件设计和软件算法紧密结合，相互适配，共同优化以达到最佳的性能表现。 ***N映射编译器 - CNN映射编译器是专门针对CNN模型进行编译的工具，它能够解析CNN模型并生成适用于特定硬件的执行代码。 - 该编译器能够根据模型和硬件加速库单元，合理分配硬件资源，配置调度器，以实现高效执行。 ***N量化器 - 量化技术是指将模型参数从高精度浮点数转换为低精度整数的过程，目的是减少模型大小和计算需求。 - CNN量化器通过对权重文件进行8位定点量化，便于FPGA上的DSP进行计算，同时保持精度，减少存储需求，提高处理速度。 8. Tensorflow与模型解析 - Tensorflow是广泛使用的机器学习框架之一，它提供了丰富的工具和库来训练和部署机器学习模型。 - 模型解析是指将Tensorflow产生的模型文件转换为CNN计算图模型的过程，这一步是CNN映射编译器工作的起点。 9. 硬件结构和调度器配置 - 在FPGA上实现的硬件结构是指实际的硬件逻辑电路布局，这决定了硬件资源的物理分配和连接。 - 调度器配置参数是指导硬件如何执行任务的一系列设置，它涉及任务调度、数据流管理等多个方面。 10. 性能与功耗的均衡优化 - 性能与功耗的均衡优化是指在不牺牲性能的前提下，尽可能地降低设备的能耗。 - 这通常涉及到算法优化、硬件设计调整以及电源管理策略等多方面的考量。 11. 存储与带宽优化 - 在深度学习加速器设计中，片上存储和带宽资源是重要的考量因素，它们直接关系到数据处理的速度和效率。 - 存储与带宽的优化涉及到数据的存储位置、传输路径以及缓存策略等，以实现高效的数据流动。 12. FPGA上的DSP计算 - FPGA内置的数字信号处理器（DSP）单元可以用于执行特定的数学运算，如乘法和累加，这些是深度学习算法中常见的计算任务。 - 利用FPGA上的DSP进行计算可以实现更高的计算密度和更低的功耗。通过inna1.0这个项目，可以看出在深度学习领域，FPGA技术的运用不仅能够提升计算效率，还能在保持精度的同时降低能耗，为高性能低功耗的深度学习应用提供了新的可能性。

收起资源包目录

inna映射技术-其他（82个子文件）

resnet50_v1-0aee57f9.params 97.79MB

generate_data 13KB

active.json 390B

ILSVRC2012_val_00000014.JPEG 105KB

ILSVRC2012_val_00000007.JPEG 162KB

inna.quantizer.rst 77B

SOURCES.txt 871B

restnet50_v1.1.onnx 97.74MB

resnet50_first_5_layers.json 2KB

ILSVRC2012_val_00000018.JPEG 112KB

dependency_links.txt 1B

ILSVRC2012_val_00000003.JPEG 120KB

ILSVRC2012_val_00000017.JPEG 193KB

scheduler.py 5KB

make.bat 791B

compiler.py 3KB

ILSVRC2012_val_00000005.JPEG 127KB

PKG-INFO 218B

ILSVRC2012_val_00000019.JPEG 25KB

top_level.txt 5B

__init__.py 0B

__init__.py 61B

test_cases.py 5KB

ILSVRC2012_val_00000006.JPEG 148KB

resnet50_weights.h5 98.09MB

LICENSE 11KB

.gitmodules 0B

quantize_tf.py 17KB

inna.rst 77B

runtime.py 10KB

conf.py 9KB

api.rst 48B

Makefile 584B

mxnet.py 353B

onnx.py 336B

quantize.py 8KB

simulator.py 6KB

index.rst 445B

resnet50_without_bn_test.pb 97.43MB

install_inna.sh 454B

inspur.png 15KB

ILSVRC2012_val_00000013.JPEG 98KB

ILSVRC2012_val_00000015.JPEG 194KB

generate_data.cc 3KB

setup.py 3KB

assembler.py 16KB

tensorflow.py 1KB

__init__.py 40B

__init__.py 124B

config.ini 265B

__init__.py 94B

install.rst 395B

ILSVRC2012_val_00000001.JPEG 107KB

pool.json 353B

converter.py 8KB

quantize_caffe.py 19KB

ILSVRC2012_val_00000011.JPEG 257KB

inna.runtime.rst 658B

ILSVRC2012_val_00000008.JPEG 105KB

说明.htm 4KB

frontend.py 2KB

README.md 2KB

quantize_base.py 10KB

requirements.txt 136B

inna.compiler.rst 154B

ILSVRC2012_val_00000010.JPEG 139KB

keras.py 514B

not-zip-safe 1B

__init__.py 83B

requires.txt 26B

eltwise.json 330B

.gitignore 149B

runtime.cc 12KB

ILSVRC2012_val_00000009.JPEG 112KB

generate_instr.py 957B

runtime.h 1KB

ILSVRC2012_val_00000016.JPEG 152KB

runtime.cpp 12KB

ILSVRC2012_val_00000004.JPEG 83KB

ILSVRC2012_val_00000012.JPEG 119KB

ILSVRC2012_val_00000002.JPEG 137KB

__init__.py 109B

共 82 条

weixin_38724333

粉丝: 5
资源: 955

FPGA深度学习加速器：inna1.0自适应映射技术解析

基于FPGA的CNN自适应映射技术-inna1.0

inna映射技术 v1.0

Inna Tab-crx插件

inna1.0-master.zip

inna1.0是一个基于FPGA的CNN自适应映射技术 .rar

Inna-r.github.io

1174641-device-30：Inna Makhova

1174641-mishka-22:因娜·马科娃（Inna Makhova）

Inna12018：简历

【0416】inna开源代码免责声明1

最新资源