Eyeriss：面向高效能与灵活性的深度神经网络加速器架构创新

需积分: 5 21 浏览量更新于2024-06-30 收藏 13.02MB DOCX 举报

深度神经网络(DNNs)作为现代人工智能(AI)的核心技术，其广泛应用面临着高计算复杂度和多样化的网络结构所带来的挑战。为了实现在各种规模和形状的DNN上保持高性能和能源效率，高度灵活且节能的深度神经网络加速器(Eyeriss)被提出，它是一种软硬件协同设计的解决方案。 Eyeriss的设计重点在于提升性能、能源效率和灵活性。其关键创新在于RowStationary (RS) 数据流，这种数据流设计旨在减少在处理DNN时的数据移动，这是影响性能和能效的关键因素。RS数据流的优势在于它支持高度并行处理，能够有效利用多级存储层次中的数据重用，从而优化整个系统的能耗。与传统数据流相比，Eyeriss的RS数据流实现了显著的能量效率提升，达到1.4到2.5倍。 Eyeriss架构分为两个版本：Eyerissv1和Eyerissv2。Eyerissv1针对大规模、数据重用能力强的DNN，采用灵活的映射策略和高效的多播片上网络(NoC)，同时借助数据稀疏性减少了45%的处理单元(PE)功耗和1.9倍的片外带宽。在实际应用中，比如在65nm CMOS工艺下，Eyerissv1在处理AlexNet的转换层时，以34.7帧每秒的速度仅消耗278毫瓦，相比于移动GPU，其能效提升达10倍。而Eyerissv2则针对新兴的紧凑型DNN，这类网络在数据重用方面更具变化性。它采用了RS+数据流，提高了PE的利用率，并引入了灵活和可扩展的NoC，以适应不同的带宽需求。这使得Eyerissv2在相同数量的PE下提供远高于Eyerissv1的吞吐量。此外，Eyerissv2还利用了稀疏性和SIMD（单指令流多数据流）技术，进一步增强了其性能和能效。总结来说，高度灵活和节能的深度神经网络加速器Eyeriss通过创新的数据流和架构设计，解决了DNN计算的复杂性和多样性问题，为AI在现实世界的广泛应用提供了高效能的硬件支持。Eyerissv1和v2的差异化设计适应了不同规模和特点的DNN，展现出在性能和能效方面的优秀表现。

本文提出一种为 DNN 处理设计的加速器架构 Eyeriss，在性能、能效和灵活性方

面进行了优化。给定任何 DNN 模型，硬件都必须适应其特定配置，并针对性能和能

效进行相应优化。这是通过 DNN 处理数据流和硬件架构的协同设计来实现的。本章

的其余部分将提供理解这项工作细节所需的背景知识。具体地说,

1.1 节提供了 DNN 的概述，并描述了 DNN 处理中的挑战。1.2 节介绍了空间架构，

这是用于 DNN 加速的常用计算范式。第 1.3 节然后讨论了相关领域的先前工作。最

后，1.4 节总结了本文的贡献。

1.1 深度神经网络概述

1.1.1 最基本的

DNNs 是深度学习概念的实现，它是图 1-1 所示的更广泛的 AI 领域的一部分。它们

的灵感来自于生物神经系统如何交流和处理信息。在 DNN 中，原始的感觉输入数据

在时间或空间上被分层转换为高级抽象表示，以便提取有用的信息。这种转换被称

为推理，涉及多个阶段

图 1-1:人工智能领域的各个分支。

Artificial Intelligence

Machine Learning

Brain-Inspired

Spiking

Neural

Networks

Deep

Learning

剩余138页未读，继续阅读

elec_zxm

粉丝: 5

Eyeriss：面向高效能与灵活性的深度神经网络加速器架构创新

基于FPGA的深度学习加速器设计与实现

链接器：用于深度学习的灵活的神经网络框架

硬件加速器的设计

深度神经网络硬件架构：ISCA-2017教程

基于粗粒度数据流架构的稀疏卷积神经网络加速.pdf

Imagination发布PowerVR Series3NX神经网络加速器,为嵌入式人工智能市场带来多核可扩展性.pdf

基于细粒度数据流架构的稀疏神经网络全连接层加速.pdf

网络游戏-用于加速神经网络处理器的方法和系统及神经网络处理器.zip

MIT教授Sze深度解析：DNN硬件加速器的节能与高效计算策略

寒武纪DianNao系列：神经网络加速技术解析

最新资源