Eyeriss:面向高效能与灵活性的深度神经网络加速器架构创新

需积分: 5 3 下载量 31 浏览量 更新于2024-06-30 收藏 13.02MB DOCX 举报
深度神经网络(DNNs)作为现代人工智能(AI)的核心技术,其广泛应用面临着高计算复杂度和多样化的网络结构所带来的挑战。为了实现在各种规模和形状的DNN上保持高性能和能源效率,高度灵活且节能的深度神经网络加速器(Eyeriss)被提出,它是一种软硬件协同设计的解决方案。 Eyeriss的设计重点在于提升性能、能源效率和灵活性。其关键创新在于RowStationary (RS) 数据流,这种数据流设计旨在减少在处理DNN时的数据移动,这是影响性能和能效的关键因素。RS数据流的优势在于它支持高度并行处理,能够有效利用多级存储层次中的数据重用,从而优化整个系统的能耗。与传统数据流相比,Eyeriss的RS数据流实现了显著的能量效率提升,达到1.4到2.5倍。 Eyeriss架构分为两个版本:Eyerissv1和Eyerissv2。Eyerissv1针对大规模、数据重用能力强的DNN,采用灵活的映射策略和高效的多播片上网络(NoC),同时借助数据稀疏性减少了45%的处理单元(PE)功耗和1.9倍的片外带宽。在实际应用中,比如在65nm CMOS工艺下,Eyerissv1在处理AlexNet的转换层时,以34.7帧每秒的速度仅消耗278毫瓦,相比于移动GPU,其能效提升达10倍。 而Eyerissv2则针对新兴的紧凑型DNN,这类网络在数据重用方面更具变化性。它采用了RS+数据流,提高了PE的利用率,并引入了灵活和可扩展的NoC,以适应不同的带宽需求。这使得Eyerissv2在相同数量的PE下提供远高于Eyerissv1的吞吐量。此外,Eyerissv2还利用了稀疏性和SIMD(单指令流多数据流)技术,进一步增强了其性能和能效。 总结来说,高度灵活和节能的深度神经网络加速器Eyeriss通过创新的数据流和架构设计,解决了DNN计算的复杂性和多样性问题,为AI在现实世界的广泛应用提供了高效能的硬件支持。Eyerissv1和v2的差异化设计适应了不同规模和特点的DNN,展现出在性能和能效方面的优秀表现。