云端FPGA卷积神经网络加速器:设计与调度优化

需积分: 50 2 下载量 136 浏览量 更新于2024-08-13 1 收藏 1.64MB PDF 举报
"面向云端FPGA的卷积神经网络加速器的设计及其调度" 本文主要探讨了在云端环境下,针对卷积神经网络(CNN)的高计算复杂性问题,提出了一种面向现场可编程门阵列(FPGA)的CNN加速器设计方法及相应的调度策略。CNN在实时和低功耗应用中的广泛应用受到了其计算密集型特性限制,传统的软件实现往往无法满足性能和功耗的需求。而FPGA由于其可重构性,为CNN提供了硬件加速的可能性。 设计中,研究团队采用了高层次综合(HLS)技术,结合循环切割参数和卷积层循环重排的方法,来构建模块化的网络结构。通过这种方式,可以简化设计流程,缩短开发周期,并增大优化空间。此外,他们还进行了参数拓展,以优化加速器的处理过程,提高计算效率。 在调度机制方面,研究人员深入分析了系统任务和FPGA资源的特性,提出了一套综合考虑控制流和数据流优化的调度方案。控制流优化旨在减少指令执行的延迟,而数据流优化则关注数据传输的效率和并行性。这种双管齐下的优化策略旨在提高加速器的灵活性、能效和性能。 与其他现有的工作相比,提出的加速器方案具备显著的优势,它能够提供一个既灵活又节能的解决方案。实验结果显示,该加速器能够在提升运算速度的同时,显著降低功耗,这对于云端环境中的大规模CNN应用来说至关重要。 该研究由NSFC-广东联合基金资助项目和广东省杰出青年科学基金资助,由蔡瑞初教授领导的一组研究人员完成,他们在深度学习、因果关系、神经网络优化等领域有深厚的研究背景。文章的发表对于推动FPGA在CNN加速领域的应用具有重要意义,为未来硬件加速器的设计和调度提供了新的思路和实践基础。