"异构计算与GPU框架选型指南"

需积分: 0 1 下载量 90 浏览量 更新于2023-12-30 1 收藏 792KB PDF 举报
第十五章《异构运算、GPU及框架选型》介绍了深度学习中异构计算、GPU架构以及框架选型相关的知识和指南。首先,书中解释了什么是异构计算以及GPGPU,即通用计算图形处理单元,简单地理解就是利用GPU进行通用计算。接着,详细介绍了GPU的架构,包括了CUDA核心和为什么要使用GPU,以及在深度学习中的应用和新图灵架构中tensor core对深度学习的作用。接下来,书中讨论了CUDA框架,包括了CUDA编程难度、cuDNN等内容,以及GPU硬件环境配置的推荐和软件环境搭建的建议,包括了操作系统的选择、常用基础软件的安装、本机安装和使用docker、GPU驱动等问题。然后,书中详细比较了主流框架,并列出了框架的详细信息,讨论了对部署环境友好的框架和移动平台的框架选择。最后,书中还涉及了多GPU环境的配置、分布式训练、在SPARK环境中训练或部署模型、性能优化等内容。 异构计算指的是利用多种异构处理器(如CPU、GPU、FPGA等)协同工作,将不同类型的计算任务分配给最适合处理的处理器进行并行处理。GPGPU是通用计算图形处理单元的简称,是指利用图形处理器进行通用计算的技术。GPU的架构包括了CUDA核心,是一种并行计算架构,它可以大大加速通用计算任务。CUDA(Compute Unified Device Architecture)是由NVIDIA推出的并行计算框架,可用于在GPU上进行通用计算。在深度学习中,GPU广泛应用于加速训练和推断过程,而新图灵架构中的tensor core对深度学习有着更大的加速作用。 在选择GPU硬件环境时,需要考虑主要的性能指标,并结合实际需求进行购买建议。在软件环境搭建方面,需要考虑操作系统的选择、常用基础软件的安装方式、使用本机安装还是docker、GPU驱动等问题。在框架选择方面,需要比较主流框架并根据部署环境、移动平台等需求进行选择。此外,还需要考虑多GPU环境的配置、分布式训练、在SPARK环境中训练或部署模型、性能优化等问题。 总的来说,第十五章的内容十分丰富全面,从理论到实践都有所涉及,对于深度学习相关领域的从业者具有很高的参考价值。通过学习本章内容,读者可以全面了解异构运算、GPU架构以及框架选型相关的知识,并能够根据实际需求进行硬件和软件环境的搭建和选择,从而提高深度学习模型训练和推断的效率和性能。