CUDA：异构计算开启GPU编程革命与NVIDIA Turing架构解析

133 浏览量更新于2024-08-28 收藏 842KB PDF 举报

异构计算是一种计算机系统设计策略，它利用不同类型和架构的处理器协同工作，以提升整体性能。在CUDA（Compute Unified Device Architecture）的背景下，这种概念尤为突出。CUDA是由NVIDIA公司开发的一种并行计算平台，最初是为了利用图形处理单元（GPU）的强大并行处理能力扩展传统CPU的应用领域。异构计算的关键在于理解不同硬件间的差异。例如，传统的CPU基于x86架构，拥有复杂的指令集，负责执行顺序控制和逻辑运算，同时拥有较小的L1、L2和L3缓存以及内存访问能力。而GPU原本设计用于图形渲染，拥有众多并行计算核心（Stream Multiprocessors, SM），适合处理高并行性的任务，如图像处理和科学计算。在CUDA中，CPU扮演"主机"或"控制者"的角色，负责任务调度和数据管理，GPU则作为"设备"执行大量的并行计算。通过PCIe接口连接，CPU将计算任务分派给GPU，GPU执行完毕后再将结果返回给CPU进行整合。这样的异构架构使得GPU可以高效地处理大规模的数据并行任务，如深度学习中的矩阵运算和神经网络训练。然而，异构计算也带来了复杂性，因为涉及CPU和GPU之间的通信协调，以及可能存在的数据传输延迟。这需要开发者编写专门的并行代码，并利用CUDA编程模型，如CUDA C++或Python的cupy库，来利用GPU的特性。同时，硬件的升级和优化，如NVIDIA的Turing架构，不断推动着异构计算技术的发展，使其在高性能计算、科学计算和人工智能等领域发挥越来越重要的作用。 CUDA之异构计算是现代高性能计算的重要组成部分，它不仅提升了计算效率，还推动了计算机硬件与软件的创新，为未来的科技发展奠定了基础。

CUDA之异构计算与之异构计算与CUDA

异构计算

异构计算，首先必须了解什么是异构，不同的计算机架构就是异构，上文书我们讲过计算机架构了，就是为了引出异构的概

念，按照指令集划分或者按照内存结构划分，但是我觉得只要两片CPU型号不一样就应该叫异构（这个想法先保留，对错不

确定）。

GPU本来的任务是做图形图像的，也就是把数据处理成图形图像，图像有个特点就是并行度很高，基本上一定距离意外的像

素点之间的计算是独立的，所以属于并行任务。

GPU之前是不可编程的，或者说不对用户开放的，人家本来是做图形计算控制显示器的，虽然对用户不可编程，但是你只要

把硬件卖给了我，就由不得你了，然后就有hacker开始想办法给GPU编程，来帮助他们完成规模较大的运算，于是他们研究

着色语言或者图形处理原语来和GPU对话。后来黄老板发现了这个是个新的功能啊，然后就让人开发了一套平台，CUDA，然

后深度学习火了，顺带着，CUDA也火到爆炸。

刚刚最新消息，英伟达新版本GPU架构会被命名为Turing，一丝欣慰，发自内心深处地敬那些为世界进步做出了杰出贡献的人

们，他们是人类未来的希望。

x86 CPU+GPU的这种异构应该是最常见的，也有CPU+FPGA，CPU+DSP等各种各样的组合，CPU+GPU在每个笔记本或者

台式机上都能找到。当然超级计算机大部分也采用异构计算的方式来提高吞吐量。

异构架构虽然比传统的同构架构运算量更大，但是其应用复杂度更高，因为要在两个设备上进行计算，控制，传输，这些都需

要人为干预，而同构的架构下，硬件部分自己完成控制，不需要人为设计。

异构架构

举一个我用的工作站的构成，我使用的是一台 intel i7-4790 CPU加上两台Titan x GPU构成的工作站，GPU插在主板的PCIe卡

口上，运行程序的时候，CPU像是一个控制者，指挥两台Titan完成工作后进行汇总，和下一步工作安排，所以CPU我们可以

把它看做一个指挥者，主机端，host，而完成大量计算的GPU是我们的计算设备，device。

上面这张图能大致反应CPU和GPU的架构不同。

左图：一个四核CPU一般有四个ALU，ALU是完成逻辑计算的核心，也是我们平时说四核八核的核，控制单元，缓存也在片

上，DRAM是内存，一般不在片上，CPU通过总线访问内存。

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38545117

粉丝: 9
资源: 917

CUDA：异构计算开启GPU编程革命与NVIDIA Turing架构解析

异构计算与 MIC、CUDA 编译使用简介.pdf

7.CUDA C编程权威指南 (1)1

CUDA异构计算：GPU编程与CUDA平台解析

CUDA与OpenCL：异构计算的较量

异构计算详解：MIC与CUDA编程入门

CUDA编程入门：异构并行计算与GPU基础

CUDA编程：kingst LA5016逻辑分析仪与异构计算

CUDA异构计算：CPU与GPU协同计算深度学习

CUDA中的针对异构计算设备的优化

《CUDA By Example》中文译名《GPU高性能编程CUDA实战》是研究GPGPU异构并行计算非常不错的工具书。

最新资源