CUDA异构计算：GPU编程与CUDA平台解析

170 浏览量更新于2024-08-27 1 收藏 844KB PDF 举报

"CUDA之异构计算与CUDA" 在IT领域，异构计算是一种利用不同架构的处理器协同工作以提升计算效率的技术。这里的“异构”指的是由不同类型的处理器（如CPU、GPU、FPGA或DSP）组成的系统。在这种计算模式中，每种处理器负责其最擅长的任务，从而实现整体性能的优化。 CUDA，全称Compute Unified Device Architecture，是由NVIDIA公司推出的编程模型，专门针对其GPU（图形处理单元）进行高性能计算。CUDA为开发者提供了一个直接编程GPU的平台，使得GPU不仅可以用于图形渲染，还可以用于科学计算、机器学习、数据分析等需要大规模并行计算的应用场景。 GPU原本设计用于处理图形和图像，它的核心特性是对并行计算的支持。由于图像中的像素点计算通常可以独立进行，GPU拥有数千个处理核心，能够同时处理大量数据，这使其在并行计算方面具有显著优势。早期，GPU编程并不常见，但随着黑客和研究人员的努力，他们开始利用图形处理原语或着色语言与GPU交互，为大规模计算找到了新的解决方案。 NVIDIA的创始人黄仁勋意识到GPU的潜力，推出了CUDA，使得GPU编程变得更加系统化和易于访问。CUDA提供了C/C++的编程接口，以及一系列库函数，支持开发者编写高效能的应用程序。随着深度学习的兴起，需要大量并行计算的任务越来越多，CUDA也因此获得了广泛应用。异构计算架构中，CPU通常作为主控制器，负责任务调度和数据管理，而GPU则承担大量的计算工作。例如，在一个配备Intel i7-4790 CPU和两块NVIDIA Titan X GPU的工作站中，CPU会分配任务给GPU，并收集处理结果，进行后续操作。CPU和GPU之间通过PCIe总线进行通信，CPU作为host，GPU作为device，两者协同完成复杂的计算任务。在架构上，CPU通常包含几个核心，每个核心有一个或多个ALU（算术逻辑单元）以及控制单元和缓存。DRAM作为主内存，与CPU通过总线进行数据交换。相比之下，GPU拥有更多数量的ALU，设计专注于执行并行任务，且通常拥有更高效的内存架构，如纹理单元和流处理器，以加速图形和计算操作。 CUDA和异构计算为解决高性能计算需求提供了一种有效途径，尤其是在处理大数据、机器学习和人工智能等领域。虽然异构计算带来了更高的计算能力，但也增加了编程的复杂性，需要开发者理解和管理不同处理器间的交互，包括数据传输和任务调度。然而，随着工具和库的发展，异构计算已经成为现代计算技术的重要组成部分，推动了科技的快速发展。

CUDA之异构计算与之异构计算与CUDA

异构计算

异构计算，首先必须了解什么是异构，不同的计算机架构就是异构，上文书我们讲过计算机架构了，就是为了引出异构的概

念，按照指令集划分或者按照内存结构划分，但是我觉得只要两片CPU型号不一样就应该叫异构（这个想法先保留，对错不

确定）。

GPU本来的任务是做图形图像的，也就是把数据处理成图形图像，图像有个特点就是并行度很高，基本上一定距离意外的像

素点之间的计算是独立的，所以属于并行任务。

GPU之前是不可编程的，或者说不对用户开放的，人家本来是做图形计算控制显示器的，虽然对用户不可编程，但是你只要

把硬件卖给了我，就由不得你了，然后就有hacker开始想办法给GPU编程，来帮助他们完成规模较大的运算，于是他们研究

着色语言或者图形处理原语来和GPU对话。后来黄老板发现了这个是个新的功能啊，然后就让人开发了一套平台，CUDA，然

后深度学习火了，顺带着，CUDA也火到爆炸。

刚刚最新消息，英伟达新版本GPU架构会被命名为Turing，一丝欣慰，发自内心深处地敬那些为世界进步做出了杰出贡献的人

们，他们是人类未来的希望。

x86 CPU+GPU的这种异构应该是最常见的，也有CPU+FPGA，CPU+DSP等各种各样的组合，CPU+GPU在每个笔记本或者

台式机上都能找到。当然超级计算机大部分也采用异构计算的方式来提高吞吐量。

异构架构虽然比传统的同构架构运算量更大，但是其应用复杂度更高，因为要在两个设备上进行计算，控制，传输，这些都需

要人为干预，而同构的架构下，硬件部分自己完成控制，不需要人为设计。

异构架构

举一个我用的工作站的构成，我使用的是一台 intel i7-4790 CPU加上两台Titan x GPU构成的工作站，GPU插在主板的PCIe卡

口上，运行程序的时候，CPU像是一个控制者，指挥两台Titan完成工作后进行汇总，和下一步工作安排，所以CPU我们可以

把它看做一个指挥者，主机端，host，而完成大量计算的GPU是我们的计算设备，device。

上面这张图能大致反应CPU和GPU的架构不同。

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38612648

粉丝: 12
资源: 920

CUDA异构计算：GPU编程与CUDA平台解析

CUDA：异构计算开启GPU编程革命与NVIDIA Turing架构解析

异构计算详解：MIC与CUDA编程入门

CUDA与OpenCL：异构计算的较量

异构计算与 MIC、CUDA 编译使用简介.pdf

CUDA编程入门：异构并行计算与GPU基础

CUDA编程：kingst LA5016逻辑分析仪与异构计算

CUDA异构计算：CPU与GPU协同计算深度学习

CUDA中的针对异构计算设备的优化

《CUDA By Example》中文译名《GPU高性能编程CUDA实战》是研究GPGPU异构并行计算非常不错的工具书。

异构计算与OpenCL实战指南

最新资源