英伟达Volta架构解析：Tesla V100 GPU引领深度学习新纪元

需积分: 0 77 浏览量更新于2024-08-04 收藏 1.51MB DOCX 举报

"201708010609-吕智龙-Tesla GPU1" 在2017年的GPU技术大会（GTC2017）上，NVIDIA推出了其全新的GPU架构——Volta，以及首款基于该架构的Tesla V100加速卡，这款显卡被誉为全球最先进的数据中心GPU。Volta架构的设计目标是为了满足日益增长的深度学习任务需求，以及高性能计算（HPC）领域的挑战。NVIDIA致力于为数据科学家提供更强大的硬件支持，以应对人工智能（AI）领域中复杂问题的解决。 Tesla V100加速卡搭载了Volta GV100 GPU，并采用了SXM2 Form Factor，旨在优化企业级计算和AI融合应用。NVIDIA CEO 黄仁勋强调，新的Tesla V100专为HPC和AI的融合而生，它引入了创新技术，提升了GPU的性能表现。 Volta架构并非Pascal架构的简单升级，而是一个全新的设计。据NVIDIA应用深度学习研究副总裁Bryan Catanzaro介绍，Volta架构提供了巨大的浮点运算能力（FLOPs），这使得研究人员能够运用更高计算需求的深度学习模型。随着硬件的可编程性增强，深度学习的发展也得到了推动。Volta架构的设计理念是适应不断进化的模型需求，通过更多的FLOPs来处理卷积等计算密集型任务。在GTC2017的技术讲座中，NVIDIA的CUDA软件首席工程师和首席架构师深入解析了Volta架构的设计思路。他们指出，对于需要联网的设备，未来趋势将是借助CPU和GPU的混合云平台进行大规模计算。而在无法联网的环境中，集成型SoC（System on Chip）方案可能更为合适。 Volta架构的发布，标志着NVIDIA在GPU技术上的又一次重大飞跃，它不仅提升了GPU的计算性能，也为深度学习和高性能计算带来了革新。Volta架构的出现，预示着未来的硬件设计将更加专注于优化深度学习模型的运行效率，以应对日益复杂的AI应用场景。

的首席工程师表示他们已在功耗和性能之间做出了最佳选择。

图 2． Tesla V100 在 ResNet－50 深度神经网络训练任务中的速度比 Tesla P100 快

2．4 倍。如果每张图像的目标延迟是 7ms，那么 Tesla V100 使用 ResNet－50 深度神经

网络进行推理的速度比 P100 快 3．7 倍（参与测试的 V100 为原型卡）。

Tesla V100 的主要计算特征包括：

● 为深度学习优化过的新型流式多处理器（SM）架构。Volta 对 GPU 核心的 SM 处

理器架构进行了重要的重新设计。新的 Volta SM 架构比前代 Pascal 设计能效高 50％，

在同样的功率范围下 FP32 和 FP64 性能有重大提升。新的 Tensor Core 是专门为深度学

习设计的，为浮点运算速度带来了 12 倍的提升。有了独立的、并行的整型和浮点型数据

通路，Volta SM 在负载上也更高效，混合了计算与地址运算。Volta 新的独立线程调度能

力使得并行线程之间的细粒度同步协同（finer－grain synchronization and cooperation）成

为可能。最终，新型的 L1 Data Cache 与 Shared Memory 子系统的结合也能极大地提升性

能，同时还简化了编程。

● 第二代 NVLink。第二代英伟达 NVLink 高速互连技术能提供更高的带宽、更多连接，

同时还改进了多 GPU 和多 GPU／CPU 系统配置的延展性。

● HBM2 显存：更快、更高效。Volta 高度调整的 16GB HBM2 显存子系统提供了 900

GB／s 的峰值显存带宽。来自三星的新一代 HBM2 显存和 Volta 中的新一代显存控制器的

组合实现的显存带宽是 Pascal GP100 的 1．5 倍，而且在许多负载上的显存带宽效率更高。

● Volta 多处理服务。Volta 多服务处理（MPS：Multi－Process Service）是 Volta GV100

的一项新特性，能够为 CUDA MPS 服务器的关键组件提供硬件加速，从而能为共享该 GPU

的多个计算应用提供更高的性能、隔离和更好的服务质量（QoS）。Volta MPS 还将 MPS

剩余11页未读，继续阅读

伯特兰·罗卜

粉丝: 27
资源: 309

英伟达Volta架构解析：Tesla V100 GPU引领深度学习新纪元

201708010609-吕智龙-Summit架构1

智能1702-李博文-201708010602-tesla gpu1

Volta-Architecture-Whitepaper：NVIDIA TESLA V100 GPU ARCHITECTURE.pdf

ui-clone-homepage-tesla：Tesla主页的Ui克隆

Tesla-V100-PCIe-Product （Tesla V100显卡）

Big-Scale-Analytics-2021-Tesla:特斯拉集团（Tesla Group）的课程项目2021年大规模分析

Tribute-to-NIKOLA-TESLA

homebridge-tesla-powerwall：Tesla Powerwall的Homebridge插件

藏经阁-Free-Fall-Hacking-Tesla-From-Wireless-To-CAN-Bus.pdf

Svelte-Tesla-Clone:www.tesla.com用Card.svelte制成的克隆

最新资源