NVIDIA DGX-2服务器与NVSwitch:构建超大规模计算的新里程碑

需积分: 50 3 下载量 127 浏览量 更新于2024-07-18 收藏 1.39MB PDF 举报
"hotchip 2018 2.01" 在2018年的Hot Chips技术研讨会上,NVIDIA公司介绍了他们的NVSwitch和DGX-2服务器,这是一个重大突破,展示了他们在高性能计算和数据中心领域的创新。NVSwitch是一款全新的高速互连芯片,而DGX-2则是基于这款芯片构建的先进计算服务器。 NVSwitch是NVIDIA推出的第二代NVLink技术,它提供了前所未有的带宽性能。每个端口速度高达25GBps,总双向带宽达到900GBps,总吞吐量为450GBps。这一创新设计构成了一个全带宽的胖树拓扑结构,使得12个NVSwitch网络能够实现2.4TBps的分割带宽。这种高带宽的特性使得在多GPU之间的数据传输变得极为高效,为大规模并行计算和深度学习应用提供了基础。 DGX-2服务器是基于这些技术构建的16个Tesla V100 32GB GPU的单服务器系统。这些GPU在浮点运算能力上表现出色,FP64运算能力达到125TFLOPS,FP32为250TFLOPS,而对于深度学习计算,Tensor核心可提供2000TFLOPS的运算能力。每个GPU拥有512GB的HBM2显存,服务器总内存容量达到1.5TB DDR4,存储容量为30TB NVMe,这为大规模数据处理提供了强大的硬件支持。 服务器设计还包括两颗24核的Intel Xeon CPU,为系统提供了强大的计算和调度能力。在信号完整性的设计上,NVIDIA也做了细致的工作,确保了在高频率、大带宽下的稳定运行。 DGX-2服务器的架构设计允许所有GPU共享全局内存,无需重复器,这意味着数据可以在GPU之间直接高速交换,减少了延迟,提高了整体计算效率。这种“一个巨大的GPU”概念通过NVSwitch实现了多GPU间的无缝协同工作,就如同它们是一个单一的、高性能的计算单元。 演讲提纲还涵盖了NVLink技术的回顾,NVSwitch的速度和性能,以及DGX-2服务器的设计、性能和封装。通过这些技术和系统的实现,NVIDIA成功地展示了如何在单个服务器中实现惊人的计算性能,这对于科学计算、机器学习和人工智能研究具有重大意义。 Hot Chip 2018中的NVSwitch和DGX-2服务器是NVIDIA对高带宽、低延迟计算解决方案的革新,推动了数据中心和AI计算的边界,为未来的技术发展奠定了坚实的基础。
312 浏览量
由于上传大小的限制分成了两部分,第二个分卷就不要分了 以下是主要的修改: 添加了一些API的识别. 添加到290个结构体&枚举类型. 添加到2504个API函数结构. 包含了部分VB常见函数,部分VC函数.包含部分MSVCRT.DLL函数. 该版本看雪的论坛中下载(添加过API后版本) 主要修改: 1、自动配置UDD、PLUGIN为绝对路径 2、解决 OD 格式化 Long Double 错误 3、OD数据窗口复制BUG 4、引入OllyDbg Fix Module v0.9.0.0 插件,并修正在调试时不支持相对路径 5、集成了Loadpe,ImportREC,记事本、计算器等破解常用工具 6、编写了自定义管理工具,并集成到OD到配置菜单中。 ollydbg为英文版,未做修改。 注:OD在调试程序是,无法打开配置程序,本人水平有限,无法修正 发现Bug,请及时通告,e_mail:gjianbo@163.com QQ:30481007 以下是OllyDbg Fix Module的介绍 OllyDbg Fix Module v0.9.0.0 使用 LordPE 等工具在 Ollydbg 导入表中添加以下 dll 和函数即可使用增强功能,完成补丁: dll ==> OllyPath.dll 函数 ==> Set0llyPatch 注意:如果使用 PETools,可能会导致原程序无法运行。 ======================================================================== OllyDbg Fix Module v0.9.0.0 功能 更改 Ollydbg 各窗口的类名称和标题文本,增加隐蔽性; 添加自定义工具菜单; 将载入的插件数由 32 扩展到 50 或更多; 修正格式化字符串的漏洞 [OutPutDebugString]; 在 CPU 数据窗口选择数据时,可以显示地址和选择范围等.... 增强的 LoadDll.exe 文件 ======================================================================== OllyPath.ini 设置 FIX_CLASSANDTEXT=Y 是否更改窗口的类和标题栏文本 [Y=是,N=否] FIX_TOOLSMENU=Y 是否使用工具菜单 FIX_STACKASCIISHOW=Y 是否显示堆栈中的 ASCII FIX_OUTPUTDEBUGSTRING=Y 是否修正修正格式化字符串的漏洞 FIX_DUMPADDRESS=Y 是否显示数据窗口中当前所选的数据地址和范围等(查看状态栏) FIX_PLUGCOUNT=N 是否扩展插件数 CLASS=!OllYDBG 主窗口类名称 WINTEXT=!OllYDBG 主窗口标题栏文本 ACPUASM=!CPUASM ACPUDUMP=!CPUDUMP ACPUSTACK=!CPUSTACK ACPUREG=!CPUREG ACPUINFO=!CPUINFO ACPU=!CPU PLUGCOUNT=50 最多允许载入的插件数目 ;以下是自定义菜单中的设置 TOOL1=记事本|notepad.exe 工具序数=程序名称|程序完整路径和文件名 + 扩展名
538 浏览量
32位汇编级调试器Ollydbg2.01简繁中文版 : Ollydbg2.01版是一个由Oleh Yuschuk2013年9月24发布的32位汇编级调试器,32位汇编级调试器Ollydbg2.01简繁中文版由正思软件工作室翻译发布。 此中间版开始支持插件和自定义快捷键. OllyDbg的是一个32位汇编级Microsoft的Windows的分析调试器。二进制代码分析的重点,特别是在源代码不可用的情况下非常有用。 特别亮点: 直观的用户界面,没有隐藏的命令. 代码分析 - 跟踪寄存器,确认过程,循环,API调用,分支,表,常量和字符串 直接运行和调试的DLL 对象文件扫描 - 从对象文件和库位于例程 允许用户定义的标签,备注和功能描述 识别在Borland ®格式的调试信息 会话之间保存的补丁程序,并将其写入可执行文件,并更新链接地址 开放式架构 - 支持许多第三方插件 无需安装 - 没有注册表或系统目录中的垃圾 调试多线程应用程序 附加到正在运行的程序 配置反汇编器,支持MASM的和IDEAL的格式 MMX,3DNOW!和SSE数据类型和说明,包括速龙Athlon扩展 完整的Unicode支持 动态识别ASCII和Unicode字符串 - 在Delphi格式! 识别复杂的代码结构,如呼叫跳转到程序 解码1900多个标准的API和400 C函数调用 提供来自外部的帮助文件的API函数的上下文敏感的帮助 设置条件,日志记录,内存和硬件断点 跟踪程序的执行,记录已知函数的参数 显示调整信息 动态跟踪堆栈帧 搜索不精确的命令和摸糊的二进制序列 搜索整个分配的内存 查找引用常量或地址范围 审查和修改内存,设置断点和暂停运行方案 组装成二进制形式的最短的命令 从软盘启动 很多,很多!