MIAOW:开源GPU架构研究与应用探索

需积分: 10 21 下载量 156 浏览量 更新于2024-09-09 1 收藏 465KB PDF 举报
"MIAOW GPU白皮书提供了对GPU架构的深入研究,特别是基于AMD Southern Islands GPGPU ISA的开源RTL实现。该资源旨在为GPU通用计算提供一个替代CPU计算的可行选项,并且支持未修改的OpenCL应用程序。" 在当前的计算领域,GPU(图形处理器)已经超越了其在图形处理的传统角色,成为了通用计算的重要平台。MIAOW(可能代表“Many-core Integrated Architecture for Open Computing Workloads”)项目是针对这一趋势的回应,它提供了一个详细的GPU微架构视图,弥补了现有工具如GPGPU-Sim、Multi2Sim和Barra等在模拟第一阶效应方面的不足。这些工具虽然对于初步理解有帮助,但无法提供关于GPU物理设计和详细性能估计的深入见解。 MIAOW项目的核心是开源的RTL(寄存器传输级)实现,它基于AMD的Southern Islands GPGPU指令集架构。这个实现使得研究人员能够运行未经修改的OpenCL程序,从而验证和评估新的GPU设计思想和改进。MIAOW的设计目标是创建一个既现实又灵活的GPU模型,它与OpenCL兼容,能够模拟整个系统。 为了证明MIAOW的实用性和研究价值,白皮书中通过四个案例研究展示了以下几点: 1. **物理设计视角**:MIAOW为传统的微架构研究提供了物理设计层面的洞察。这使得研究人员能够更准确地评估设计改动对面积和功耗的影响。 2. **新类型的研究探索**:利用MIAOW,研究人员可以探索新的GPU优化策略和技术,这在以前可能由于缺乏详细模型而难以进行。 3. **模拟器校准与验证**:MIAOW有助于验证和校准基于模拟器的硬件特性分析,确保了研究结果的准确性。 4. **性能评估**:通过实际运行OpenCL应用,MIAOW可以提供关于GPU性能的直接反馈,这对于评估和预测新设计的性能至关重要。 MIAOW GPU白皮书是GPU架构研究者和开发者的重要资源,它推动了GPU硬件设计和优化的研究,同时也为学术界和工业界的创新提供了坚实的基础。通过这个平台,研究人员能够更深入地理解GPU的工作原理,探索新的计算解决方案,并优化现有的GPU架构,以适应不断增长的高性能计算需求。
2019-07-18 上传
开放源码的GPU计算能力可以推到一个新的水平BINGHAMTON,纽约–Binghamton大学的研究人员已经使用一个开源的图形处理器(GPU)的研究。宾汉姆顿大学计算机科学助理教授Timothy Miller Aaron Carpenter和研究生Philip Dexter,与合著者Jeff Bush,有Nyami,一个综合的图形处理器(GPU)的通用图形的特定工作负载的建筑模型。这标志着第一次的团队采取了一个开源的GPU的设计和运行的一系列的实验,看看不同的硬件和软件配置会影响电路的性能。根据Miller的说法,其结果将有助于科学家们做出自己的GPU计算能力和推到一个新的水平。“作为一个研究人员,重要的是要有工具,实事求是地评估新的想法,可能会提高性能,能源效率,或其他处理器架构的挑战,”Miller说。虽然模拟器可以走捷径,一个实际的综合开源处理器不能偷工减料,所以我们可以说,任何实验结果得到特别可靠。”GPU已经存在了大约40年,通常发现在商业视频或图形卡在电脑或游戏机。专门的电路有计算能力,使图像更平滑,更充满活力的屏幕上。最近有一个运动,看看芯片是否可以应用到非图形计算,如算法处理大块数据。 “我们不一定在寻找结果的新颖性,所以我们想创建一个新的工具,然后显示它是如何使用的,”Carpenter说。我希望人们能更有效地在GPU上的实验,为爱好者和研究者,创造未来的GPU更高效的设计。”开源GPU用于他们的研究团队是宾厄姆顿的先河。虽然成千上万的GPU是每年生产的商业化,这是第一个可以修改的爱好者和研究者了解如何变化可能会影响主流芯片。布什,在公司的软件工程总监,是该论文的第一作者。“这是坏的开源社区,GPU厂商都决定保持他们的芯片规格的秘密。这阻止了开源开发人员编写可以利用该硬件的软件,“Miller说。Miller开始在2004个类似的项目,而布什开始工作的nyami 2010。”这使得其他研究者更容易进行他们自己的实验,因为他们不需要重新发明轮子.。随着“开放硬件”社区的贡献,我们可以把更多的创造性的想法,并产生一个越来越好的工具。调查结果的后果可能使处理器更容易为研究人员工作,并探讨不同的设计权衡。Dexter,Miller,Carpenter和布什已经走出了一条新的道路,可能会影响从太空旅行的一切发现心脏手术。“我有一个论文的研究思路列表我们可以探索利用nyuzi [芯片更名],专注于各种性能瓶颈。这个想法是为了寻找那些让nyuzi低效相比其他GPU和解决那些问题研究。我们也可以用nyuzi作为开展研究,不是针对GPU平台,能源效率和可靠性,”Miller说。本文《Nyami:一个综合的GPU通用建筑模型和图形的具体工作量”出现在对系统和软件的性能分析国际研讨会。http://www.binghamton.edu/mpr/news-releases/news-release.html?id=2362--------------------------------------------------------------------------------------------------------NyuziProcessorMicroarchitecture 该项目是一个专为高度并行和GPGPU应用程序设计的开源处理器。 它的灵感来自英特尔的Larrabee,虽然指令集和微架构有很大的不同。处理器运行在Verilog仿真和FPGA上。它是一种现代架构,具有集合关联L1和L2缓存,细粒度硬件多线程,流水线SIMD浮点和整数执行单元,并支持多个缓存一致性内核。它包括基于LLVM的C/C 编译器。GPU已经被证明对于具有大量内在并行性的应用程序是有用的,如图像处理和机器学习。 然而,GPU具有缺乏灵活性的高度约束的编程模型。 这个项目是一个混合架构,结合GPU架构概念,如宽SIMD和硬件多线程与通用指令集。 硬件实现的重点更多在于计算而不是图形,缺乏固定功能的图形硬件。 它能够作为协处理器或独立处理器操作。这已使用Nangate 45nm库合成。每个核心的估计:面积1.84 mm2,功率329 mW,最大频率671 Mhz。 标签:Nyuzi