基于HPM的高精度并行计算性能采集法:超越传统与Vtune

需积分: 9 1 下载量 187 浏览量 更新于2024-08-08 收藏 909KB PDF 举报
本文档探讨了一种创新的并行计算性能数据采集方法,发表于2011年的《重庆邮电大学学报》自然科学版。针对传统数据采集方法存在的不足和Vtune工具的局限性,研究者提出了一种基于硬件性能监视器(Hardware Performance Monitor, HPM)的解决方案。这种方法设计在多处理器环境,特别适用于集群和消息传递接口(Message Passing Interface, MPI)架构,通过性能应用程序编程接口(Performance Application Programming Interface, PAPI)来收集CPU消耗的时钟周期数据。 相较于传统采集方式,该方法显著提高了数据采集的精度,达到6个数量级的提升,显示出更高的测量准确性和可靠性。此外,它还具有良好的跨平台性,能够有效地适应不同的系统和硬件配置。文章作者程克非、罗江华和李红波来自重庆邮电大学计算机科学与技术学院和人工智能研究所,他们在论文中详细介绍了该方法的设计原理、实现步骤以及实验验证,包括其在特定科研项目中的应用,如重庆市教委科学基金项目和重庆邮电大学博士基金的支持下展开的工作。 通过使用硬件监控和消息传递机制,该方法不仅简化了性能分析的过程,还提升了数据采集的实时性和效率,对于优化并行计算系统的性能监控和故障诊断具有重要意义。论文以清晰的实验结果和案例分析展示了新方法的有效性和实用性,为高性能计算领域的研究者提供了有价值的技术参考。这项工作填补了现有技术在并行计算性能数据采集方面的空白,推动了高性能计算技术的发展。