可配置硬件剖析器AGCHP:提升性能的Arnold-Grove采样解决方案

需积分: 0 0 下载量 46 浏览量 更新于2024-09-08 收藏 523KB PDF 举报
本文主要探讨了"支持Arnold-Grove采样的可配置硬件剖析器研究"这一主题,由作者周学海、张惠臻在中国科学技术大学计算机科学技术系完成。剖析技术作为指导系统性能优化的关键工具,在指令集优化、编译器设计以及动态二进制翻译等领域发挥着核心作用。现有的剖析器普遍面临剖析效率低下的问题,而这篇论文旨在解决这一挑战。 作者提出了一种名为AGCHP(Arnold-Grove Configurable Hardware Profiler)的可配置硬件剖析器,它结合了硬件加速和Arnold-Grove采样理念。AGCHP的特点在于其可配置译码功能,使得它能够与微处理器更紧密地协同工作,从而拓宽了剖析器的应用范围。此外,AGCHP支持多种采样技术,如Arnold-Grove采样,能够高效地捕捉并存储各种热点信息,为后续的优化工作提供了详尽的数据基础。 在性能评估方面,实验结果显示AGCHP在占用相对较少的硬件资源情况下,能快速识别出目标应用中的热点路径。对于那些适合优化的应用,它能覆盖超过90%的热点路径,显示出了很高的效率。然而,传统的剖析技术如源代码级剖析(例如gprof/gcov)存在精度不足、难以解析高级语言隐式操作以及受编译器代码重排影响等问题。相比之下,指令级剖析(如SpixTool和VTune)虽然提供更精确的信息,但可能面临操作复杂度增加和难以实时监控的挑战。 这篇论文的重要贡献在于提出了一种新的硬件剖析器架构,通过改进和扩展剖析技术,提升了剖析效率和精度,为软件性能优化提供了更为有力的支持工具,特别是在处理复杂程序和实时性能分析方面具有显著的优势。