程序访存特征引导的存储优化技术探索

需积分: 33 4 下载量 74 浏览量 更新于2024-07-25 收藏 2.56MB PDF 举报
"面向程序访存特征的存储优化技术研究" 这篇硕士论文主要探讨了如何针对程序访存特征进行存储优化,以提升计算机系统的性能。随着处理器速度的不断提升,存储成为了性能提升的主要瓶颈。作者马萌深入研究了程序的访存特征,以及这些特征如何影响存储结构,特别是Cache和DRAM的性能。 1. 论文首先分析了存储结构的发展历程,指出Cache和DRAM等层次存储结构在处理程序数据时存在的问题。Cache设计通常不区分数据类型,而DRAM的物理实现限制了其对二维数据访问的支持。 2. 为了优化共享Cache结构,论文选择了基于PostgreSQL数据库的在线事务处理(OLTP)应用作为研究对象。通过对不同数据集的访存特征分析,论文建立了数据分类模型,将数据分为放弃型、保护型和自由竞争型三类。接着,提出了一种软件协同的半透明Cache策略,该策略区别对待这三类数据,实验结果显示Cache失效率最多降低了12%。 3. 针对矩阵运算中的行列交替访问模式,论文提出了“窗口访问”优化方案。窗口访问利用了二维连续的访存特征和DRAM的一维连续特性,通过调整访问顺序和大小,优化了内存访问性能。实验显示,这种方法在处理行列交替访问的矩阵操作时,性能提升了73.6%,同时在一维FFT并行算法中性能提升45.1%。 4. 窗口访问原理进一步被应用到CPU和GPU上的矩阵数据布局优化。在CPU中,这种方法使得行列交替访问的存储性能提高了58.4%,并与FFTW库结合,实现了更高效的FFT算法,计算性能提升7%。对于GPU,论文分析了CUDA编程框架,将窗口访问原理应用于warp级别的访存,结果表明矩阵行列交替访问的存储性能翻倍。 论文展示了程序访存特征在存储优化中的关键作用,提出了一系列针对性的优化策略,包括数据分类的Cache优化和窗口访问技术,这些方法在改善存储性能和提升计算效率方面取得了显著成果。这些研究成果对未来的硬件设计和系统优化提供了有价值的参考。