LLVM-RISC-V代码优化：降低浮点运算码大小与Clang差异研究

需积分: 5 27 浏览量更新于2024-09-01 收藏 109KB PDF 举报

在"20191218-EB-5-RISCV.pdf"这份文档中，主要讨论了RISC-V架构在GCC和LLVM-Clang工具链下的代码大小优化情况。这份报告基于第四期的数据报，比较了RISC-V32和RISC-V64架构在使用GCC的不同优化级别(-Os作为基准)下与Clang的代码体积。结果显示，Clang在-O2、-O3、-Os和-Oz优化选项下不生成RISC-V标准扩展中的FMA指令，而GCC在此情况下可以生成这些指令，导致在执行浮点乘加密集型操作时，如矩阵乘法、卷积和FFT等，LLVM-Clang编译的代码量显著增加。在第五期数据报中，特别关注了PLCT最近在LLVM上针对RISC-V代码大小优化的案例。他们发现在RISC-V后端，虽然GCC能够生成FMA指令，但LLVM存在缺陷，没有正确地实现这一功能。具体来说，对于teem-1.6.0-src用例，GCC编译后的目标文件中有大量FMA指令，而LLVM则会生成两倍数量的指令，导致代码库文件增加20036个字节。这表明LLVM的RISC-V后端需要进一步改进，以支持标准的FMA指令。文档作者通过深入分析，发现LLVM的RISCV后端在支持FMA指令方面存在问题，这个问题已经在代码审查系统中被记录为pull request D54205。这表明开发者们正致力于修复这个漏洞，以提升LLVM在RISC-V平台上的代码优化性能和效率。总结来说，这份文档的核心内容围绕着RISC-V架构的代码优化挑战，特别是LLVM工具链中FMA指令生成的问题，以及后续的改进措施。这对于了解RISC-V工具链的性能特性和未来发展趋势具有重要意义。

RISCV 工具链数据报第五期：

LLVM RISCV codesize 优化一例和业界要闻

在第四期数据报中，我们对在 GNU GCC 和 LLVM-Clang 工具链上

RISCV32、RISCV64 的 codesize 数据进行了对比，以 GCC -Os 选项为

100%，codesize 的相对比例如下表：

表 1 RISCV32 和 RISCV64 下 GCC 和 Clang 的 codesize 对比

GCC -Os

GCC -O2

Clang -O2

Clang -Os

Clang -Oz

RISCV32

100%

125.39%

132.32%

117.04%

104.4%

RISCV64

100%

126.11%

132.16%

117.74%

104.11%

（注：表 1 的评测标准、方法和数据来源可详细参考“RISCV 工具链数据报第四期”）

本期数据报中，我们将详述一个 PLCT 近日所完成的 LLVM 上 RISCV

codesize 的优化案例，并报告优化结果。

一、优化点分析和评估

在对 GCC 和 Clang 的 codesize 差距来源进行分析的过程中，我们发现，

Clang 在-O2、-O3、-Os、-Oz，以及--ffp-contrast=fast 选项下，都无法生

成单/双精度的 fused multiply-add/sub（以下简称 FMA，fused multiply-

accumulate），但 GCC 可以在-O2、-O3 和-Os 选项下生成 RISCV 指令集 F

标准扩展中所规定的 fmadd.s/d, fmsub.s/d, fnmadd.s/d 和 fnmsub.s/d 指

令。这个差别，将会给浮点乘加计算密集的应用，比如矩阵乘法、卷积和 FFT

等带来 codesize 的显著损失，比如，对 CSiBE 的 teem-1.6.0-src 用例，GCC

产生的目标文件中有 69 个文件包含了共 5009 条 FMA 指令, 而 LLVM 将对应

地产生 2 倍数目的指令，生成的库文件将多出 20036 个字节的 code。

下载后可阅读完整内容，剩余5页未读，立即下载

ppcust

粉丝: 38
资源: 730

LLVM-RISC-V代码优化：降低浮点运算码大小与Clang差异研究

perfboot-eb.2021.12.22a.pdf

SoapUI-5.4.0-EB.dmg.zip

SoapUI-5.4.0-EB.zip

SoapUI-5.4.0-EB.dmg

GX-Configurator-AD2-EB.rar

10-EB病毒感染及其相关性皮肤疾病--徐子刚；.pdf

SIDOOR AT-EB[手册].pdf

视频图matlab代码-DifferentialEquations.jl-0c46a032-eb83-5123-abaf-570d42b7fb

EB-tresos-automotive-ethernet-training.pdf

ActivePerl-5.28.1.0000-MSWin32-x64-865dc3eb.msi

最新资源