LLVM-RISC-V代码优化:降低浮点运算码大小与Clang差异研究
需积分: 5 27 浏览量
更新于2024-09-01
收藏 109KB PDF 举报
在"20191218-EB-5-RISCV.pdf"这份文档中,主要讨论了RISC-V架构在GCC和LLVM-Clang工具链下的代码大小优化情况。这份报告基于第四期的数据报,比较了RISC-V32和RISC-V64架构在使用GCC的不同优化级别(-Os作为基准)下与Clang的代码体积。结果显示,Clang在-O2、-O3、-Os和-Oz优化选项下不生成RISC-V标准扩展中的FMA指令,而GCC在此情况下可以生成这些指令,导致在执行浮点乘加密集型操作时,如矩阵乘法、卷积和FFT等,LLVM-Clang编译的代码量显著增加。
在第五期数据报中,特别关注了PLCT最近在LLVM上针对RISC-V代码大小优化的案例。他们发现在RISC-V后端,虽然GCC能够生成FMA指令,但LLVM存在缺陷,没有正确地实现这一功能。具体来说,对于teem-1.6.0-src用例,GCC编译后的目标文件中有大量FMA指令,而LLVM则会生成两倍数量的指令,导致代码库文件增加20036个字节。这表明LLVM的RISC-V后端需要进一步改进,以支持标准的FMA指令。
文档作者通过深入分析,发现LLVM的RISCV后端在支持FMA指令方面存在问题,这个问题已经在代码审查系统中被记录为pull request D54205。这表明开发者们正致力于修复这个漏洞,以提升LLVM在RISC-V平台上的代码优化性能和效率。
总结来说,这份文档的核心内容围绕着RISC-V架构的代码优化挑战,特别是LLVM工具链中FMA指令生成的问题,以及后续的改进措施。这对于了解RISC-V工具链的性能特性和未来发展趋势具有重要意义。
2022-05-20 上传
2019-12-03 上传
2021-08-23 上传
2013-01-23 上传
2021-11-25 上传
2019-09-23 上传
2021-05-27 上传
ppcust
- 粉丝: 38
- 资源: 730
最新资源
- Raspberry Pi OpenCL驱动程序安装与QEMU仿真指南
- Apache RocketMQ Go客户端:全面支持与消息处理功能
- WStage平台:无线传感器网络阶段数据交互技术
- 基于Java SpringBoot和微信小程序的ssm智能仓储系统开发
- CorrectMe项目:自动更正与建议API的开发与应用
- IdeaBiz请求处理程序JAVA:自动化API调用与令牌管理
- 墨西哥面包店研讨会:介绍关键业绩指标(KPI)与评估标准
- 2014年Android音乐播放器源码学习分享
- CleverRecyclerView扩展库:滑动效果与特性增强
- 利用Python和SURF特征识别斑点猫图像
- Wurpr开源PHP MySQL包装器:安全易用且高效
- Scratch少儿编程:Kanon妹系闹钟音效素材包
- 食品分享社交应用的开发教程与功能介绍
- Cookies by lfj.io: 浏览数据智能管理与同步工具
- 掌握SSH框架与SpringMVC Hibernate集成教程
- C语言实现FFT算法及互相关性能优化指南