LLVMIR入门指南_clang的背景

llvm

5星 · 超过95%的资源需积分: 45 149 浏览量更新于2023-03-03 评论 6 收藏 705KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

LLVM架构简介

LLVM是什么

随着计算机技术的不断发展以及各种领域需求的增多，近⼏年来，许多编程语⾔如⾬后春笋般出现，⼤

多为了解决某⼀些特定领域的需求，⽐如说为JavaScript增加静态类型检查的TypeScript，为解决服务

器端⾼并发的Golang，为解决内存安全和线程安全的Rust。随着编程语⾔的增多，编程语⾔的开发者往

往都会遇到⼀些相似的问题：

怎样让我的编程语⾔能在尽可能多的平台上运⾏

怎样让我的编程语⾔充分利⽤各个平台⾃身的优势，做到最⼤程度的优化

怎样让我的编程语⾔在汇编层⾯实现「定制」，能够控制如符号表中的函数名、函数调⽤时参数的

传递⽅法等汇编层⾯的概念

有的编程语⾔选择了使⽤C语⾔来解决这种问题，如早期的Haskell等。它们将使⽤⾃⼰语⾔的源代码编

译成C代码，然后再在各个平台调⽤C编译器来⽣成可执⾏程序。为什么要选择C作为⽬标代码的语⾔

呢？有⼏个原因：

第⼀，绝⼤部分的操作系统都是由C和汇编语⾔写成，因此平台⼤多会提供⼀个C编译器可以使⽤，这样

就解决了第⼀个问题。

第⼆，绝⼤部分的操作系统都会提供C语⾔的接⼝，以及C库。我们的编程语⾔因此可以很⽅便地调⽤相

应的接⼝来实现更⼴泛的功能。

第三，C语⾔本身并没有笨重的运⾏时，代码很贴近底层，可以使⽤⼀定程度的定制。

以上三个理由让许多的编程语⾔开发者选择将⾃⼰的语⾔编译成C代码。

然⽽，我们知道，⼀个平台最终运⾏的⼆进制可执⾏⽂件，实际上就是在运⾏与之等价的汇编代码。与

汇编代码⽐起来，C语⾔还是太抽象了，我们希望能更灵活地操作⼀些更底层的部分。同时，我们也希

望相应代码在各个平台能有和C语⾔⼀致，甚⾄⽐其更好的优化程度。

因此，LLVM出现后，成了⼀个更好的选择。我们可以从LLVM官⽹中看到：

The LLVM Core libraries provide a modern source- and target-independent optimizer, along

with code generation support for many popular CPUs (as well as some less common ones!)

These libraries are built around a well specified code representation known as the LLVM

intermediate representation ("LLVM IR"). The LLVM Core libraries are well documented, and

it is particularly easy to invent your own language (or port an existing compiler) to use LLVM

as an optimizer and code generator.

简单地说，LLVM代替了C语⾔在现代语⾔编译器实现中的地位。我们可以将⾃⼰语⾔的源代码编译成

LLVM中间代码（LLVM IR），然后由LLVM⾃⼰的后端对这个中间代码进⾏优化，并且编译到相应的平

台的⼆进制程序。

LLVM的优点正好对应我们之前讲的三个问题：

LLVM后端⽀持的平台很多，我们不需要担⼼CPU、操作系统的问题（运⾏库除外）

LLVM后端的优化⽔平较⾼，我们只需要将代码编译成LLVM IR，就可以由LLVM后端作相应的优化

这⼀⻓串输出看上去就让⼈眼花缭乱，然⽽，我们只需要关注最后四⾏：

这才是我们源代码的AST。可以很⽅便地看出，经过Clang前端的预处理、语法分析、语义分析，我们的

代码被分析成⼀个函数，其函数体是⼀个复合语句，这个复合语句包含⼀个返回语句，返回语句中使⽤

了⼀个整型字⾯量 0 。

因此，总结⽽⾔，我们基于LLVM的编译器的第⼀步，就是将源代码转化为内存中的抽象语法树AST。

前端⽣成中间代码

第⼆个步骤，就是根据内存中的抽象语法树AST⽣成LLVM IR中间代码（有的⽐较新的编译器还会先将

AST转化为MLIR再转化为IR）。

我们知道，我们写编译器的最终⽬的，是将源代码交给LLVM后端处理，让LLVM后端帮我们优化，并编

译到相应的平台。⽽LLVM后端为我们提供的中介，就是LLVM IR。我们只需要将内存中的AST转化为

LLVM IR就可以放⼿不管了，接下来的所有事都是LLVM后端帮我们实现。

关于LLVM IR，我在下⾯会详细解释。我们现在先看看将AST转化之后，会产⽣什么样的LLVM IR。我们

使⽤

这时，会⽣成⼀个 test.ll ⽂件：

|-TypedefDecl 0x7fc02681f968 <<invalid sloc>> <invalid sloc> implicit

__builtin_va_list 'struct __va_list_tag [1]'

| `-ConstantArrayType 0x7fc02681f910 'struct __va_list_tag [1]' 1

| `-RecordType 0x7fc02681f770 'struct __va_list_tag'

| `-Record 0x7fc02681f6e8 '__va_list_tag'

`-FunctionDecl 0x7fc02585a228 <test.c:1:1, line:3:1> line:1:5 main 'int

()'

`-CompoundStmt 0x7fc02585a340 <col:12, line:3:1>

`-ReturnStmt 0x7fc02585a330 <line:2:5, col:12>

`-IntegerLiteral 0x7fc02585a310 <col:12> 'int' 0

`-FunctionDecl 0x7fc02585a228 <test.c:1:1, line:3:1> line:1:5 main 'int ()'

`-CompoundStmt 0x7fc02585a340 <col:12, line:3:1>

`-ReturnStmt 0x7fc02585a330 <line:2:5, col:12>

`-IntegerLiteral 0x7fc02585a310 <col:12> 'int' 0

clang -S -emit-llvm test.c1

; ModuleID = 'test.c'

source_filename = "test.c"

target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"

target triple = "x86_64-apple-macosx10.15.0"

; Function Attrs: noinline nounwind optnone ssp uwtable

define i32 @main() #0 {

%1 = alloca i32, align 4

store i32 0, i32* %1, align 4

剩余52页未读，继续阅读

艾闻

2023-07-28

) 这份文件对于初学者来说是很有帮助的，内容简洁清晰。

昵称什么的最烦了啊

粉丝: 3
资源: 20

会员权益专享

LLVM IR入门指南

评论5

会员权益专享

最新资源

LLVM IR入门指南

评论5

LLVM_ShuffleVector_Optimizer:ShuffleVector 是 LLVM IR 中一个强大的操作。 这是一个优化shufflevector的项目，用一些更快的操作代替它

Ghidra-to-LLVM:利用Ghidra的IR和分析功能将二进制文件转换为LLVM的IR提升器

fracture:LLVM IR的与体系结构无关的反编译器

LLVM IR中间表示结果怎么确定

自己编写llvm ir

C编译器翻译成LLVM IR

LLVM IR中间表示结果怎么变成RISCv代码

llvm框架/llvm编译流程/clang前端/llvm ir/llvm应用与实践

llvm ir ptr

LLVM IR store的用法

LLVM IR bitcast指令用法

C#+如何編譯成+LLVM+IR?

LLVM IR 字符串变量

LLVM IR getelementptr指令用法

详细介绍一下llvm中ir的语法

llvm irbuilder

llvm::Value

详细介绍一下llvm的ir

llvm essential

会员权益专享

最新资源

LLVM_ShuffleVector_Optimizer:ShuffleVector 是 LLVM IR 中一个强大的操作。这是一个优化shufflevector的项目，用一些更快的操作代替它