基础知识
代码的编译有三个步骤:前端,优化,后端。
原始代码
| 前端: 根据特定的语言规则,将原始代码转换成语法树
语法树
| 中间端:优化代码
中间件(IR)
| 后端:用特定平台的指令集替换,比如x86、ARM等
最终程序
对比
对于gcc,它是一个大集合,并且没有开放具体部分的接口,用户无法自定义。
对于LLVM,他支持自定义模块,用户可以自定义自己的编译器,LLVM的核心是中间端(优化器)The LLVM Core libraries provide a modern source- and target-independent optimizer,提供了很多通用的共性优化算法,要是将LLVM的中间端替换掉,感觉意义就没有了。使用举例:
- 比如有了一款新的计算设备,它有自己特定的指令集,那么就可以使用LLVM去自定义的后端,进行替换。
- 比如有了一个新的语言,可以自定义前端,后面使用LLVM,比如clang。
可能有些理解不是很精确,望指教!参考链接如下
https://zh.wikipedia.org/wiki/LLVM
https://llvm.org/