程序编译与代码优化—编译期优化

3类编译过程中比较有代表性的编译器

  • 前端编译器:Sun的Javac、Eclipse JDT中的增量式编译器(ECJ)
  • JIT编译器:HotSpot VM的C1、C2编译器
  • AOT编译器:GUN Compiler for the java (GCJ)、Excelsior JET

Javac编译器

从Sun Javac的代码来看,编译过程大致可以分为3个过程:

  1. 解析与填充符号表过程
  2. 插入式注解处理器的注解处理过程
  3. 分析与字节码生成过程

图片

解析与填充符号表

1.词法、语法分析

词法分析 是将源代码的字符流转变为标记(Token)集合,单个字符是程序编写过程中的最小元素,而标记则是编译过程的最小元素,关键字、变量名、字面量、运算符都可以成为标记。在java的源码中,词法分析过程由 com.sun.tools.javac.Scanner类来实现。

语法分析 是根据Token序列构造抽象语法树的过程,抽象语法树(Abstract Syntax Tree,AST)是一种用来描述程序代码语法结构的树形表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构(Construct),例如包、类型、修饰符、运算符、接口、返回值甚至代码注释等都可以是一个语法结构。语法分析是由com.sun.tools.javac.parser.Parser类实现

2.填充符号表

符号表(Symbol Table) 是由一组符号地址和符号信息构成的表格。符号表中所登记的信息在编译的不同阶段都要用到。在语义分析中,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码。在目标代码生成阶段,当符号名进行地址分配时,符号表是地址分配的依据。符号表的填充由com.sun.tools.javac.comp.Enter类实现

注解处理器

在jdk1.5之后,java语言提供了对注解(Annotation)的支持,这些注解与普通的java代码一样,是在运行期间发挥作用的。在jdk1.6中实现了JSR-269规范,提供了一组插入式注解处理器的标准API在编译期间对注解进行处理,我们可以把它看做是一组编译器的插件,在这些插件里面,可以随意读取、修改、添加抽象语法树中的任意元素。

如果这些插件在处理注解期间对语法进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止,每一次循环称为一个Round。

语义分析与字节码生成

语法分析之后,编译器获得了程序代码的抽象语法树表示,语法树能表示一个结构正确的源程序的抽象,但无法保证源程序是符合逻辑的。而语义分析的主要任务就是对结构上正确的源程序进行上下文有关性质的审查,如进行类型审查。

1、标注检查

标注检查步骤检查的内容包括诸如变量使用前是否已被声明、变量与赋值之间的数据类型是否能够匹配等。在标注检查步骤中,还有一个重要的动作称为 常量折叠:如果我们在代码中写了如下定义:int a = 1 + 2;那么在语法树上仍然能看到字面量“1”、“2” 以及操作符 “+” ,但是经过常量折叠之后,它们将会被折叠为字面量“3”。

2、数据及控制流分析

数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否赋值、方法的每条路径是否都有返回值、是否所有的受查异常都被正确处理了等问题。

编译时期的数据及控制流分析与类加载的数据及控制流分析的目的基本上是一致的,但校验范围有所区别,有一些校验项只有在编译器或运行期才能进行。

3、解语法糖

java中最常见的语法糖主要是前面提到过的泛型(泛型并不一定都是语法糖实现,如C#的泛型就是直接由CLR支持的)、变长参数、自动装箱\拆箱等,虚拟机运行时不支持这些语法,它们是在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖。

4、字节码生成

字节码生成是javac编译过程的最后一个阶段,在javac源码里面由com.sun.tools.javac.jvm.Gen类来完成。字节码生成阶段不仅仅是把前面各个步骤所生成的信息(语法树、符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作。

完成了对语法树的遍历和调整后,就会把填充了所有所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,由这个类的writeClass()方法输出字节码,生成最终的class文件,到此为止整个编译过程宣告结束。

java语法糖

1、泛型与类型擦除

泛型是jdk1.5的一项新增特性,他的本质是参数化类型(Parametersized Type)的应用,也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。

2、自动装箱、拆箱与遍历循环

3、条件编译

java语言也可以进行条件编译,方法就是使用条件为常量的if语句。如代码清单10-9所示,此代码中的if语句不同于其他java代码,他在编译阶段就会被“运行”,生成的字节码中只包括“System.out.println(“block 1”);”一条语句。图片

注意:只有使用条件为常量的if语句才能达到上述效果,如果使用常量与其他带有条件判断能力的语句搭配,则可能在控制流分析中提示错误,被拒绝编译。

插入式注解处理器

基于JSR-269嵌入式注解处理器API支持的项目有用于校验Hibernate标签使用正确性的Hibernate Validator Annotation Processor、自动为字段生成getter和setter方法的Project Lombok(根据已有元素生成新的语法树元素)等。

–以上知识点摘自《深入理解java虚拟机》

发布了8 篇原创文章 · 获赞 1 · 访问量 260

猜你喜欢

转载自blog.csdn.net/qq_40635011/article/details/105519086