Java代码编译优化

17 May 2018 »深入理解Java虚拟机读书笔记

javac编译器
即时编译器

Java代码的执行大致可以分为如下过程。

前端编译器将.java代码编译成.class字节码
后端运行时编译器将.class字节码变成机器码
还可能是使用静态提前编译器将.java文件编译成机器码

因此，java中的编译器可以分为三类：

前端编译器：javac
JIT编译器：HotSpot VM的C1、C2
AOT编译器

这里主要讨论前两种编译器。

javac编译器

使用javac编译就是将.java文件编译成.class字节码文件的过程，javac的编译过程大致分为三步

解析与填充符号表过程
插入式注解处理器的注解处理过程
语义分析与字节码生成过程

解析与填充符号表过程

该过程主要有三步：

词法分析
语法分析
填充符号表

(1) 词法分析

该过程指的是将源代码的字符流转变为标记集合。

例如：int a = b + 2;

这段代码包含了6个标记，int,a,=,b,+,2

(2) 语法分析

语法分析指的是根据标记序列构造抽象语法树的过程

(3) 填充符号表过程

符号表是由一组符号地址和符号信息组成的表格，即可以认为是将符号信息和符号地址进行统计，便于后续的过程中获取符号

注解处理器

就是在编译期间对注解进行处理，通过注解处理器可以读取、修改、添加抽象语法树中的任意元素

语义分析与字节码生成过程

该过程主要有四步：

标注检查
数据及控制流分析
解语法糖
字节码生成

(1) 标注检查

标注检查主要是检查：

变量使用前是否声明
变量与赋值的数据类型是否匹配
常量折叠

其中常量折叠指的是将常量进行计算例如：

int a = 1 + 2;

编译之后会定义a = 3;因此，与int a = 3相比，运行速度是一样的。

(2) 数据及控制流分析

该过程是对程序上下文逻辑进行进一步的检查：

程序局部变量在使用前是否赋值
方法的每条路径是否都有返回值
是否所有的受查异常都能被正确处理

(3) 解语法糖

语法糖可以看作是编译器的小把戏，为了方便程序员编写代码，增加程序的可读性

例如：泛型机制

泛型的本质是参数化类型，就是将操作的数据类型指定为一个参数

在早前没有泛型的之后，程序员需要通过指定Object类型，然后强转来实现特定类型的数据的读取,这样只有运行的时候才能发现某些类型的错误。

而加入泛型之后可以让错误在编译时就被发现。但是在java中泛型只会存在与源码中，编译之后的字节码是不存在泛型的，也就是说字节码里面仍然是通过强转Object类型来实现。即运行时ArrayList与ArrayList是同一个类，里面都存放的是Object类型。这也就是类型擦出，即在编译的时候会将泛型的数据类型在字节码中擦出，变成一样的原生类型。

此外还有自动装箱、拆箱、foreach循环等都是语法糖

(4) 字节码生成

该过程将前面生成的信息转换成字节码写到磁盘，同时还会进行一些代码的替换优化，例如将字符串的相加替换为StringBuilder的append操作