理解JVM (一) —— 类加载机制

jvm把class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的java类型,这就是虚拟机的类加载机制。

类加载生命周期图

1、加载:将class文件加载到内存,并生成对应的Class对象。

        1) 通过类的全限定名获得此类的二进制字节流

        2) 将该字节流代表的静态存储结构转为方法区的运行时数据结构

        3) 在堆中创建该类的java.lang.Class对象,作为访问方法区内数据结构的接口。

    类加载时机:虚拟机规范中并没有对此进行强制约束,这点可以交给虚拟机的具体实现来自由把握。且类是按需求加载的,程序在开始运行之前并非完全加载,但是必须保证类在第一次被使用的时候,已经被加载到JVM中。

    用户可以自定义类加载器实现加载过程

2、校验:确保class文件的字节流信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全。

         1)文件格式的验证:验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理,该验证的主要目的是保证输入的字节流能正确地解析

                并存储于方法区之内。 经过该阶段的验证后,字节流才会进入内存的方法区中进行存储,后面的三个验证都是基于方法区的存储结构进行的。

        2)元数据验证:对类的元数据信息进行语义校验(其实就是对类中的各数据类型进行语法校验),保证不存在不符合Java语法规范的元数据信息。

        3)字节码验证:该阶段验证的主要工作是进行数据流和控制流分析,对类的方法体进行校验分析,以保证被校验的类的方法在运行时不会做出危害

              虚拟机安全的行为。

        4)符号引用验证:这是最后一个阶段的验证,它发生在虚拟机将符号引用转化为直接引用的时候(解析阶段中发生该转化,后面会有讲解),

             主要是对类自身以外的信息(常量池中的各种符号引用)进行匹配性的校验。

3、准备:为类变量(静态变量)分配内存并设置初始值,这些内存都将在方法区进行分配。

        1)这时候进行内存分配的仅包括类变量(static)。不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。 不包含final修饰的static,用final修饰的类变量在编译期间就会分配

        2)这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值

public static int value=10;

这段代码的赋值过程分两次,一是上面我们提到的阶段,此时的value将会被赋值为0;而value=10这个过程发生在类构造器的<clinit>()方法中。

注意:如果类变量是final的,那么编译器在编译时会为其生成ConstantValue属性,分配内存,并在准备阶段虚拟机就会根据ConstantValue属性为其设置指定的值。

对于 static final int b=112,在准备阶段b的值就是112,而不再是0了。

4、解析:虚拟机将常量池内的符号引用替换为直接引用。

和C之类的纯编译型语言不同,Java类文件在编译过程中只会生成class文件,并不会进行连接操作,这意味在编译阶段Java类并不知道引用类的实际地址,因此只能用“符号引用”来代表引用类。举个例子来说明,在com.sbbic.Person类中引用了com.sbbic.Animal类,在编译阶段,Person类并不知道Animal的实际内存地址,因此只能用com.sbbic.Animal来代表Animal真实的内存地址。在解析阶段,JVM可以通过解析该符号引用,来确定com.sbbic.Animal类的真实内存地址(如果该类未被加载过,则先加载)。 

符号引用(Symbolic Reference):符号引用以一组符号来描述所引用的目标,符号引用可以是任何形式的字面量,符号引用与虚拟机实现的

内存布局无关,引用的目标并不一定已经在内存中。

直接引用(Direct Reference) :直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。

直接引用是与虚拟机实现的内存布局相关的,同一个符号引用在不同的虚拟机实例上翻译出来的直接引用一般都不相同,如果有了直接引用,

那引用的目标必定已经在内存中存在。

1、类或接口的解析:判断所要转化成的直接引用是对数组类型,还是普通的对象类型的引用,从而进行不同的解析。

 2、字段解析:对字段进行解析时,会先在本类中查找是否包含有简单名称和字段描述符都与目标相匹配的字段。

    如果有,则查找结束;如果没有,则会按照继承关系从上往下递归搜索该类所实现的各个接口和它们的父接口,还没有,则按照继承关系从上往下

    递归搜索其父类,直至查找结束。

3、类方法解析:对类方法的解析与对字段解析的搜索步骤差不多,只是多了判断该方法所处的是类还是接口的步骤,而且对类方法的匹配搜索,

    是先搜索父类,再搜索接口。

4、接口方法解析:与类方法解析步骤类似,只是接口不会有父类,因此,只递归向上搜索父接口就行了。

5、初始化:类加载过程的最后一步,为类的静态变量赋予初始值、执行静态代码块。

前面的类加载过程中,除了加载阶段用户应用程序可以通过自定义类加载器参与之外,其余动作完全由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的Java程序代码。 

初始化过程即执行类构造器<clinit>()方法的过程。

1)<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序由语句在

    源文件中出现的顺序所决定

静态语句块只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块可以赋值,但是不能访问

public class Test{
    static{
        i=0;
       
System.out.println(i);//Error:Cannot reference a field before it is defined(非法向前应用)
    }
    static int i=1;
}

2)<clinit>()方法与类的构造函数不同,它不需要显式地调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit>()方法

    已经执行完毕因此在虚拟机中第一个执行的<clinit>()方法的类一定是java.lang.Object。

3)由于父类的<clinit>()方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。

4)<clinit>()方法对于类或者接口来说并不是必需的,如果一个类中没有静态语句块也没有对变量的赋值操作,那么编译器可以不为这个类

        生成<clinit>()方法。

5)接口中可能会有变量赋值操作,因此接口也会生成<clinit>()方法。但是接口与类不同,执行接口的<clinit>()方法不需要先执行父接口的

    <clinit>()方法。只有当父接口中定义的变量被使用时,父接口才会被初始化。另外,接口的实现类在初始化时也不会执行接口的<clinit>()方法。

6)虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确地加锁和同步。如果有多个线程去同时初始化一个类,那么只会有一个线程去执行

    这个类的<clinit>()方法,其它线程都需要阻塞等待,直到活动线程执行<clinit>()方法完毕。如果在一个类的<clinit>()方法中有耗时很长的操作,

    那么就可能造成多个进程阻塞。

类初始化时机:这在虚拟机规范中是有严格规定的,虚拟机规范指明 有且只有 五种情况必须立即对类进行初始化(而这一过程自然发生在加载、验证、准备之后)。

1) 遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这4条指令

      最常见的Java代码场景是:使用new关键字实例化对象的时候,读取或设置一个类的静态字段(被final修饰、已在编译期把结果放入常量池的

静态字段除外)的时候,以及调用一个类的静态方法的时候。

2) 使用java.lang.reflect包的方法对类进行反射调用的时候(e.g. Class.forName(“com.shengsiyuan.Test”)),如果类没有进行过初始化,

        则需要先触发其初始化。

3) 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。

4) 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类。

 5) 当使用jdk1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getstatic,REF_putstatic,REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行初始化,则需要先出触发其初始化。

初始化步骤:

    1)、假如这个类还没有被加载和连接,则程序先加载并连接该类

    2)、假如该类的直接父类还没有被初始化,则先初始化其直接父类

    3)、假如类中有初始化语句,则系统依次执行这些初始化语句

注意:

1、对于静态字段,只有直接定义这个字段的类才会被初始化。所以通过子类引用父类的静态字段,不会导致子类初始化。

2、通过数组定义来引用类,不会触发此类的初始化

上述代码并不会触发SClass的初始化。但是,这段代码触发了另外一个名为[Lcn.edu.tju.rico.SClass的类的初始化。

从类名称可以看出,这个类代表了元素类型为SClass的一维数组,它是由虚拟机自动生成的,直接继承于Object的子类,

创建动作由字节码指令newarray触发

3、常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化

只是不去执行clinit<>(),但此时类可能已经加载进内存,并完成了校验准备等操作,静态常量在准备阶段就已经赋值,

所以在此处可以取得静态常量的值。其实静态常量是不是在准备阶段被赋值是有争议的,但确实不被包含在类的clinit<>()中,

是在类的clinit<>()之前被赋值的可参考:http://hllvm.group.iteye.com/group/topic/37682)。

反正通过类对静态常量的引用不会触发类的初始化,也就是类clinit<>()方法啦。

参考:

https://blog.csdn.net/fgets/article/details/52934178

https://blog.csdn.net/justloveyou_/article/details/72466105 超棒

猜你喜欢

转载自blog.csdn.net/xybz1993/article/details/80061090