java虚拟机学习之(五)垃圾收集器与垃圾回收算法

经过前面是学习我们已经对java运行时区域的各个部分有了一定的了解,其中程序计数器,虚拟机栈,本地方法栈3个区域属于线程私有区域,它们随着线程的创建而存在,随着线程的死亡而释放。栈中的栈帧随着方法的进入和退出也在有条不紊的进行着入栈和出栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,因此上述区域的内存分配和回收都是确定的,一旦方法结束或者线程结束,相应的内存自然也就被回收了。而java堆和方法区则不一样,我们只有在程序处于运行期间时才会知道哪些对象会被创建,这部分内存的分配和回收都是动态的,具有不确定性,而垃圾收集器所要管理的也就是这部分内存。

如何判断哪些对象需要被回收?

java堆中存放着几乎所有的对象实例,垃圾回收器在对java堆进行回收前,需要知道哪些对象还活着,哪些对象已经死了(即不可能再被引用的对象)。

判断对象是否存活有两种方法:引用计数法和可达性分析法

1. 引用计数法

给每个对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器就减1;任何时刻计数器为0的对象就是不可能再被使用的对象,此时该对象为可回收对象。

客观的说,引用计数法实现简单,判定效率也很高,但是其存在一个致命的弱点:无法解决对象之间循环引用的问题。如对象A和对象B都有字段instance,令A.instance = B;B.instance=A;除此之外,两个对象再无任何引用,现令A=null;B=null;实际上这两个对象已经不再可能被引用,但是因为它们之间相互引用,导致它们的计数器值都不为0,因此GC无法回收它们。

2. 可达性分析法

该算法的基本思想是通过一系列的成为“GC roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(reference chain),当一个对象到GC roots没有任何引用链相连时,则证明此对象是不可用的。在java语言中,可作为GC roots的对象包括以下几种:

1)虚拟机栈(栈帧中的本地变量表)中引用的对象;

2)方法区中类静态属性引用的对象;

3)方法区中常量引用的对象;

4)本地方法栈中JNI(即native方法)引用的对象。

注意:

1.即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时它处于“缓刑”阶段,要正真宣告一个对象“死亡”,至少要经历两次标记过程。如果对象在经历可达性分析后发现没有与GC roots的引用链,那它将会被第一次标记并进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法,当对象没有覆盖finalize()方法或者finalize()方法已经被虚拟机调用过,则虚拟机将这两种情况视为“没有必要执行”。

如果该对象被判定为有必要执行finalize()方法,那么这个对象将会被放到一个叫做F-Queue的队列中,并在稍后在一个由虚拟机自动建立的低优先级的Finalizer线程负责运行,但是虚拟机并不“承诺”会等待它执行结束。finalize()方法是对象逃脱死亡命运的最后一次机会。

2.很多人认为方法区(或者HotSpot虚拟机中的永久代)是没有垃圾收集的,java虚拟机规范中确实说过可以不要求虚拟机在方法区实现垃圾收集。但是,GC仍然会对方法区进行垃圾收集,收集的内容包括无用的类和废弃常量。

垃圾收集算法
1.标记清除算法

最基础的算法是标记-清除算法,该算法分为“标记”和“清除”两个阶段:首先标记处所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

该方法的缺点:1)效率低下,标记和清除两个过程效率都相对较低;2)标记清除之后会产生大量不连续的内存碎片,内存碎片太多可能会导致以后在程序需要创建较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

2.复制算法

该算法将可用内存按容量划分为大小相等的两块,每次只是用其中的一块,当这一块的内存用完了,就将还存活的对象复制到另一块上面,然后把用过的内存空间一次性清理掉。

优缺点:优点:每次都是对整个内存半区进行垃圾回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效;缺点:内存利用率低,这种算法的代价是将内存缩小为了原来的一半,代价太大。

3.标记-整理算法

标记整理算法,标记过程与标记清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存。

4.分代收集算法

当前商业虚拟机的垃圾收集都采用“分代收集”算法,该算法根据对象存活周期的不同,将内存划分为几块。一般把java堆划分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的算法。在新生代中,每次垃圾收集都发现有大批对象死去,只有少量存活,那就采用复制法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中对象存活率高,没有额外空间对它进行分配担保,就必须采用“标记-清除”算法或“标记-整理”算法来进行回收。

总结:

判断对象是否存活的方法:引用计数法(效率高,但是无法解决循环引用问题)和可达性分析法

垃圾收集算法:标记清除法(效率低,内存碎片多),复制算法(内存利用率低,代价大),标记整理算法(适合老年代垃圾收集),分代回收算法


猜你喜欢

转载自blog.csdn.net/qq_28044241/article/details/79520481