JVM虚拟机之内存分配与回收

前言

Java技术体系中所提倡的自动内存管理最终可以归结为自动化地解决了两个问题:

  • 给对象分配内存
  • 回收分配给对象的内存

给对象分配内存JVM有自己的一套机制,而JVM在内存分配工作不能丝滑的进行时,会由垃圾收集器进行垃圾的清理和内存的回收。

内存分配机制

对象优先在Eden区分配

大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。

Minor GC和Full GC 有什么不同呢?

  • Minor GC/Young GC:指发生在新生代的垃圾收集动作,Minor GC非常频繁,回收速度一般也比较快。
  • Major GC/Full GC:一般会回收老年代、年轻代、方法区的垃圾, Major GC的速度一般会比Minor GC慢10倍以上。

示例代码:

/**
 * -Xms30M -Xmx30M -XX:+PrintGCDetails
 **/
public static void main(String[] args) {

	byte[] allocation1 = new byte[300 * 1024];
}

打印结果:

Heap
 PSYoungGen      total 9216K, used 2692K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
  eden space 8192K, 32% used [0x00000007bf600000,0x00000007bf8a13a0,0x00000007bfe00000)
  from space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
  to   space 1024K, 0% used [0x00000007bfe00000,0x00000007bfe00000,0x00000007bff00000)
 ParOldGen       total 20480K, used 0K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
  object space 20480K, 0% used [0x00000007be200000,0x00000007be200000,0x00000007bf600000)
 Metaspace       used 3073K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 337K, capacity 388K, committed 512K, reserved 1048576K

我们给堆分配了最多30M的空间,按照新生代占1/3,老年代占2/3,新生代中Eden:From Survivor:To Survivor为8:1:1,则Eden区内存空间为8M。
可以看到只有Eden区被占用了2692K,其中300K是给对象分配内存占用的空间。
声明一下即使程序什么也不做,新生代也会使用至少几M的内存,这里的2392K就是系统初始化消耗的内存。

大对象直接进入老年代

大对象就是需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组。
大对象对虚拟机的内存分配来说就是一个坏消息,比遇到一个大对象更加坏的消息就是遇到一群朝生夕灭的短命大对象,写程序的时候应当避免。

虚拟机提供了一个-XX:PretenureSizeThreshold参数,可以设置大对象的大小,如果对象超过设置的大小会直接进入老年代,不会进入年轻代。这样做的目的是避免在Eden区及两个Survivor区之间发生大量和频繁的内存复制。
-XX:PretenureSizeThreshold参数只对Serial和ParNew两款收集器有效,Parallel Scavenge收集器不认识这个参数,Parallel Scavenge收集器一般并不需要设置。如果遇到必须使用此参数的场合,可以考虑ParNew加CMS的收集器组合。

示例代码:

/**
 * -Xms30M -Xmx30M -XX:+PrintGCDetails
 **/
public static void main(String[] args) {

	byte[] allocation1 = new byte[10 * _1M];
}

打印结果:

Heap
 PSYoungGen      total 9216K, used 2392K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
  eden space 8192K, 29% used [0x00000007bf600000,0x00000007bf856390,0x00000007bfe00000)
  from space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
  to   space 1024K, 0% used [0x00000007bfe00000,0x00000007bfe00000,0x00000007bff00000)
 ParOldGen       total 20480K, used 10240K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
  object space 20480K, 50% used [0x00000007be200000,0x00000007bec00010,0x00000007bf600000)
 Metaspace       used 3087K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 339K, capacity 388K, committed 512K, reserved 1048576K

可以看到Eden区的2392K是程序初始化消耗的内存,对象的10M内存空间直接在老年代进行分配了,这就是大对象直接进入老年代。
对象过大是很危险的,如果新生代有空间进行分配,那么对象的复制也会让垃圾收集过程效率变得低下,所以JVM直接让其进入老年代,避免对大对象的复制。

长期存活的对象将进入老年代

虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁),就将会被晋升到老年代中。对象晋升老年代的年龄阈值,可以通过参数-XX:MaxTenuringThreshold设置。

对象动态年龄判断

为了能更好地适应不同程序的内存状况,虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,此时年龄大于或等于该年龄的对象就可以直接进入老年代了,无须等到MaxTenuringThreshold中要求的年龄。

这个规则其实是希望那些可能是长期存活的对象,尽早进入老年代。对象动态年龄判断机制一般是在Minor GC之后触发的。

Minor GC后存活的对象Survivor区放不下

这种情况会把存活的对象部分挪到老年代,部分可能还会放在Survivor区。
示例代码:

/**
 * -Xms30M -Xmx30M -XX:+PrintGCDetails
 **/
public static void main(String[] args) {

	byte[] allocation1 = new byte[2 * _1M];

	byte[] allocation2 = new byte[2 * _1M];

	byte[] allocation3 = new byte[2 * _1M];
}

打印结果:

[GC (Allocation Failure) [PSYoungGen: 8185K->512K(9216K)] 8185K->6664K(29696K), 0.0055178 secs] [Times: user=0.01 sys=0.00, real=0.00 secs] 
Heap
 PSYoungGen      total 9216K, used 701K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
  eden space 8192K, 2% used [0x00000007bf600000,0x00000007bf62f6d8,0x00000007bfe00000)
  from space 1024K, 50% used [0x00000007bfe00000,0x00000007bfe80000,0x00000007bff00000)
  to   space 1024K, 0% used [0x00000007bff00000,0x00000007bff00000,0x00000007c0000000)
 ParOldGen       total 20480K, used 6152K [0x00000007be200000, 0x00000007bf600000, 0x00000007bf600000)
  object space 20480K, 30% used [0x00000007be200000,0x00000007be802030,0x00000007bf600000)
 Metaspace       used 3001K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 328K, capacity 388K, committed 512K, reserved 1048576K

可以看到在新生代发生了一次Minor GC,并且因为From Survivor区没有足够的内存空间存储从Eden区复制过来的对象,所以From Survivor区只存储了一部分,还有一部分挪到了老年代。

老年代空间分配担保机制

在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次MinorGC,尽管这次Minor GC是有风险的;如果小于或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC。
在这里插入图片描述
老年代要进行这样的担保,前提是老年代本身还有容纳这些对象的剩余空间,一共有多少对象会活下来在实际完成内存回收之前是无法明确知道的,所以只好取之前每一次回收晋升到老年代对象容量的平均大小值作为经验值,与老年代的剩余空间进行比较,决定是否进行Full GC来让老年代腾出更多空间。

如果Full GC完之后还是没有空间存放Minor GC之后的存活对象,则会发生OOM。

内存回收机制

如何判断对象可以被回收

堆中几乎放着所有的对象实例,对堆进行垃圾回收前的第一步就是要判断哪些对象已经死亡(即不能再被任何途径使用的对象)。

引用计数算法

给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。
优点:实现简单,判定效率也很高,在大部分情况下是一个不错的算法
缺点:无法解决对象之间循环引用的问题

可达性分析算法

这个算法的基本思路就是通过一系列称为GC Roots的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说,就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。

GC Roots根节点:线程栈的本地变量、静态变量、本地方法栈的变量等等

如何判定对象是否存活

即使在可达性分析算法中不可达的对象,也并非是一定会被执行死刑的,这时候它们暂时处于缓刑阶段,要真正宣告一个对象死亡,至少要经历再次标记过程。

1.第一次标记并进行一次筛选
如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。
当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为没有必要执行。

任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行。

如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。
这里所谓的执行是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。

2.第二次小规模标记
finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己,只要重新与引用链上的任何一个对象建立关联即可(譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量),那在第二次标记时它将被移除出即将回收的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。

如何判断一个类是无用的类

方法区主要回收的是无用的类,那么如何判断一个类是无用的类的呢?

  • 该类所有的实例都已经被回收,也就是 Java 堆中不存在该类的任何实例
  • 加载该类的 ClassLoader 已经被回收
  • 该类对应的 java.lang.Class 对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法

常见引用类型

在JDK 1.2以前,Java中的引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。
我们希望能描述这样一类对象:当内存空间还足够时,则能保留在内存之中;如果内存空间在进行垃圾收集后还是非常紧张,则可以抛弃这些对象。
在JDK 1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,这4种引用强度依次逐渐减弱。

强引用(Strong Reference)

强引用就是指在程序代码之中普遍存在的,类似 Object obj = new Object() 这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。

软引用(Soft Reference)

软引用是用来描述一些还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。
在JDK 1.2之后,提供了SoftReference类来实现软引用。

弱引用(Weak Reference)

弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
在JDK 1.2之后,提供了WeakReference类来实现弱引用。

虚引用(Phantom Reference)

虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
在JDK 1.2之后,提供了PhantomReference类来实现虚引用。

猜你喜欢

转载自blog.csdn.net/CX610602108/article/details/106287194