深入理解 Java 虚拟机学习笔记

深入理解 Java 虚拟机学习笔记

第二章 Java 内存区域与内存溢出异常

内存区域

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4FhrTtLJ-1595644551713)(../res/java-memory-area.png)]
在这里插入图片描述

对象创建

加载类
- 若已经在内存中则跳过。
- 类加载完以后就可以确定对象所需的空间大小 // TODO why?
分配内存
- 根据 GC 回收算法的不同，分配方式略有区别。
  - 标记整理算法，使用空闲列表
  - 带压缩的算法，使用指针碰撞（已分配和未分配内存间由指针分隔）
内存清零
对象初始化

对象的内存布局

在这里插入图片描述

MarkWord 占用一个字的大小，其中分为两部分：
1. 对象自身运行时元数据。例如，哈希码、GC 分代年龄、锁状态标志等等
2. 类型指针。指向其类的元数据。
3. 若对象是数组则还需要保存数组的长度。
域的存储顺序：
1. 基本类型优先，长度长的优先。
2. 父类域优先。子类较短域可插入父类域空隙。
3. 受虚拟机分配策略参数和域定义顺序的影响。

对象访问

两种方式：

直接引用
引用句柄（句柄池）

内存溢出异常

常用 JVM 参数（Java HotSpot VM）

参数	含义	实例
-verbose:class	显示每一个被加载的类的信息
-verbose:gc	显示每一个 GC 事件的信息
-Xmnsize	年轻代最大容量	-Xmn256m
-Xmssize	堆的初始大小。1024 的整数倍并且要大于 1MB	-Xms6m
-Xmxsize	堆的最大容量。1024 的整数倍并且要大于 2MB	-Xmx80m
-Xsssize	线程栈容量。平台不同默认值不同，详情参考文档。Linux/x64 (64-bit): 1024 KB	-Xss1m
-XX:MaxDirectMemorySize=size	直接内存的最大容量，默认与堆容量相同	-XX:MaxDirectMemorySize=1m
-XX:+HeapDumpOnOutOfMemory	当抛出 OOM 时，使用 HPROF 将堆的快照保存到当前目录
-XX:HeapDumpPath=path	设置快照输出路径	-XX:HeapDumpPath=/var/log/java/java_heapdump.hprof
-XX:+PrintGCDetails	开启在 GC 时打印详细信息
-XX:SurvivorRatio=ratio	新生代中 eden 与 survivor 的大小比例，默认为 8	-XX:SurvivorRatio=4

参考： Java HotSpot VM 参数

常见异常及可能原因

堆区
- OutOfMemoryException。使用工具对快照进行分析，看是否发生了内存泄露（内存中有不再使用的但无法回收的对象或资源）。若是，则通过分析引用链找到根源，解决问题；若不是检查虚拟机堆参数，看是否能够调大。再检查代码中是否有生命周期很长的大对象。
虚拟机栈和本地方法栈
- OutOfMemoryException。栈容量 * 线程数量 = 固定值。当线程数量过多时会引发，可以适当减小栈容量。
- StackOverflowException。按异常查根源。
方法区和运行时常量池
直接内存溢出
- 不正确的使用 NIO。

String 与字符串常量

public class StringTest {
	public static void main(String[] args) {
		String m = "hello";
		String n = "hello";
		String u = new String(m);
		String v = new String("hello");
		
		System.out.println("m == n: " + (m == n));
		System.out.println("m == u: " + (m == u));
		System.out.println("m == v: " + (m == v));
		System.out.println("u == v: " + (u == v));
	}
}

output:
m == n: true
m == u: false
m == v: false
u == v: false

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3M0At3UC-1595644551720)(…/res/string-const.png)]

参考：初探Java字符串
在这里插入图片描述

第三章垃圾收集器与内存分配策略

判断对象是否存活

引用计数器算法。给对象添加一个引用计数器，增加/删除引用时对计数器进行修订。但是该方法因为无法解决循环引用（例如两个对象互相引用）的问题，所以一般不使用该方法
可达性分析算法。从 GC root 开始递归查询并标记，结束后未被标记的（不可达的）即为可回收的对象。GC root 共有四种：
- 栈中引用的对象
- 方法区常量引用的对象
- 方法区静态域引用的对象
- 本地方法中 JNI 引用的对象（不太懂）
回收方法区
- 新生代的回收效率可达到 70% - 95%，而永久代则低的多（性价比太低）
- 在大量使用反射、动态代理、CGLib 等 ByteCode 框架、动态生成 JSP 以及 OSGi 这类频繁自定义 ClassLoader 的场景都需要虚拟机有卸载类的能力。

垃圾收集算法

标记-清除算法
- 扫描一遍，标记出需要回收的对象，再扫描将其清除
- 标记/清除两阶段时间效率都不高，且回收后空间较零碎。
复制算法
- 将内存分为两块，当一块中内存不足时，将其中所有存活对象复制到另一块中，回收当前一整块。
- 目前商用虚拟机大都使用这一算法回收新生代。将内存划分为一个较大的 Eden 区和两块较小的 Survivor. Eden：Survivor = 8：1
标记整理算法
- 标记出须清理的对象，然后其余对象移动到一端
分代收集算法
- 新生代使用复制算法
- 永久代使用其他两种算法

HotSpot 算法实现

当程序执行到安全点（safepoint）时进行 GC，通过在安全点（safepoint）生成的 OopMaps 快速遍历 GC root 进行回收。
- 安全点（safepoint）：指令序列复用的位置。例如方法调用、循环结构、异常跳转等位置。
- OopMaps：一种特殊的数据结构，用于枚举 GC root
但是如果线程处于不执行的状态时，如 sleep 或 blocked 无法执行到安全点，即需要提前标记为安全区域(safe region)。GC 时不考虑处于安全区域的线程，若安全区域代码执行结束但 GC 未结束时该线程等待 GC 结束信号。
- 安全区域（safe region）：引用不发生改变的代码片段

垃圾收集器

在这里插入图片描述

并发(concurrent) vs 并行(parallel)
1. 并行是同时进行（多 CPU）
2. 并发可交替
Minor GC vs Major GC vs Full GC
- Minor GC：只回收新生代
- Major GC：只回收永久代
- Full GC：回收整个堆。相当于 Minor GC + Major GC

serial。单线程，简单高效。复制算法
PerNew。serial 的多线程版本，并行。
parallel Scavenge。与 PerNew 类似，复制算法、多线程、并行。但侧重吞吐量，拥有自适应调节的能力。适合用在后台不需要太多用户交互的地方。
- 吞吐量 = 用户代码执行时间 / （用户代码执行时间 + 垃圾回收时间）
- 自适应调节：虚拟机根据但前系统的运行情况，自动调节虚拟机各参数以确保最大吞吐量。
serial old。serial 的永久代版本。采用标记整理算法。
parallel old。parallel Scavenge 的老年代版本，采用标记整理算法。与 parallel scavenge 搭配可以用在注重吞吐量及 CPU 资源敏感的地方。
CMS（concurrent mark sweep）。并发低停顿，使用标记清理算法。非常优秀的一款收集器，但还是有几个缺点：
1. 对 CPU 资源敏感，当其小于数量小于 4 个是可能会对用户程序有较大影响。默认启动回收线程数 = （CPU 数 + 3）/ 4
2. 无法处理浮动垃圾。浮动垃圾：在垃圾回收期间生成的垃圾
3. 回收后会留有大量的空间碎片。
G1 //TODO

内存分配与回收策略

TLAB（Thread local allocate buffer）线程私有分配缓冲区，每个线程一个

对象优先在 Eden 区分配。内存不足时触发 Minor GC。
大对象直接进入老年代。例如数组或超过参数指定大小的对象。
长期存活的对象进入老年代。GC 超过一定次数仍存活的对象。默认为 15 次，可通过虚拟机参数 -XX:MaxTenuringThreshold 来设置。
动态对象年龄判定。当一个年龄的所有对象大小总和超过 Servivor 空间一半时，大于等于该年龄的所有对象都进入老年代
空间分配担保。当发生 Minor GC 时，若存活的对象过多，servivor 空间无法全部容纳时，会将剩余的对象直接放入永久代；若永久代空间不足以容纳时会引发一次 Full GC

第六章类文件结构

类文件的结构拥有固定的格式，包含两部分的数据：
1. 类的元数据。
2. 方法代码的字节流
code 属性表包含的属性
1. max_stack 存储操作数栈的最大深度值。运行时用来确定分配栈帧中所需的操作数栈深度。
2. max_locals 局部变量所需的最大空间大小
符号引用
1. 类与接口的全限定名
2. 域的名称与描述符
3. 方法名与描述符
该部分内容可以通过查表获得，不再赘述。

第七章虚拟机类加载机制

类加载的过程

在这里插入图片描述

加载
1. 通过全类名获取该类的二进制字节流
2. 解析字节流，将字节流所表达的静态存储结构转化为方法区的运行时数据结构 （这是什么东西？）
3. 为该类创建一个 Class 对象，用来访问该类的类数据
连接
1. 验证
  - 为了确保加载的字节流时符合规范的，不会危害到虚拟机自身的安全。主要包括
  1. 文件格式验证
  2. 元数据验证
  3. 字节码验证
  4. 符号引用验证
2. 准备
  - 为类变量分配内存并进行初步初始化（0/null） // 不应该是在类加载阶段完成的么？
3. 解析
  - 将符号引用替换为直接引用
初始化
- static fields and block init
使用
卸载

类加载器

一个加载器确定一个类的命名空间。同一个类由不同加载器加载后是不同的类。
- 双亲委派：当需要加载一个类时先使用父类加载器（其实这个地方不是很准确，父子关系是通过复合来实现的），若失败了，再使用当前的加载器。如果自己写一个 Object 类，编译可通过但是由于双亲委派，它永远都不会被加载。

第十章早期（编译器）优化

// TODO: 因本章含有相当多的编译原理相关概念，所以第十、十一章学习延后（预计第 8-9 周）

前端编译过程（`.java --> .class`）

解析与填充符号表
1. 词法分析。将源代码转换为标记（Token）的集合
  - Token: 是编译过程中的最小元素。例如关键字、变量名、运算符等等
2. 语法分析。通过 Token 序列将构造抽象语法树(Abstract syntax tree)

参考

郑州大学姜志明老师课件
初探Java字符串 (非常好的一篇文章)
Java HotSpot VM 参数
Java HotSpot Virtual Machine Garbage Collection Tuning Guide
JVM 垃圾回收器工作原理及使用实例介绍 – IBM
Minor GC vs Major GC vs Full GC
Abstract syntax tree
4.4 Symbol Tables

深入理解 Java 虚拟机 学习笔记

深入理解 Java 虚拟机 学习笔记

第二章 Java 内存区域与内存溢出异常

内存区域

对象创建

对象的内存布局

对象访问

内存溢出异常

常用 JVM 参数 （Java HotSpot VM）

常见异常及可能原因

String 与字符串常量

第三章 垃圾收集器与内存分配策略

判断对象是否存活

垃圾收集算法

HotSpot 算法实现

垃圾收集器

内存分配与回收策略

第六章 类文件结构

第七章 虚拟机类加载机制

类加载的过程

类加载器

第十章 早期（编译器）优化

前端编译过程（*.java --> *.class）

参考

猜你喜欢

深入理解 Java 虚拟机学习笔记

深入理解 Java 虚拟机学习笔记

常用 JVM 参数（Java HotSpot VM）

第三章垃圾收集器与内存分配策略

第六章类文件结构

第七章虚拟机类加载机制

第十章早期（编译器）优化

前端编译过程（`.java --> .class`）