JVM字节码指令理解

(一)概述
很多人可能会觉得JVM字节码很神秘,我们写的一行行代码放到底层竟然可以用一串16进制的数字保存。再到计算机底层竟然可以用0和1执行如何复杂的代码。JVM的设计确实十分巧妙,但对我们几乎所有开发者来说,这些底层的内容我们已经不需要再去掌握了,因此今天我们不去讲JVM字节码究竟是怎么设计的,我们通过最简单的方法来快速读懂JVM字节码

(二)什么是字节码
我们写的Java代码经过编译之后就会变成一个个.class文件,这就是字节码文件。用一些专门打开.class的工具打开后,可以发现里面就是一串以0xCAFEBABE开头的16进制文件。其实这些十六进制的文件就是Java代码运行的关键。
光看这些字节码肯定是看不懂的,但是我们可以将字节码通过一些工具反编译成我们能看懂的东西。Java本身就提供了反编译工具Javap。

(三)Java字节指令码怎么看
为了看懂Java字节指令代码,我先写一段简单的程序:

public class Main {
    
    
 
    public static int calculate(){
    
    
        int a=1;
        int b=2;
        int c=(a+b)*10;
        return c;
    }
 
    public static void main(String[] args) {
    
    
        System.out.println(calculate());
    }
}

直接idea里面,使用终端打开这个类目录
在这里插入图片描述
先使用编译指令,将java文件编译成字节码文件,命令: javac test.java
在这里插入图片描述
然后使用反编译指令,将class文件编译成计算机能够识别的机器码,命令:javap -c test.class
在这里插入图片描述
刚看到这些指令可能很不熟悉,我在文章的最后添加了一个附录,不会的直接用ctrl+F查询就可以了。这里主要讲一下calculate()这个方法的执行过程

现在我们就来分析下这机器码的执行流程吧!

基础概念介绍

首先我们需要重新回顾一下Java虚拟机中栈的局部变量表操作数栈,以及程序计数器
局部变量表存放了编译器可知的八个基本数据类型、对象引用、和returnAddress类型(指向了一条字节码指令的地址)。

操作数栈用于执行一系列出入栈的操作。

程序计数器的作用可以看成是当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变计数器的值来选择下一条需要执行的字节码的指令

1、程序计数器概念
JVM中的程序计数寄存器(Program Counter Register)中Register的命名来源于CPU的寄存器,寄存器用来存储指令相关的现场信息。
CPU只有把数据装载到寄存器中才能够正常执行指令。
JVM中的寄存器不是物理上的寄存器而是对物理寄存器的抽象模拟。
程序计数器有时候也被称为为程序钩子

2,程序计数器的作用
程序计数是JVM内存区域中一块较小的内存空间,可以认为是当前Java线程所执行的字节码的行号指示器。字节码解释器工作是通过改变这个计数器的值来定位选取下一条待执行的字节码指令,选择、循环、异常处理、线程恢复等功能都需要依赖程序计数器来完成
在这里插入图片描述
说明:JVM虚拟机为了保证线程切换后还能恢复到上次正确执行的位置,JVM给每条Java线程都分配了一个独立的程序计数器,这样各线程之间计数器互不影响,独立存储和对应的Java线程生命周期保持一致。

2.1,字节码解释器通过改变程序计数器来依次读取指令,从而实现Java代码的流程控制,比如:顺序执行、选择、循环、异常处理等。

2.2,在多线程的情况下,程序计数器主要用于记录当前线程执行的具体位置,这样在线程切换回来的时候知道该线程从哪一个环节开始执行。

3, 程序计数器的特点

  1. 每个Java线程独有,与其对应的Java线程的生命周期保持一致。
  2. 占用JVM内存区域很小的一块(可忽略不计),读取速度很快
  3. 负责准确记录每个线程当前执行到的具体位置
  4. 执行本地方法,程序计数器会存储undefined
  5. JVM中唯一一个不会出现Out Of Memory Error(内存溢出错误)的区域,也不需要进行垃圾回收

4,图解JVM指令

iconst的意思是将int型常量推到操作数栈栈顶,比如iconst_1就是将第一个int型常量推送到了操作数栈顶

istore的意思是将栈顶int型常量存入第几个变量中,比如istore_0就是将操作数栈栈顶的1存入局部变量表的第一个变量a中

iload的意思是将第i个本地变量推送到栈顶,比如iload_0是将第一个变量推送到操作数栈
前六条命令图解如下
在这里插入图片描述

iadd的意思是将操作数栈顶两个元素相加,并压入栈顶

bipush将单字节的常量值(-128~127)推送至栈顶

imul将栈顶两个元素相乘,并压入栈顶

ireturn返回栈顶元素

后六条命令图解如下
在这里插入图片描述
通过上面两张图,应该可以很清晰地了解到整个字节指令码的方式。

(四)jvm指令附录

指令码 助记符    说明
0x00 nop        无操作
0x01 aconst_null 将null推送至栈顶
0x02 iconst_m1    将int-1推送至栈顶
0x03 iconst_0    将int0推送至栈顶
0x04 iconst_1    将int1推送至栈顶
0x05 iconst_2    将int2推送至栈顶
0x06 iconst_3    将int3推送至栈顶
0x07 iconst_4    将int4推送至栈顶
0x08 iconst_5    将int5推送至栈顶
0x09 lconst_0    将long0推送至栈顶
0x0a lconst_1    将long1推送至栈顶
0x0b fconst_0    将float0推送至栈顶
0x0c fconst_1    将float1推送至栈顶
0x0d fconst_2    将float2推送至栈顶
0x0e dconst_0    将double0推送至栈顶
0x0f dconst_1    将double1推送至栈顶
0x10 bipush    将单字节的常量值(-128~127)推送至栈顶
0x11 sipush    将一个短整型常量值(-32768~32767)推送至栈顶
0x12 ldc    将int, floatString型常量值从常量池中推送至栈顶
0x13 ldc_w    将int, floatString型常量值从常量池中推送至栈顶(宽索引)
0x14 ldc2_w    将longdouble型常量值从常量池中推送至栈顶(宽索引)
0x15 iload    将指定的int型本地变量推送至栈顶
0x16 lload    将指定的long型本地变量推送至栈顶
0x17 fload    将指定的float型本地变量推送至栈顶
0x18 dload    将指定的double型本地变量推送至栈顶
0x19 aload    将指定的引用类型本地变量推送至栈顶
0x1a iload_0    将第一个int型本地变量推送至栈顶
0x1b iload_1    将第二个int型本地变量推送至栈顶
0x1c iload_2    将第三个int型本地变量推送至栈顶
0x1d iload_3    将第四个int型本地变量推送至栈顶
0x1e lload_0    将第一个long型本地变量推送至栈顶
0x1f lload_1    将第二个long型本地变量推送至栈顶
0x20 lload_2    将第三个long型本地变量推送至栈顶
0x21 lload_3    将第四个long型本地变量推送至栈顶
0x22 fload_0    将第一个float型本地变量推送至栈顶
0x23 fload_1    将第二个float型本地变量推送至栈顶
0x24 fload_2    将第三个float型本地变量推送至栈顶
0x25 fload_3    将第四个float型本地变量推送至栈顶
0x26 dload_0    将第一个double型本地变量推送至栈顶
0x27 dload_1    将第二个double型本地变量推送至栈顶
0x28 dload_2    将第三个double型本地变量推送至栈顶
0x29 dload_3    将第四个double型本地变量推送至栈顶
0x2a aload_0    将第一个引用类型本地变量推送至栈顶
0x2b aload_1    将第二个引用类型本地变量推送至栈顶
0x2c aload_2    将第三个引用类型本地变量推送至栈顶
0x2d aload_3    将第四个引用类型本地变量推送至栈顶
0x2e iaload    将int型数组指定索引的值推送至栈顶
0x2f laload    将long型数组指定索引的值推送至栈顶
0x30 faload    将float型数组指定索引的值推送至栈顶
0x31 daload    将double型数组指定索引的值推送至栈顶
0x32 aaload    将引用型数组指定索引的值推送至栈顶
0x33 baload    将booleanbyte型数组指定索引的值推送至栈顶
0x34 caload    将char型数组指定索引的值推送至栈顶
0x35 saload    将short型数组指定索引的值推送至栈顶
0x36 istore    将栈顶int型数值存入指定本地变量
0x37 lstore    将栈顶long型数值存入指定本地变量
0x38 fstore    将栈顶float型数值存入指定本地变量
0x39 dstore    将栈顶double型数值存入指定本地变量
0x3a astore    将栈顶引用型数值存入指定本地变量
0x3b istore_0    将栈顶int型数值存入第一个本地变量
0x3c istore_1    将栈顶int型数值存入第二个本地变量
0x3d istore_2    将栈顶int型数值存入第三个本地变量
0x3e istore_3    将栈顶int型数值存入第四个本地变量
0x3f lstore_0    将栈顶long型数值存入第一个本地变量
0x40 lstore_1    将栈顶long型数值存入第二个本地变量
0x41 lstore_2    将栈顶long型数值存入第三个本地变量
0x42 lstore_3    将栈顶long型数值存入第四个本地变量
0x43 fstore_0    将栈顶float型数值存入第一个本地变量
0x44 fstore_1    将栈顶float型数值存入第二个本地变量
0x45 fstore_2    将栈顶float型数值存入第三个本地变量
0x46 fstore_3    将栈顶float型数值存入第四个本地变量
0x47 dstore_0    将栈顶double型数值存入第一个本地变量
0x48 dstore_1    将栈顶double型数值存入第二个本地变量
0x49 dstore_2    将栈顶double型数值存入第三个本地变量
0x4a dstore_3    将栈顶double型数值存入第四个本地变量
0x4b astore_0    将栈顶引用型数值存入第一个本地变量
0x4c astore_1    将栈顶引用型数值存入第二个本地变量
0x4d astore_2    将栈顶引用型数值存入第三个本地变量
0x4e astore_3    将栈顶引用型数值存入第四个本地变量
0x4f iastore    将栈顶int型数值存入指定数组的指定索引位置
0x50 lastore    将栈顶long型数值存入指定数组的指定索引位置
0x51 fastore    将栈顶float型数值存入指定数组的指定索引位置
0x52 dastore    将栈顶double型数值存入指定数组的指定索引位置
0x53 aastore    将栈顶引用型数值存入指定数组的指定索引位置
0x54 bastore    将栈顶booleanbyte型数值存入指定数组的指定索引位置
0x55 castore    将栈顶char型数值存入指定数组的指定索引位置
0x56 sastore    将栈顶short型数值存入指定数组的指定索引位置
0x57 pop     将栈顶数值弹出 (数值不能是longdouble类型的)
0x58 pop2    将栈顶的一个(longdouble类型的)或两个数值弹出(其它)
0x59 dup     复制栈顶数值并将复制值压入栈顶
0x5a dup_x1    复制栈顶数值并将两个复制值压入栈顶
0x5b dup_x2    复制栈顶数值并将三个(或两个)复制值压入栈顶
0x5c dup2    复制栈顶一个(longdouble类型的)或两个(其它)数值并将复制值压入栈顶
0x5d dup2_x1    复制栈顶的一个或两个值,将其插入栈顶那两个或三个值的下面
0x5e dup2_x2    复制栈顶的一个或两个值,将其插入栈顶那两个、三个或四个值的下面
0x5f swap    将栈最顶端的两个数值互换(数值不能是longdouble类型的)
0x60 iadd    将栈顶两int型数值相加并将结果压入栈顶
0x61 ladd    将栈顶两long型数值相加并将结果压入栈顶
0x62 fadd    将栈顶两float型数值相加并将结果压入栈顶
0x63 dadd    将栈顶两double型数值相加并将结果压入栈顶
0x64 isub    将栈顶两int型数值相减并将结果压入栈顶
0x65 lsub    将栈顶两long型数值相减并将结果压入栈顶
0x66 fsub    将栈顶两float型数值相减并将结果压入栈顶
0x67 dsub    将栈顶两double型数值相减并将结果压入栈顶
0x68 imul    将栈顶两int型数值相乘并将结果压入栈顶
0x69 lmul    将栈顶两long型数值相乘并将结果压入栈顶
0x6a fmul    将栈顶两float型数值相乘并将结果压入栈顶
0x6b dmul    将栈顶两double型数值相乘并将结果压入栈顶
0x6c idiv    将栈顶两int型数值相除并将结果压入栈顶
0x6d ldiv    将栈顶两long型数值相除并将结果压入栈顶
0x6e fdiv    将栈顶两float型数值相除并将结果压入栈顶
0x6f ddiv    将栈顶两double型数值相除并将结果压入栈顶
0x70 irem    将栈顶两int型数值作取模运算并将结果压入栈顶
0x71 lrem    将栈顶两long型数值作取模运算并将结果压入栈顶
0x72 frem    将栈顶两float型数值作取模运算并将结果压入栈顶
0x73 drem    将栈顶两double型数值作取模运算并将结果压入栈顶
0x74 ineg    将栈顶int型数值取负并将结果压入栈顶
0x75 lneg    将栈顶long型数值取负并将结果压入栈顶
0x76 fneg    将栈顶float型数值取负并将结果压入栈顶
0x77 dneg    将栈顶double型数值取负并将结果压入栈顶
0x78 ishl    将int型数值左移位指定位数并将结果压入栈顶
0x79 lshl    将long型数值左移位指定位数并将结果压入栈顶
0x7a ishr    将int型数值右(符号)移位指定位数并将结果压入栈顶
0x7b lshr    将long型数值右(符号)移位指定位数并将结果压入栈顶
0x7c iushr    将int型数值右(无符号)移位指定位数并将结果压入栈顶
0x7d lushr    将long型数值右(无符号)移位指定位数并将结果压入栈顶
0x7e iand    将栈顶两int型数值作“按位与”并将结果压入栈顶
0x7f land    将栈顶两long型数值作“按位与”并将结果压入栈顶
0x80 ior     将栈顶两int型数值作“按位或”并将结果压入栈顶
0x81 lor     将栈顶两long型数值作“按位或”并将结果压入栈顶
0x82 ixor    将栈顶两int型数值作“按位异或”并将结果压入栈顶
0x83 lxor    将栈顶两long型数值作“按位异或”并将结果压入栈顶
0x84 iinc    将指定int型变量增加指定值(i++, i--, i+=20x85 i2l     将栈顶int型数值强制转换成long型数值并将结果压入栈顶
0x86 i2f     将栈顶int型数值强制转换成float型数值并将结果压入栈顶
0x87 i2d     将栈顶int型数值强制转换成double型数值并将结果压入栈顶
0x88 l2i     将栈顶long型数值强制转换成int型数值并将结果压入栈顶
0x89 l2f     将栈顶long型数值强制转换成float型数值并将结果压入栈顶
0x8a l2d     将栈顶long型数值强制转换成double型数值并将结果压入栈顶
0x8b f2i     将栈顶float型数值强制转换成int型数值并将结果压入栈顶
0x8c f2l     将栈顶float型数值强制转换成long型数值并将结果压入栈顶
0x8d f2d     将栈顶float型数值强制转换成double型数值并将结果压入栈顶
0x8e d2i     将栈顶double型数值强制转换成int型数值并将结果压入栈顶
0x8f d2l     将栈顶double型数值强制转换成long型数值并将结果压入栈顶
0x90 d2f     将栈顶double型数值强制转换成float型数值并将结果压入栈顶
0x91 i2b     将栈顶int型数值强制转换成byte型数值并将结果压入栈顶
0x92 i2c     将栈顶int型数值强制转换成char型数值并将结果压入栈顶
0x93 i2s     将栈顶int型数值强制转换成short型数值并将结果压入栈顶
0x94 lcmp    比较栈顶两long型数值大小,并将结果(10-1)压入栈顶
0x95 fcmpl    比较栈顶两float型数值大小,并将结果(10-1)压入栈顶;当其中一个数值为NaN时,将-1压入栈顶
0x96 fcmpg    比较栈顶两float型数值大小,并将结果(10-1)压入栈顶;当其中一个数值为NaN时,将1压入栈顶
0x97 dcmpl    比较栈顶两double型数值大小,并将结果(10-1)压入栈顶;当其中一个数值为NaN时,将-1压入栈顶
0x98 dcmpg    比较栈顶两double型数值大小,并将结果(10-1)压入栈顶;当其中一个数值为NaN时,将1压入栈顶
0x99 ifeq    当栈顶int型数值等于0时跳转
0x9a ifne    当栈顶int型数值不等于0时跳转
0x9b iflt    当栈顶int型数值小于0时跳转
0x9c ifge    当栈顶int型数值大于等于0时跳转
0x9d ifgt    当栈顶int型数值大于0时跳转
0x9e ifle    当栈顶int型数值小于等于0时跳转
0x9f if_icmpeq    比较栈顶两int型数值大小,当结果等于0时跳转
0xa0 if_icmpne    比较栈顶两int型数值大小,当结果不等于0时跳转
0xa1 if_icmplt    比较栈顶两int型数值大小,当结果小于0时跳转
0xa2 if_icmpge    比较栈顶两int型数值大小,当结果大于等于0时跳转
0xa3 if_icmpgt    比较栈顶两int型数值大小,当结果大于0时跳转
0xa4 if_icmple    比较栈顶两int型数值大小,当结果小于等于0时跳转
0xa5 if_acmpeq    比较栈顶两引用型数值,当结果相等时跳转
0xa6 if_acmpne    比较栈顶两引用型数值,当结果不相等时跳转
0xa7 goto    无条件跳转
0xa8 jsr     跳转至指定16位offset位置,并将jsr下一条指令地址压入栈顶
0xa9 ret     返回至本地变量指定的index的指令位置(一般与jsr, jsr_w联合使用)
0xaa tableswitch    用于switch条件跳转,case值连续(可变长度指令)
0xab lookupswitch    用于switch条件跳转,case值不连续(可变长度指令)
0xac ireturn    从当前方法返回int
0xad lreturn    从当前方法返回long
0xae freturn    从当前方法返回float
0xaf dreturn    从当前方法返回double
0xb0 areturn    从当前方法返回对象引用
0xb1 return    从当前方法返回void
0xb2 getstatic    获取指定类的静态域,并将其值压入栈顶
0xb3 putstatic    为指定的类的静态域赋值
0xb4 getfield    获取指定类的实例域,并将其值压入栈顶
0xb5 putfield    为指定的类的实例域赋值
0xb6 invokevirtual    调用实例方法
0xb7 invokespecial    调用超类构造方法,实例初始化方法,私有方法
0xb8 invokestatic    调用静态方法
0xb9 invokeinterface 调用接口方法
0xba invokedynamic  调用动态链接方法
0xbb new     创建一个对象,并将其引用值压入栈顶
0xbc newarray    创建一个指定原始类型(如int, float, char…)的数组,并将其引用值压入栈顶
0xbd anewarray    创建一个引用型(如类,接口,数组)的数组,并将其引用值压入栈顶
0xbe arraylength 获得数组的长度值并压入栈顶
0xbf athrow    将栈顶的异常抛出
0xc0 checkcast    检验类型转换,检验未通过将抛出ClassCastException
0xc1 instanceof 检验对象是否是指定的类的实例,如果是将1压入栈顶,否则将0压入栈顶
0xc2 monitorenter    获得对象的锁,用于同步方法或同步块
0xc3 monitorexit    释放对象的锁,用于同步方法或同步块
0xc4 wide    扩大本地变量索引的宽度
0xc5 multianewarray 创建指定类型和指定维度的多维数组(执行该指令时,操作栈中必须包含各维度的长度值),并将其引用值压入栈顶
0xc6 ifnull    为null时跳转
0xc7 ifnonnull    不为null时跳转
0xc8 goto_w    无条件跳转
0xc9 jsr_w    跳转至指定32位offset位置,并将jsr_w下一条指令地址压入栈顶
============================================
0xca breakpoint  调试时的断点标记
0xfe impdep1    为特定软件而预留的语言后门
0xff impdep2    为特定硬件而预留的语言后门
最后三个为保留指令

注释:当前文章部分为借鉴

猜你喜欢

转载自blog.csdn.net/gelinwangzi_juge/article/details/127514349