本篇文章为你整理了5 字节码文件结构(字节编码方式)的详细内容,包含有什么叫字节码文件 字节编码方式 字节码文件的后缀是 字节码的结构 5 字节码文件结构,希望能帮助你了解 5 字节码文件结构。
字节码文件是8字节为单位,但是编译出来的几个class文件大小都不是8的倍数
1 字节码文件结构
1.1 概述
字节码文件:是一组以8个字节为基础单位的二进制流,当需要存储空间超过8字节时,会按照高位在前的方式分割【大端法】成若干个8个字节进行存储。
数据类型可抽象为两种:“无符号数”和“表”。
无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。(基本数据类型)。用以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节和8个字节的无符号数。
表是由多个无符号数或者其他表作为数据项构成的复合数据类型,表的命名都以“_info”结尾
字节码文件结构不带分割符号
组成及空间占比如下:
1.2 关于“表”的说明
表是什么?
是字节码的两种数据类型之一
是一种复合数据类型
由一个或者的无符号数或者表组成
可以理解为Java对象:对象由多个属性组成,属性可以为基本数据类型,或者为对象类型
头4个字节,固定值为:0xCAFEBABE。
作用是确定这个文件是否为一个能被虚拟机接受的Class文件
3 版本号
魔数的后继4个字节,第5和第6个字节是次版本号,第7和第8个字节是主版本号
作用是识别JDK版本
4 常量池
常量池的常量分为两种类型:字面量、符号引用两种
4.1 字面量
字面量比较接近于Java语言层面的常量概念,如文本字符串、被声明为final的常量值等。
4.2 符号引用
以一组符号来描述所引用的目标,符号可以是任何形式的字面量
目标包括这几类:
4.3 常量的表结构
常量池中每一项常量都是一个表,一共有17种表结构,因此一共有17种常量。17种常量类型如下所示:
4.3.1 表结构的属性解析
表结构,可以表示为:【属性:对应的值】,每种常量类型(表)都有一个或者多个属性,所有属性的解释如下:
tag:标志位,用于区分常量类型。
index:常量池的索引值,它指向常量池中另外一种类型常量。
length:该UTF-8编码的字符串长度是多少字节 (只有CONSTANT_Utf8_info类型才有该属性)
bytes:表示 UTF-8_info、Float_info、integer_info 、Long_info、Double_info 等常量类型的值。
reference_kind:
reference:index:
descriptor_index:
.......
2.3.2 17种常量的表结构解析
表结构起始的第一位都是flag标志位
(JDK7增加的三种:CONSTANT_MethodHandle_info、CONSTANT_MethodType_info和 CONSTANT_InvokeDynamic_info,JDK11中又增加了第四种常量CONSTANT_Dynamic_info,在后续章节中详细解)
5 访问标志
用于识别一些类或者接口层次的访问信息。
在常量池之后,占据2个字节。
部分访问标志如下所示:
以 ByteCodeTest_1类为例子:
package com.minnesota.practice.test;
public final class ByteCodeTest_1 {
public static void main(String[] args) {
它符合这三点:
public类型
被声明为final
JDK1.2之后的编译器编译
因此它的访问标志(access_flags)为:ACC_PUBLIC+ACC_SUPER+ACC_FINAL,即 0x0001+0x0010+0x0020=0x0031。
访问标志计算:如果该标志为真,则使用其标志值,并将多个标志值相加
跟字节码结果一致
6 类索引、父类索引与接口索引集合
Class文件中由这三项数据来确定该类型的继承关系
类索引:用于确定这个类的全名
父类索引:用于确定这个类的父类的全名
接口索引集合:用来描述这个类实现了哪些接口 (按implements/extends后面从左到右顺序的接口集合)
类索引和父类索引都是占用2个字节存储,接口索引集合:由占据2字节的接口计数器,和索引表 两部分组成。如果该类没有实现任何接口,则该计数器值为0,后面接口的索引表不再占用任何字节
7 字段表集合
字段表:用来描述接口或类中声明的类变量(不包括局部变量)。
字段表集合由:访问标志、简名索引、及类型索引、属性集合 四部分组成。
字段表集合中不会列出从父类或者父接口中继承而来的字段
如下所示:
7.1 访问标志
访问标志:access_flags,是指变量的信息,例如:作用域(public、private、protected修饰符)、是实例变量还是类变量(static修饰符)、可变性(final)、并发可见性(volatile修饰符)、可否被序列化(transient修饰符)等信息。
访问标志的值如下:
7.2 简名索引
简单名称就是指不包含类型和参数修饰的变量名称,例如 private static final String DREAM = "byte dancing",简单名称就是:DREAM。简单名称的值是指向常量池的一个索引
7.3 类型索引
描述符:描述字段的数据类型。根据描述符规则,基本数据类 型(byte、char、double、float、int、long、short、boolean)以及代表无返回值的void类型都用一个大写字符来表示,而对象类型则用字符L加对象的全限定名来表示。该索引指向常量池
如下所示:
7.4 属性集合
包含属性数量、属性列表两部分,表示在该字段中添加一些扩展属性。
它属于表类型
它是非必须的。
8 方法表集合
方法表的结构如同字段表一样,依次包括访问标志(access_flags)、名称索引(name_index)、描述符索引(descriptor_index)、属性表集合(attributes)。如下所示
8.1 访问标志
如下图所示:
8.2 简名索引
规范跟字段的简名索引一样,例如main
8.3 描述符索引
指方法的返回类型
定义跟字段描述符一样
8.4 属性表集合
属性表集合也是包含属性数量和属性列表。
8.5 关于方法体代码的存储
方法里面的代码去哪里了?
方法里的Java代码,经过Javac编译器编译成字节码指令之 后,存放在方法属性表集合中一个名为“Code”的属性里面,属性表作为Class文件格式中最具扩展性的一种数据项目
9 属性表集合
属性表集合是什么?
由多个属性组成
属性的数据类型为表
它是一种扩展空间,Class文件、字段表、方法表都可以携带自己的属性表集合,以描述某些场景专有的信息
属性的结构分为三部分:
Code属性是Class文件中最重要的一个属性,如果把一个Java程序中的信息分为代码(Code,方法体里面的Java代码)和元数据(Metadata,包括类、字段、方法定义及其他信息)两部分,那么在整 个Class文件里,Code属性用于描述代码,所有的其他数据项目都用于描述元数据
max_locals
局部变量表所需的存储空间,单位是变量槽(Slot),变量槽是虚拟机为局部变量分配内存所使用的最小单位
code_length
字节码长度,理论上字节码最大可以为2^32 ,实际上最大只有2^16-1= 65535。即最大可容纳65535个字节码指令
存储字节码指令的一系列字节流,编译器通过指令编码找到对应的指令,由指令来判断是否需要操作数以及如何解析操作数
code_length的值
关于变量槽:
对于byte、char、float、int、short、boolean和 returnAddress等长度不超过32位的数据类型,每个局部变量占用1个变量槽,而double和long这两种64位的数据类型则需要2个变量槽来存放。
9.2 Exceptions属性
Exceptions属性的作用是列举出方法中可能抛出的受查异常,即方法描述时在throws关键字后面列举的异常
结构分析:略
9.3 LineNumberTable属性
用于描述Java源码行号与字节码行号(字节码的偏移量)之间的对应关系。
作用有两点:
当抛出异常时,堆栈将会显示出错的行号
并且在调试程序的时候,可以按照源码行来设置断点。
结构分析:略
9.4 LocalVariableTable
LocalVariableTable属性用于描述栈帧中局部变量表的变量与Java源码中定义的变量之间的关系。
作用:IDEA编辑中调用方法时会自动补充参数名称;debug时根据参数名称获取对应的值
如果没有生成这项属性,最大的影响就是当其他人引用这个方法时,所有的参数名称都将会丢失,譬如IDE将会使用诸如arg0、arg1之类的占位符代替原有的参数名,这对程序运行没有影响,但是会对代码编写带来较大不便,而且在调试期间无法根据参数名称从上下文中获得参数值
9.5 LocalVariableTypeTable
跟泛型有关,当泛型的参数化类型被擦除后,使用字段的特征签名来完成泛型的描述
9.6 SourceFile及SourceDebugExtension属性
SourceFile:记录生成这个Class文件的源码文件名称
SourceDebugExtension:JDK5新增的属性,用于存储额外的代码调试信息。
9.7 ConstantValue属性
作用是通知虚拟机自动为静态变量赋值
9.8 InnerClasses属性
记录内部类与宿主类之间的关联。
9.9 所有29个属性概览
10 字节码文件实例分析
javap:用于分析Class文件字节码的工具,在JDK的bin目录中。
javap -verbose 输出字节码的内容。
测试的java代码:
package com.minnesota.practice.test;
public class ByteCodeTest {
private static final String DREAM = "byte dancing";
public static void main(String[] args) {
int a = 1;
int b = 2;
int c = a+b;
ByteCodeTest.class 内容浏览:
javap -verbose ByteCodeTest.class 解析后:
javap -verbose ByteCodeTest.class
输出结果:
Classfile /路径脱敏/ByteCodeTest.class
Last modified 2022-10-25; size 396 bytes
MD5 checksum be72a2ed3bf8578da63968ce35880d3d
Compiled from "ByteCodeTest.java"
public class com.minnesota.practice.test.ByteCodeTest
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #3.#16 // java/lang/Object." init ":()V
#2 = Class #17 // com/minnesota/practice/test/ByteCodeTest
#3 = Class #18 // java/lang/Object
#4 = Utf8 DREAM
#5 = Utf8 Ljava/lang/String;
#6 = Utf8 ConstantValue
#7 = String #19 // byte dancing
#8 = Utf8 init
#9 = Utf8 ()V
#10 = Utf8 Code
#11 = Utf8 LineNumberTable
#12 = Utf8 main
#13 = Utf8 ([Ljava/lang/String;)V
#14 = Utf8 SourceFile
#15 = Utf8 ByteCodeTest.java
#16 = NameAndType #8:#9 // " init ":()V
#17 = Utf8 com/minnesota/practice/test/ByteCodeTest
#18 = Utf8 java/lang/Object
#19 = Utf8 byte dancing
public com.minnesota.practice.test.ByteCodeTest();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object." init ":()V
4: return
LineNumberTable:
line 3: 0
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=4, args_size=1
0: iconst_1
1: istore_1
2: iconst_2
3: istore_2
4: iload_1
5: iload_2
6: iadd
7: istore_3
8: return
LineNumberTable:
line 6: 0
line 7: 2
line 8: 4
line 9: 8
SourceFile: "ByteCodeTest.java"
详细的字节码文件内容分析,待续
以上就是5 字节码文件结构(字节编码方式)的详细内容,想要了解更多 5 字节码文件结构的内容,请持续关注盛行IT软件开发工作室。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。