Class文件是一组以8个字节位基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在文件之中,中间没有添加任何分隔符。
一、魔数与Class文件的版本每个Class文件的头4个字节被成为魔术,它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。
紧接着魔术的4个字节存储的是Class文件的版本号:第5和第6个字节是次版本号,第7和第8个字节是主版本号,Java版本号是从45开始的。
下图显示的是使用十六进制编辑器WinHex打开这个Class文件的结果,可以清楚地看见开头4个字 节的十六进制表示是0xCAFEBABE,代表次版本号的第5个和第6个字节值为0x0000,而主版本号的值 为0x0032,也即是十进制的50,该版本号说明这个是可以被JDK 6或以上版本虚拟机执行的Class文件 。
二、常量池
紧接着主、次版本号之后的就是常量池入口,常量池可以比喻为Class文件里的资源仓库,它是Class文件结构中与其他项目关联最多的数据,也是占用Class文件空间最大的数据项目之一,它还是在Class文件中第一个出现的表类型数据项目。
由于常量池中常量的数量是不固定的,所以在常量池的入口需要放置一项u2类型的数据,代表常量池容量计数值。与Java中语言习惯不同,这个容量计数是从1而不是0开始的。Class文件结构中只有常量池的容量计数是从1开始,对于其他集合类型,包括接口索引集合、字段表集合、方法表集合等的容量技计数都与一般习惯相同,从0开始。
常量池中主要存放两大类常量:字面量和符号引用。 字面量比 较接近于Java语言层面的常量概念,如文本字符串、被声明为final的常量值等。而符号引用则属于编译 原理方面的概念,主要包括下面几类常量:
被模块导出或者开放的包
类和接口的全限定名
字段的名称和描述符
方法句柄和方法类型
动态调用点和动态常量
常量池中每一项常量都是一个表。
三、访问标志在常量池后面,紧接着的2字节代表访问标志,这个标志用于识别一些类或者接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义为abstract类型;如果是类的话,是否被声明为final等。
四、类索引、父类索引与接口索引集合
类索引和父类索引都是一个u2类型的数据,而接口索引集合是一组u2类型的数据集合,Class文件由这三项数据来确定该类型的继承关系。
类索引用于确定这个类的全限定名,父类索引用于确定这个类的父类的全限定名。接口索引用于描述这个类实现了哪些接口,被实现的接口按implements关键字(如果Class类是一个接口,则是extends关键字)后的顺序从左到右排列在接口索引集合中。
五、字段表集合字段表用于描述接口或者类中声明的变量。Java语言中的“字段”包括类级变量以及实例级变量。但不包括在方法内部声明的局部变量。
字段可以包括的修饰符有字段的作用域(public、private、protected修饰 符)、是实例变量还是类变量(static修饰符)、可变性(final)、并发可见性(volatile修饰符,是否 强制从主内存读写)、可否被序列化(transient修饰符)、字段数据类型(基本类型、对象、数组)、 字段名称。
六、方法表集合
Class文件存储 格式中对方法的描述与对字段的描述采用了几乎完全一致的方式,方法表的结构如同字段表一样,依次包括访问标志、名称索引、描述符索引、属性表集合几项



