JVM的运行时数据区内部结构

tech2025-10-07 51

运行时数据区内部结构

JVM为什么需要运行时数据区：

内存是非常重要的系统资源，是硬盘和CPU 的中间仓库及桥梁，承载着操作系统和应用程序的实时运行。JVM内存布局（运行时数据区）规定了Java在运行过程中内存申请、分配、管理的策略，保证了JVM的高效稳定运行。

Java虚拟机定义若干种程序运行期间会使用到的运行时数据区，其中有一些会随着虚拟机启动而创建，随着虚拟机退出而销毁。另外一些则是与线程一一对应的，这些与线程对应的数据区域会随着线程开始和结束而创建和销毁。

线程私有：程序计数器、虚拟机栈、本地方法栈。

线程间共享：堆、方法区（永久代或元空间、代码缓存）

程序计数器：（PC寄存器）English：Program Counter Register

作用：

pc寄存器用来存储指向下一条指令地址，也即将要执行的指令代码。由执行引擎读取下一条指令

特点：

程序计数器占用内存很小，在进行JVM内存计算时，可以忽略不计线程隔离性，每个线程工作时都有属于自己的独立计数器任何时间一个线程都只有一个方法在执行，也就是所谓的当前方法。程序计数器会存储当前线程正在执行的JAVA方法的JVM指令地址，或者执行native本地方法时，程序计数器的值为空（Undefined）因为本地方法是c语言写的JVM规范中中唯一一个没有规定OutOfMemoryError（OOM）异常，就是不会发生内存区域超限，无GC它是程序控制流的指示器，分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成

面试问题：

1.为什么要有PC寄存器呢？

因为CPU需要不停的切换各个线程，这时候切换回来以后，就得知道接着从哪开始继续执行。

2.为什么PC寄存器为线程私有的呢？

因为为了能够准确记录各个线程正在执行的当前字节码指令地址，最好的办法自然是为每一个线程都分配一个PC寄存器。

虚拟机栈（Java栈）

java虚拟机栈是什么

Java虚拟机栈（Java Virtual Machine Stack），早期也叫Java栈。每个线程在创建时都会一个虚拟机栈，其内部保存一个个的栈帧（Stack Frame），对应着一次次的Java方法调用。线程私有

生命周期：生命周期和线程一致

作用：主管Java程序的运行，它保存方法的局部变量（8种基本数据类型、对象的引用地址）、部分结果，并参与方法的调用和返回。

无GC，存在OOM

面试问题

1.开发中遇见的异常（广义上）有哪些？

Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的。如何设置java栈固定大小： -Xss256k（默认为1G）

如果采用固定大小的Java虚拟机栈，那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机允许的最大容量，Java虚拟机将会抛出一个StackOverflowError（栈溢出错误）异常。如果Java虚拟机栈可以动态扩展，并且在尝试扩展的时候无法申请到足够内存，或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈，那Java虚拟机将会抛出一个OutofMemoryError（内存不足错误）异常。

Java虚拟机栈存储的什么呢？

每个线程都有自己的栈，栈中的数据都是以栈帧（Stack Frame）的格式存在。在这个线程上正在执行的每个方法都各自对应一个栈帧（方法与栈帧一一对应）。栈帧是一个内存区块，是一个数据集，维系着方法执行过程中的各种数据信息。

栈运行原理：

JVM直接对Java栈的操作只有两个，就是对栈帧的压栈和出栈，遵循''先进后出''在一条活动线程中，一个时间点上，只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧（栈顶栈帧）是有效的，这个栈帧被称为当前栈帧（Current Frame），与当前栈帧相对应的方法就是当前方法（Current Method），定义这个方法的类就是当前类（Current Class）。执行引擎运行的所有字节码指令只针对当前栈帧进行操作。如果在该方法中调用了其他方法，对应的新的栈帧会被创建出来，放在栈的顶端，成为新的当前栈。

Java方法有两种返回函数的方式，一种是正常的函数返回，使用return指令；另外一种是抛出异常。不管使用哪种方式，都会导致栈帧被弹出。

栈帧的内部结构

1.局部变量表（Local Variables）

局部变量表也被称之为局部变量数组或本地变量表定义为一个数字数组，主要用于存储方法参数和定义在方法体内的局部变量，这些数据类型包括各类基本数据类型、对象引用(reference) ，以及returnAddress类型。由于局部变量表是建立在线程的栈上，是线程的私有数据，因此不存在数据安全问题.局部变量表所需的容量大小是在编译期确定下来的，并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小的。方法嵌套调用的次数由栈的大小决定。一般来说，栈越大，方法嵌套调用次数越多。对一个函数而言，它的参数和局部变量越多，使得局部变量表膨胀，它的栈帧就越大，以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间，导致其嵌套调用次数就会减少。局部变量表中的变量只在当前方法调用中有效。在方法执行时，虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后，随着方法栈帧的销毁，局部变量表也会随之销毁。

关于Slot的理解

参数值的存放总是在局部变量数组的index0开始，到数组长度-1的索引结束。局部变量表，最基本的存储单元是Slot (变量槽)局部变量表中存放编译期可知的各种基本数据类型(8种)，引用类型(reference)，returnAddress类型的变量。在局部变量表里，32位以内的类型只占用一个slot (包括returnAddress类型)，64位的类型(long和double)占用两个slot。byte、short、char在存储前被转换为int，boolean 也被转换为int，0表示false，非0表示true。long和double 则占据两个Slot。JVM会为局部变量表中的每一个slot都分配一一个访问索引，通过这个索引即可成功访问到局部变量表中指定的局部变量值当一个实例方法被调用的时候，它的方法参数和方法体内部定义的局部变量将会按照顺序被复制到局部变量志中的每一个Slot上如果需要访问局部变量表中一一个64bit的局部变量值时，只需要使用前一个索引即可。(比如:访问long或double类型变量)如果当前帧是由构造方法或者实例方法（非静态方法）创建的，那么该对象引用this将会存放在index为0的slot处，其佘的参数按照参数表顺序继续排列。如图：

注意：

栈帧中的局部变量表中的槽位是可以重用的，如果-一个局部变量过了其作用域，那么在其作用域之后申明的新的局部变量就很有可能会复用过期局部变量的槽位，从而达到节省资源的目的。

局部变量和静态变量的总结：

参数表分配完毕之后，再根据方法体内定义的变量的顺序和作用域分配。我们知道类变量表有两次初始化的机会，第一次是在“准备阶段”，执行系统初始化，对类变量设置零值，另一次则是在“初始化”阶段，赋予程序员在代码中定义的初始值。变量的分类:按照数据类型分:1.基本数据类型 2.引用数据类型按照在类中声明的位置分: ④成员变量:在使用前，都经历过默认初始化赋值类变量: linking的prepare阶段: 给类变量默认赋值---> initial阶段:给类变量显式赋值即静态代码块赋值实例变量:随着对象的创建，会在堆空间中分配实例变量空间，并进行默认赋值局部变量:在使用前，必须要进行显式赋值的!否则，编译不通过(如下图：)

3.和类变量初始化不同的是，局部变量表不存在系统初始化的过程，这意味着一旦定义了局部变量则必须人为的初始化，否则无法使用。

补充说明

在栈帧中，与性能调优关系最为密切的部分就是前面提到的局部变量表（栈帧中最大的区域）。在方法执行时，虚拟机使用局部变量表完成方法的传递。局部变量表中的变量也是重要的垃圾回收根节点，只要被局部变量表中直接或间接引用的对象都不会被回收。

2.操作数栈（Operand Stack）（或表达式栈）

每一个独立的栈帧中除了包含局部变量表以外，还包含一个后进先出(Last-In-First-out）的操作数栈，也可以称之为表达式栈操作数栈，在方法执行过程中，根据字节码指令，往栈中写入数据或提取数据，即入栈(push)/出栈(pop)。某些字节码指令将值压入操作数栈，其余的字节码指令将操作数取出栈。使用它们后再把结果压入栈。比如:执行复制、交换、求和等操作

● 操作数栈，主要用于保存计算过程的中间结果，同时作为计算过程中变量临时的存储空间。

● 操作数栈就是JVM执行引擎的一一个工作区，当一个方法刚开始执行的时候，一个新的栈帧也会随之被创建出来，这个方法的操作数栈是空的。

● 每一个操作数栈都会拥有一个明确的栈深度用于存储数值（操作数栈是通过数组实现的），其所需的最大深度在编译期就定义好了，保存在方法的Code属性中，为max_stack的值。

● 栈中的任何一个元素都是可以任意的Java数据类型。.

➢32bit的类型占用一个栈单位深度

➢64bit的类型占用两个栈单位深度

● 操作数栈并非采用访问索引的方式来进行数据访问的，而是只能通过标准的入栈(push)和出栈(pop)操作来完成一- 次数据访问。

操作数栈详细介绍链接

3.动态链接（Dynamic Linking）（或指向运行时常量池的方法引用）

每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接( Dynamic Linking）。比如: invokedynamic指令在Java源文件被编译到字节码文件中时，所有的变量和方法引用都作为符号引用（ symbolic Reference）保存在class文件的常量池里。比如:描述一个方法调用了另外的其他方法时，就是通过常量池中指向方法的符号引用来表示的，那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。

动态链接详细介绍链接

4.方法返回地址（Return Address）

存放调用该方法的pc寄存器的值。

一个方法的结束，有两种方式: 正常执行完成出现未处理的异常，非正常退出

无论通过哪种方式退出，在方法退出后都返回到该方法被调用的位置。方法正常退出时，调用者的pc计数器的值作为返回地址。异常退出的，返回地址是要通过异常表来确定，栈帧中一般不会保存这部分信息。

当一个方法开始执行后，只有两种方式可以退出这个方法:

方法正常退出时

1、执行引擎遇到任意一个方法返回的字节码指令（return)，会有返回值传递给上层的方法调用者，简称正常完成出口;

一个方法在正常调用完成之后究竟需要使用哪一个返回指令还需要根据方法返回值的实际数据类型而定。

在字节码指令中，返回指令包含ireturn（当返回值是boolean、byte、char. short和int类型时使用〉、lreturn、freturn、dreturn以及areturn，另外还有一个return指令供声明为void的方法、实例初始化方法、类和接口的初始化方法使用。

（数据类型变化局部变量表一样）

方法异常退出时

2、在方法执行的过程中遇到了异常（Exception），并且这个异常没有在方法内进行处理，也就是只要在本方法的异常表中没有搜索到匹配的异常处理器，就会导致方法退出。简称异常完成出口。

方法执行过程中抛出异常时的异常处理，存储在一个异常处理表，方便在发生异常的时候找到处理异常的代码。

异常处理表 javap -v XX.class 可以理解为try（from to） catch（目标target）

总结：

本质上，方法的退出就是当前栈帧出栈的过程。此时，需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC 寄存器值等，让调用者方法继续执行下去。

正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。

5.一些附加信息

栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如：对程序调试提供支持的信息。这个可以没有

本地方法栈

Java虚拟机栈用于管理Java方法的调用，而本地方法栈用于管理本地方法的调用。

本地方法栈，也是线程私有的。

允许被实现成固定或者是可动态扩展的内存大小。（在内存溢出方面是相同的）

如果线程请求分配的栈容量超过本地方法栈允许的最大容量，Java虚拟机将会抛出一个stackoverflowError异常。

如果本地方法栈可以动态扩展，并且在尝试扩展的时候无法申请到足够的内存，或者在创建新的线程时没有足够的内存去创建对应的本地方法栈，那么Java虚拟机将会抛出一个outofMemoryError异常。l

本地方法是使用c语言实现的。

它的具体做法是Native Method stack中登记native方法，在Execution Engine执行时加载本地方法库。

当某个线程调用一个本地方法时，它就进入了一个全新的并且不再受虚拟机限制的世界。它和虚拟机拥有同样的权限。

➢本地方法可以通过本地方法接口来访问虛拟机内部的运行时数据区。

➢它甚至可以直接使用本地处理器中的寄存器

➢直接从本地内存的堆中分配任意数量的内存。

并不是所有的JVM都支持本地方法。因为Java虚拟机规范并没有明确要求本地方法栈的使用语言、具体实现方式、数据结构等。如果JVM产品不打算支持native方法，也可以无需实现本地方法栈。

在Hotspot JVM中，直接将本地方法栈和虚拟机栈合二为一。

最新回复(0)