java是在java虚拟机上运行,一般地大家讲到的Java内存其实就是Jvm内存
内存模型
Java内存模型,往往是指Java程序在运行时内存的模型,而Java代码是运行在Java虚拟机之上的,由Java虚拟机通过解释执行(解释器)或编译执行(即时编译器)来完成,故Java内存模型, 也就是指Java虚拟机的运行时内存模型。
作为Java开发人员来说,并不需要像C/C++开发人员,需要时刻注意内存的释放,而是全权交给虚拟机去管理,那么有就必要了解虚拟机的运行时内存是如何构成的。运行时内存模型, 分为线程私有和共享数据区两大类,其中线程私有的数据区包含程序计数器、虚拟机栈、本地方法区,所有线程共享的数据区包含Java堆、方法区,在方法区内有一个常量池。
1.线程私有区:
- 程序计数器,记录正在执行的虚拟机字节码的地址;
- 虚拟机栈:方法执行的内存区,每个方法执行时会在虚拟机栈中创建栈帧;
- 本地方法栈:虚拟机的Native方法执行的内存区;
2.线程共享区:
- Java堆:对象分配内存的区域;
- 方法区:存放类信息、常量、静态变量、编译器编译后的代码等数据;
- 常量池:存放编译器生成的各种字面量和符号引用,是方法区的一部分。
对于大多数的程序员来说,Java内存比较流行的说法便是堆和栈,这其实是非常粗略的一种划分,这种划分的”堆”对应内存模型的Java堆,”栈”是指虚拟机栈,然而Java内存模型远比这更复杂, 想深入了解Java的内存,还是有必要明白整个内存模型。
详细模型
运行时内存分为五大块区域(常量池属于方法区,算作一块区域),前面简要介绍了每个区域的功能,那接下来再详细说明每个区域的内容,Java内存总体结构图如下:
程序计数器PC
程序计数器PC,当前线程所执行的字节码行号指示器。每个线程都有自己计数器,是私有内存空间,该区域是整个内存中较小的一块。
当线程正在执行一个Java方法时,PC计数器记录的是正在执行的虚拟机字节码的地址;当线程正在执行的一个Native方法时,PC计数器则为空(Undefined)。
虚拟机栈
虚拟机栈,生命周期与线程相同,是Java方法执行的内存模型。每个方法(不包含native方法)执行的同时都会创建一个栈帧结构,方法执行过程,对应着虚拟机栈的入栈到出栈的过程。
栈帧(Stack Frame)结构
栈帧是用于支持虚拟机进行方法执行的数据结构,是属性运行时数据区的虚拟机站的栈元素。见上图, 栈帧包括:
1).局部变量表 (locals大小,编译期确定),一组变量存储空间, 容量以slot为最小单位。
2).操作栈(stack大小,编译期确定),操作栈元素的数据类型必须与字节码指令序列严格匹配
3).动态连接, 指向运行时常量池中该栈帧所属方法的引用,为了 动态连接使用。
- 前面的解析过程其实是静态解析;
- 对于运行期转化为直接引用,称为动态解析。
4).方法返回地址
- 正常退出,执行引擎遇到方法返回的字节码,将返回值传递给调用者
- 异常退出,遇到Exception,并且方法未捕捉异常,那么不会有任何返回值。
5).额外附加信息,虚拟机规范没有明确规定,由具体虚拟机实现。
因此,一个栈帧的大小不会受到
异常(Exception)
Java虚拟机规范规定该区域有两种异常:
- StackOverFlowError:当线程请求栈深度超出虚拟机栈所允许的深度时抛出
- OutOfMemoryError:当Java虚拟机动态扩展到无法申请足够内存时抛出
本地方法栈
本地方法栈则为虚拟机使用到的Native方法提供内存空间,而前面讲的虚拟机栈式为Java方法提供内存空间。有些虚拟机的实现直接把本地方法栈和虚拟机栈合二为一,比如非常典型的Sun HotSpot虚拟机。
异常(Exception):Java虚拟机规范规定该区域可抛出StackOverFlowError和OutOfMemoryError。
Java堆
Java堆,是Java虚拟机管理的最大的一块内存,也是GC的主战场,里面存放的是几乎所有的对象实例和数组数据。JIT编译器有栈上分配、标量替换等优化技术的实现导致部分对象实例数据不存在Java堆,而是栈内存。
- 从内存回收角度,Java堆被分为新生代和老年代;这样划分的好处是为了更快的回收内存;
- 从内存分配角度,Java堆可以划分出线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB);这样划分的好处是为了更快的分配内存;
对象创建的过程是在堆上分配着实例对象,那么对象实例的具体结构如下:
对于填充数据不是一定存在的,仅仅是为了字节对齐。HotSpot VM的自动内存管理要求对象起始地址必须是8字节的整数倍。对象头本身是8的倍数,当对象的实例数据不是8的倍数,便需要填充数据来保证8字节的对齐。该功能类似于高速缓存行的对齐。
另外,关于在堆上内存分配是并发进行的,虚拟机采用CAS加失败重试保证原子操作,或者是采用每个线程预先分配TLAB内存.
异常(Exception):Java虚拟机规范规定该区域可抛出OutOfMemoryError。
方法区
方法区主要存放的是已被虚拟机加载的类信息、常量、静态变量、编译器编译后的代码等数据。GC在该区域出现的比较少。
异常(Exception):Java虚拟机规范规定该区域可抛出OutOfMemoryError。
运行时常量池
运行时常量池也是方法区的一部分,用于存放编译器生成的各种字面量和符号引用。运行时常量池除了编译期产生的Class文件的常量池,还可以在运行期间,将新的常量加入常量池,比较常见的是String类的intern()方法。
- 字面量:与Java语言层面的常量概念相近,包含文本字符串、声明为final的常量值等。
-
符号引用:编译语言层面的概念,包括以下3类:
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
但是该区域不会抛出OutOfMemoryError异常。
三个特性
Java 内存模型是围绕着在并发过程中如何处理原子性、可见性、有序性来建立的。
原子性
原子性指一个操作不能被打断,要么全部执行完要么不执行。基本数据类型的访问读写基本上是原子操作,比较特殊的是 long 和 double 两种类型。long 和 double 类型是64位的, 在32位的 JVM 中,可以把没有 volatile 修饰的64位数据的读写操作分为两次32位的操作来进行,这样 long 和 double 类型的操作就不具备原子性。不过实际上,我们都基本不需要考虑这种情况, 一般也不需要把 long 和 double 变量声明为 volatile,因为目前各平台的商用虚拟机几乎都选择把64位数据的读写操作作为原子操作。
可见性
可见性指一个线程修改了共享变量的值后,其他线程可以立即感知到这个修改。可以实现可见性的关键字有 volatile、synchronized、final。
volatile 的特殊规则保证了 volatile 变量值修改后立即同步到共享内存,每次使用 volatile 变量前立即从共享内存中刷新。同步块的可见性是由“对一个变量执行 unlock 操作之前必须把此变量值同步到共享内存中, 执行 lock 操作之前必须从共享内存中刷新变量值到工作内存”这条规则来保证的。final 关键字的可见性是指:被 final 修饰的字段在构造器一旦初始化完成,并且构造器没有把“this”的引用传递出去 ( this 引用逃逸是一件很危险的事情,其他线程有可能通过这个引用访问到“初始化一半”的对象),其他线程就可以访问 final 字段的值。
有序性
Java 程序的有序性可以理解为:在单线程中,因为程序次序规则,所以逻辑上代码的执行是有序的;但是多线程并发时,代码的执行可能出现乱序,因为“指令重排”现象和“工作内存与共享内存同步延迟”现象。
Java 语言提高 volatile 和 synchronized 来保证多线程之间操作的有序性。volatile 关键字在 JDK 1.5 后可以通过内存屏障来禁止指令重排序,而 synchronized 关键字由 “一个变量在同一时刻只允许一个线程对其进行 lock 操作”这条规则来实现。
引用链接
Jvm内存模型 - Gityuan博客
Java内存模型 - JohnnyShieh
要下班了?扫一扫,地铁上阅读 :)