面试题:JVM(六)
1. 概述
垃圾收集,不是Java语言的伴生产物。早在1960年,第一门开始使用内存动态分配和垃圾收集技术的Lisp语言诞生。
- 关于垃圾收集有三个经典问题:
- 哪些内存需要回收?
- 什么时候回收?
- 如何回收?
讲讲JVM的gc (携程)
GC是什么?为什么要有GC? (蚂蚁金服)
垃圾回收的优点和原理。 (蚂蚁金服)
垃圾回收机制等 (支付宝)
GC回收的是哪部分的垃圾?(vivo)
垃圾回收的优点和原理?基本原理是什么?(瓜子)
GC是什么?为什么要有GC? (美团)
简述Java垃圾回收机制 (美团)
垃圾回收的优点和原理。(美团)
什么是垃圾(Garbage)?
垃圾是指在运行程序中没有任何指针指向的对象,这个对象就是需要被回收的垃圾。
为什么需要GC?
- 随着应用程序所应付的业务越来越庞大、复杂,用户越来越多,没有GC就不能保证应用程序的正常进行。
- 对于Java开发人员而言,自动内存管理就像是一个黑匣子,如果过度依赖于“自动”,那么这将会是一场灾难,最严重的就会弱化Java开发人员在程序出现内存溢出时定位问题和解决问题的能力。
- 除了释放没用的对象,垃圾回收也可以清除内存里的记录碎片。碎片整理将所占用的堆内存移到堆的一端,以便 JVM 将整理出的内存分配给新的对象。
垃圾回收的重点区域?
垃圾回收器可以对年轻代回收,也可以对老年代回收,甚至是全堆和方法区的回收。
其中,Java堆是垃圾收集器的工作重点。
从次数上讲:
- 频繁收集Young区
- 较少收集Old区
- 基本不动Perm区(或元空间)
2. 垃圾回收算法
GC算法都有哪些?他们之间的区别是什么?(菜鸟)
JVM的常用的GC算法(高得地图)
GC垃圾回收机制算法(数信互融科技发展有限公司)
GC的算法,复制算法和标记清除的优缺点?(迪原创新)
常用的GC算法,如何确定哪些是要被清除的哪些是不能被清除(网易邮箱、美团)
垃圾回收机制的几种回收算法(亚信)
GC算法都有哪些?他们之间的区别是什么?各自的适用场景?(B站)
GC 的三种收集方法:标记清除、标记整理、复制算法的原理与特点,分别用在什么地方,如果让你优化收集方法,有什么思路?(腾讯)
如和判断一个对象是否存活?(唯品会)
Java 中垃圾收集的方法有哪些?(苏宁)
你是用什么方法判断对象是否死亡?(滴滴)
如何判断一个对象是否存活? (蚂蚁金服)
垃圾收集策略和算法 (百度)
常见的垃圾回收器算法有哪些,各有什么优劣?(网易)
JVM有哪些回收算法,对应的收集器有哪些? (蚂蚁金服)
JVM GC算法有哪些,目前的JDK版本采用什么回收算法 (蚂蚁金服)
垃圾回收算法的实现原理。 (京东)
讲一下JVM中如何判断对象的生死? (京东)
如何选择合适的垃圾收集算法? (阿里)
讲一讲垃圾回收算法。 (阿里)
JVM有哪些回收算法,对应的收集器有哪些? (拼多多)
讲讲你知道的垃圾回收算法 (字节跳动)
Java对象的回收方式,回收算法。 (字节跳动)
JVM垃圾收集算法与收集器有哪些? (京东)
常见的垃圾回收器算法有哪些,各有什么优劣?(阿里-天猫、UC)
有哪些垃圾回收方法,jdk8的垃圾收集器是什么?(搜狐、万达集团)
如何判断一个对象是否存活?(或者GC对象的判定方法) (美团)
常见的垃圾回收器算法有哪些,各有什么优劣? (字节跳动)
2.1 垃圾判断阶段算法
在堆里存放着几乎所有的java对象实例,在GC 执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记为己经死亡的对象, GC 才会在执行垃圾回收时,释放掉其所占用的内存空间, 因此这个过程我们可以称为垃圾标记阶段。
2.1.1 引用计数算法
引用计数算法(Reference Counting):对每个对象保存一个整形的引用计数器,用于记录对象引用情况
原理
当有任何对象引用A对象时,A对象计数器+1,当引用失效时计数器-1,当计数器为0时即没有对象引用此时可以回收
优点
实现简单,垃圾对象便于辨识;判定效率高,回收没有延迟性。
缺点
缺点1:它需要单独的字段存储计数器,这样的做法增加了存储空间的开销。
缺点2:每次赋值都需要更新计数器,伴随着加法和减法操作,这增加了时间开销。
缺点3:引用计数器有一个严重的问题,即无法处理循环引用的情况。这是一条致命缺陷,导致在Java 的垃圾回收器中没有使用这类算法。 (内存泄漏)当P取消对对象的引用时,此时虽然三个对象不再被使用,但是三个对象的计数器仍为1,不为0不会被回收造成内存泄漏
解决方案
- 引用计数算法,是很多语言的资源回收选择,例如因人工智能而更加火热的Python,它更是同时支持引用计数和垃圾收集机制。
- 具体哪种最优是要看场景的,业界有大规模实践中仅保留引用计数机制,以提高吞吐量的尝试。
- Java并没有选择引用计数,是因为其存在一个基本的难题,也就是很难处理循环引用关系。
- Python如何解决循环引用?
- 手动解除:很好理解,就是在合适的时机,解除引用关系。
- 使用弱引用weakref, weakref是Python提供的标准库,旨在解决循环引用。
2.1.2 可达性分析算法
可达性分析 (或根搜索算法、追踪性垃圾收集)
相对于引用计数算法而言,可达性分析算法不仅同样具备实现简单和执行高效等特点,更重要的是该算法可以有效地解决在引用计数算法中循环引用的问题,防止内存泄漏的发生。
相较于引用计数算法,这里的可达性分析就是Java、C#选择的。这种类型的垃圾收集通常也叫作追踪性垃圾收集(Tracing Garbage Collection)。
原理
原理简单来说,就是将对象及其引用关系看作一个图,选定活动的对象作为 GC Roots,然后跟踪引用链条,如果一个对象和GC Roots之间不可达,也就是不存在引用链条,那么即可认为是可回收对象。 (从根结点出发可以到达的结点(对象)就是正在被引用的对象,反之就是垃圾)
优点
实现简单,执行高效 ,有效的解决循环引用的问题,防止内存泄漏。
Java GC机制?GC Roots有哪些? (拼多多)
JVM怎样判断一个对象是否可回收,怎样的对象才能作为GC root (腾讯)
Java GC机制?GC Roots有哪些? (字节跳动)
哪些部分可以作为GC Root? (字节跳动)
Java GC机制?GC Roots有哪些? (抖音)
Java GC机制?GC Roots有哪些? (京东)
GC root如何确定,哪些对象可以作为GC Root? (美团)
- 虚拟机栈中引用的对象
比如:各个线程被调用的方法中使用到的参数、局部变量等。
- 本地方法栈内JNI(通常说的本地方法)引用的对象
- 类静态属性引用的对象
比如:Java类的引用类型静态变量
- 方法区中常量引用的对象
比如:字符串常量池(String Table)里的引用
- 所有被同步锁synchronized持有的对象
- Java虚拟机内部的引用。
基本数据类型对应的Class对象,一些常驻的异常对象(如:NullPointerException、OutOfMemoryError),系统类加载器。
- 反映java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。
2.2 垃圾清除阶段算法
当成功区分出内存中存活对象和死亡对象后, GC 接下来的任务就是执行垃圾回收,释放掉无用对象所占用的内存空间,以便有足够的可用内存空间为新对象分配内存。目前在JVM中比较常见的三种垃圾收集算法是标记-清除算法( Mark-Sweep )、复制算法( Copying )、标记 - 压缩算法( Mark-Compact ) 。
2.2.1 标记-清除算法
当堆中的有效内存空间(available memory)被耗尽的时候,就会停止整个程序(也被称为stop the world),然后进行两项工作,第一项则是标记,第二项则是清除。
- 标记:Collector从引用根节点开始遍历,标记所有被引用的对象。一般是在对象的Header中记录为可达对象。
- 清除:Collector对堆内存从头到尾进行线性的遍历,如果发现某个对象在其Header中没有标记为可达对象,则将其回收。
缺点
- 效率比较低:递归与全堆对象遍历两次
- 在进行GC的时候,需要停止整个应用程序,导致用户体验差
- 这种方式清理出来的空闲内存是不连续的,产生内存碎片。
注意
此时的清除并不是真的将该垃圾对象的空间置空,而是将他放入空闲对象列表,待新存储对象存入时会对该位置进行判断,如果空间足够大则直接存储新对象
2.2.2 复制算法
将活着的内存空间分为两块,每次只使用其中一块,在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中,之后清除正在使用的内存块中的所有对象,交换两个内存的角色,最后完成垃圾回收。 (Eden新生代里面就使用该算法,S0(from区)和S1(to区)来回复制交换)
优点
- 没有标记和清除过程,实现简单,运行高效
- 复制过去以后保证空间的连续性,不会出现“碎片”问题。
缺点
- 此算法的缺点也是很明显的,就是需要两倍的内存空间。(空间换时间)
- 对于G1这种分拆成为大量region的GC,复制而不是移动,意味着GC需要维护region之间对象引用关系,不管是内存占用或者时间开销也不小。
注意
该算法适用于对象频繁消亡的场景(如堆区里面的新生代),若对象大量存活,此时不断的复制对象到另一区域反而算法效果不理想
2.2.3 标记-压缩算法
第一阶段和标记-清除算法一样,从根节点开始标记所有被引用对象
第二阶段将所有的存活对象压缩到内存的一端,按顺序排放。
之后, 清理边界外所有的空间。简单来说就是增强版的标记-清除算法,标记-清除算法清理完垃圾后并不会移动存活对象,而标记-压缩算法清除完垃圾后将存活对象移动到一块(减少内存碎片)
该算法适用于老年代,因为老年代清理效果并不理想,此时只需要移动少量对象就可以完成内存连续存储的操作(减少内存碎片)
指针碰撞
如果内存空间以规整和有序的方式分布,即已用和未用的内存都各自一边,彼此之间维系着一个记录下一次分配起始点的标记指针,当为新对象分配内存时,只需要通过修改指针的偏移量将新对象分配在第一个空闲内存位置上,这种分配方式就叫做指针碰撞(Bump the Pointer)。
优点
此算法消除了“标记-清除”和“复制”两个算法的弊端。)
- 消除了标记/清除算法当中,内存区域分散的缺点,我们需要给新对象分配内存时,JVM只需要持有一个内存的起始地址即可。
- 消除了复制算法当中,内存减半的高额代价。
缺点
- 从效率上来说,标记-压缩算法要低于复制算法。
- 效率不高,不仅要标记所有存活对象,还要整理所有存活对象的引用地址。
- 对于老年代每次都有大量对象存活的区域来说,极为负重。
- 移动对象的同时,如果对象被其他对象引用,则还需要调整引用的地址。
- 移动过程中,需要全程暂停用户应用程序。即:STW
三种算法对比
效率上来说,复制算法是当之无愧的老大,但是却浪费了太多内存。
而为了尽量兼顾上面提到的三个指标,标记-整理算法相对来说更平滑一些,但是效率上不尽如人意,它比复制算法多了一个标记的阶段,比标记-清除多了一个整理内存的阶段。
2.2.4 分代收集算法
分代收集算法,是基于这样一个事实:不同的对象的生命周期是不一样的。因此,不同生命周期的对象可以采取不同的收集方式,以便提高回收效率。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点使用不同的回收算法,以提高垃圾回收的效率。(基于不同区域存储特点使用不同的算法)
分析
JVM的垃圾回收为什么采用分代GC。跟语言有关系吗?(阿里-钉钉)
分代的意义说一下 (阿里-钉钉)
GC分代算法(花旗银行)
说一下gc算法,分代回收说下 (百度)
Java怎么进行垃圾回收的?什么对象会进老年代? 垃圾回收算法有哪些?为什么新生代使用复制算法? (京东)
分代垃圾回收过程? (美团)
GC如何分代的?各代用什么算法回收? (美团)
目前几乎所有的GC都是采用分代收集(Generational Collecting)算法执行垃圾回收的。
在HotSpot中,基于分代的概念,GC所使用的内存回收算法必须结合年轻代和老年代各自的特点。
- 年轻代(Young Gen)
年轻代特点:区域相对老年代较小,对象生命周期短、存活率低,回收频繁。
这种情况复制算法的回收整理,速度是最快的。复制算法的效率只和当前存活对象大小有关,因此很适用于年轻代的回收。而复制算法内存利用率不高的问题,通过hotspot中的两个survivor的设计得到缓解。
- 老年代(Tenured Gen)
老年代特点:区域较大,对象生命周期长、存活率高,回收不及年轻代频繁。
这种情况存在大量存活率高的对象,复制算法明显变得不合适。一般是由标记-清除或者是标记-清除与标记-整理的混合实现。
2.2.5 增量收集算法
如果一次性将所有的垃圾进行处理,需要造成系统长时间的停顿(STW),那么就可以让垃圾收集线程和应用程序线程交替执行。每次,垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。依次反复,直到垃圾收集完成。
总的来说,增量收集算法的基础仍是传统的标记-清除和复制算法。增量收集算法通过对线程间冲突的妥善处理,允许垃圾收集线程以分阶段的方式完成标记、清理或复制工作。
缺点
使用这种方式,由于在垃圾回收过程中,间断性地还执行了应用程序代码,所以能减少系统的停顿时间。但是,因为线程切换和上下文转换的消耗,会使得垃圾回收的总体成本上升,造成系统吞吐量的下降。
2.2.6 分区算法
分代算法将按照对象的生命周期长短划分成两个部分,分区算法将整个堆空间划分成连续的不同小区间。
每一个小区间都独立使用,独立回收。这种算法的好处是可以控制一次回收多少个小区间。
3. 概念简介
3.1 System.gc()
System.gc()和Runtime.getRunTime().gc()会做什么事情? (字节跳动)
- 在默认情况下,通过System.gc()或者Runtime.getRuntime().gc()的调用,会显式触发Full GC,同时对老年代和新生代进行回收,尝试释放被丢弃对象占用的内存。
- 然而System.gc()调用附带一个免责声明,无法保证对垃圾收集器的调用。
- JVM实现者可以通过System.gc()调用来决定JVM的GC行为。而一般情况下,垃圾回收应该是自动进行的,无须手动触发,否则就太过于麻烦了。在一些特殊情况下,如我们正在编写一个性能基准,我们可以在运行之间调用System.gc()。
3.2 内存溢出和内存泄漏
什么是内存泄漏和什么是内存溢出 (陌陌)
Java存在内存泄漏吗,内存泄漏的场景有哪些,如何避免(百度)
Java 中会存在内存泄漏吗,简述一下?(猎聘)
内存泄漏是怎么造成的?(拼多多、字节跳动)
内存泄漏与内存溢出的区别 (字节跳动)
Java存在内存溢出的现象吗 (字节跳动)
Java中会存在内存泄漏吗,请简单描述。 (美团)
3.2.1 内存溢出
- 由于GC一直在发展,所有一般情况下,除非应用程序占用的内存增长速度非常快,造成垃圾回收已经跟不上内存消耗的速度,否则不太容易出现OOM的情况。
- 大多数情况下,GC会进行各种年龄段的垃圾回收,实在不行了就放大招,来一次独占式的Full GC操作,这时候会回收大量的内存,供应用程序继续使用。
- javadoc中对OutOfMemoryError的解释是,没有空闲内存,并且垃圾收集器也无法提供更多内存。
3.2.2 内存泄漏
- 也称作“存储渗漏”。严格来说,只有对象不会再被程序用到了,但是GC又不能回收他们的情况,才叫内存泄漏。
- 但实际情况很多时候一些不太好的实践(或疏忽)会导致对象的生命周期变得很长甚至导致OOM,也可以叫做宽泛意义上的“内存泄漏”。
内存泄漏的8种情况
3.3 SWT
什么是Full GC?GC? major GC? stop the world (腾讯)
Stop-the-World ,简称STW,指的是GC事件发生过程中,会产生应用程序的停顿。停顿产生时整个应用程序线程都会被暂停,没有任何响应,有点像卡死的感觉,这个停顿称为STW。
- 可达性分析算法中枚举根节点(GC Roots)会导致所有Java执行线程停顿。
- 分析工作必须在一个能确保一致性的快照中进行
- 一致性指整个分析期间整个执行系统看起来像被冻结在某个时间点上
- 如果出现分析过程中对象引用关系还在不断变化,则分析结果的准确性无法保证
3.4 安全点和安全区域
SafePoint 是什么(360安全)
安全点(Safepoint)
程序执行时并非在所有地方都能停顿下来开始 GC,只有在特定的位置才能停顿下来开始GC,这些位置称为“安全点(Safepoint)”。
Safe Point的选择很重要,如果太少可能导致GC等待的时间太长,如果太频繁可能导致运行时的性能问题。大部分指令的执行时间都非常短暂,通常会根据“是否具有让程序长时间执行的特征”为标准。比如:选择一些执行时间较长的指令作为Safe Point,如方法调用、循环跳转和异常跳转等。
安全区域(Safe Region)
安全区域是指在一段代码片段中,对象的引用关系不会发生变化,在这个区域中的任何位置开始GC都是安全的。我们也可以把 Safe Region 看做是被扩展了的 Safepoint。
3.5 四种引用
强引用、软引用、弱引用、虚引用的区别?(字节跳动)
你开发中使用过WeakHashMap吗?(京东)
3.5.1 强引用
强引用(StrongReference):最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj=new Object()”这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。
3.5.2 软引用
软引用(SoftReference):在系统将要发生内存溢出之前,将会把这些对象列入回收范围之中进行第二次回收。如果这次回收后还没有足够的内存,才会抛出内存溢出异常。
3.5.3 弱引用
弱引用(WeakReference):被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时,无论内存空间是否足够,都会回收掉被弱引用关联的对象。
3.5.4 虚引用
虚引用(PhantomReference):一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来获得一个对象的实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
4. 垃圾回收器
4.1 GC指标评估
- 吞吐量:程序的运行时间(程序的运行时间+内存回收的时间)。
- 垃圾收集开销:吞吐量的补数,垃圾收集器所占时间与总时间的比例。
- 暂停时间:执行垃圾收集时,程序的工作线程被暂停的时间。
- 收集频率:相对于应用程序的执行,收集操作发生的频率。
- 内存占用: Java 堆区所占的内存大小。
- 快速: 一个对象从诞生到被回收所经历的时间。
请问吞吐量的优化和响应优先的垃圾收集器是如何选择的呢?(滴滴)
吞吐量优先选择什么垃圾回收器?响应时间优先呢? (阿里)
”高吞吐量”和”低暂停时间”是一对相互竞争的目标(矛盾)。
- 因为如果选择以吞吐量优先,那么必然需要降低内存回收的执行频率,但是这样会导致GC需要更长的暂停时间来执行内存回收。
- 相反的,如果选择以低延迟优先为原则,那么为了降低每次执行内存回收时的暂停时间,也只能频繁地执行内存回收,但这又引起了年轻代内存的缩减和导致程序吞吐量的下降。
4.2 经典垃圾回收器
GC 收集器有哪些?(滴滴)
几种垃圾回收器(亚信)
垃圾回收器有哪些?都有哪些算法来实现?项目中用的垃圾回收器是什么?(平安)
垃圾回收器的基本原理是什么?垃圾回收器可以马上回收内存吗?有什么办法主动通知虚拟机进行垃圾回收?(平安)
你知道那些垃圾回收器(高德地图)
有哪些垃圾方法,垃圾收集器是什么。(新浪)
JVM有哪三种垃圾回收器? (阿里)
- 串行回收器:Serial、Serial Old
- 并行回收器:ParNew、Parallel Scavenge、Parallel Old
- 并发回收器:CMS、G1
4.2.1 Serial GC:串行回收
这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明它只会使用一个 CPU 或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束(Stop The World)。
这种垃圾收集器了解即可,现在已经不用串行的了。而且在限定单核cpu才可以用。现在都不是单核的了。
对于交互较强的应用而言,这种垃圾收集器是不能接受的。一般在Java web应用程序中是不会采用串行垃圾收集器的。
4.2.2 ParNew GC:并行回收
- 如果说Serial GC是年轻代中的单线程垃圾收集器,那么ParNew收集器则是Serial收集器的多线程版本。
Par是Parallel的缩写,New:只能处理的是新生代
- ParNew 收集器除了采用并行回收的方式执行内存回收外,两款垃圾收集器之间几乎没有任何区别。ParNew收集器在年轻代中同样也是采用复制算法、"Stop-the-World"机制。
- 对于新生代,回收次数频繁,使用并行方式高效。
- 对于老年代,回收次数少,使用串行方式节省资源。(CPU并行需要切换线程,串行可以省去切换线程的资源)
4.2.3 Parallel GC:吞吐量优先
- HotSpot的年轻代中除了拥有ParNew收集器是基于并行回收的以外,Parallel Scavenge收集器同样也采用了复制算法、并行回收和”Stop the World”机制。
- 不同点
- 和ParNew收集器不同,Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量(Throughput),它也被称为吞吐量优先的垃圾收集器。
- 自适应调节策略也是Parallel Scavenge与ParNew一个重要区别。
- Parallel Old收集器采用了标记-压缩算法,但同样也是基于并行回收和”Stop-the-World”机制。
- 在程序吞吐量优先的应用场景中, Parallel 收集器和Parallel Old收集器的组合,在Server模式下的内存回收性能很不错。
- 在Java8中,默认是此垃圾收集器。
4.2.4 CMS:低延迟
CMS特点,垃圾回收算法有哪些?各自的优缺点,他们共同的缺点是什么? (天猫)
讲一下CMS垃圾收集器垃圾回收的流程,以及CMS的缺点 (抖音)
说几个垃圾回收器,cms回收器有哪几个过程,停顿几次,会不会产生内存碎片。老年代产生内存碎片会有什么问题。 (小米)
g1和cms区别,吞吐量优先和响应优先的垃圾收集器选择 (携程)
- CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。
- CMS的垃圾收集算法采用标记-清除算法,并且也会”Stop-the-world”
初始标记(STW):暂时时间非常短,标记与GC Roots直接关联的对象。
并发标记(最耗时):从GC Roots开始遍历整个对象图的过程。不会停顿用户线程
重新标记:(STW):修复并发标记环节,因为用户线程的执行,导致数据的不一致性问题
并发清理(最耗时)
既然Mark Sweep会造成内存碎片,那么为什么不把算法换成Mark Compact呢?
因为当并发清除的时候,用Compact整理内存的话,原来的用户线程使用的内存还怎么用呢?要保证用户线程能继续执行,前提的它运行的资源不受影响嘛。Mark-Compact更适合“Stop the World”这种场景下使用
优缺点
CMS的优点:
- 并发收集
- 低延迟
CMS的弊端:
- 会产生内存碎片,导致并发清除后,用户线程可用的空间不足。在无法分配大对象的情况下,不得不提前触发Full GC。
- CMS收集器对CPU资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。
- CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure”失败而导致另一次 Full GC 的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的,那么在并发标记阶段如果产生新的垃圾对象,CMS将无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象没有被及时回收,从而只能在下一次执行GC时释放这些之前未被回收的内存空间。
垃圾收集器选择指南
如果你想要最小化地使用内存和并行开销,请选Serial GC;
如果你想要最大化应用程序的吞吐量,请选Parallel GC;
如果你想要最小化GC的中断或停顿时间,请选CMS GC。
4.2.5 G1 GC:区域化分代式
G1原理。(亚信)
CMS和G1了解么,CMS解决什么问题,说一下回收的过程。(字节跳动)
CMS回收停顿了几次,为什么要停顿两次。(字节跳动)
CMS过程是怎样的?内部使用什么算法做垃圾回收? (美团)
CMS 收集器与 G1 收集器的特点。(滴滴)
CMS 收集器与 G1 收集器的特点。 (蚂蚁金服)
G1回收器讲下回收过程 (蚂蚁金服)
你知道哪几种垃圾收集器,各自的优缺点,重点讲下cms和G1,包括原理,流程,优缺点。(拼多多)
你知道哪几种垃圾回收器,各自的优缺点,重点讲一下cms和g1,包括原理,流程,优缺点 (蚂蚁金服)
Java的垃圾回收器都有哪些,说下g1的应用场景,平时你是如何搭配使用垃圾回收器的 (滴滴)
- G1(Garbage-First)是一款面向服务端应用的垃圾收集器,兼顾吞吐量和停顿时间的GC实现。
- 在JDK1.7版本正式启用,是JDK 9以后的默认GC选项,取代了CMS 回收
特点
并行与并发
- 并行性:G1在回收期间,可以有多个GC线程同时工作,有效利用多核计算能力。此时用户线程STW
- 并发性:G1拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况
分代收集
- 从分代上看,G1依然属于分代型垃圾回收器,它会区分年轻代和老年代,年轻代依然有Eden区和Survivor区。但从堆的结构上看,它不要求整个Eden区、年轻代或者老年代都是连续的,也不再坚持固定大小和固定数量。
- 将堆空间分为若干个区域(Region),这些区域中包含了逻辑上的年轻代和老年代。
- 和之前的各类回收器不同,它同时兼顾年轻代和老年代。对比其他回收器,或者工作在年轻代,或者工作在老年代;
空间整合
- CMS:“标记-清除”算法、内存碎片、若干次GC后进行一次碎片整理
- G1将内存划分为一个个的region。内存的回收是以region作为基本单位的。Region之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。尤其是当Java堆非常大的时候,G1的优势更加明显。
可预测的停顿时间模型(即:软实时soft real-time)
- 这是 G1 相对于 CMS 的另一大优势,G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。
缺点
相较于CMS,G1还不具备全方位、压倒性优势。比如在用户程序运行过程中,G1无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(Overload)都要比CMS要高。
过程
G1 GC的垃圾回收过程主要包括如下三个环节:
- 年轻代GC (Young GC)
- 老年代并发标记过程 (Concurrent Marking)
- 混合回收(Mixed GC)
- (如果需要,单线程、独占式、高强度的Full GC还是继续存在的。它针对GC的评估失败提供了一种失败保护机制,即强力回收。)