目录
一、怎么判断一个对象是存活还是死亡状态?
对象存活算法之引用计数法
可达性分析算法的概念(又叫根搜索法)
二、垃圾回收的几个常见算法标记-清除算法
标记-复制算法
标记-整理算法
三、Serial收集器是什么
四、ParNew垃圾收集器是什么
五、Parallel Scavenge收集器是什么
六、你不得不懂的CMS收集器
七、G1收集器
八、ZGC收集器
一、怎么判断一个对象是存活还是死亡状态?
对象存活算法之引用计数法
引用计数法存在的特点分析:
引用计数法属于垃圾收集器最早的实现算法了,它是指在创建对象时候关联一个与之相应的计数器,当此对象呗使用时加1,相反销毁时-1,当此计数器为0的时候,则表示对象未使用,可以被垃圾收集器回收。
优缺点:
优点:引用计数收集器可以很快的执行,交织在程序运行中。对程序需要不被长时间打断的实时环境比较有利。
缺点:无法检测出循环引用。如父对象有一个对子对象的引用,子对象反过来引用父对象。这样,他们的引用计数永远不可能为0.
上图即使objA和objB都为null,但因为循环引用的问题,两个对象都不能垃圾收集器所回收。
可达性分析算法的概念(又叫根搜索法)
根搜索算法是从离散数学中的图论引入的,程序把所有的引用关系看作一张图,从一个节点GC ROOT开始,寻找对应的引用节点,找到这个节点以后,继续寻找这个节点的引用节点,当所有的引用节点寻找完毕之后,剩余的节点则被认为是没有被引用到的节点,即无用的节点
java中可作为GC Root的对象有:
虚拟机栈中引用的对象(本地变量表)
本地方法栈中引用的对象
方法区中静态属性引用的对象
方法区中常量引用的对象
二、垃圾回收的几个常见算法
标记-清除算法
最早的收集算法是“标记-清除”(Mark-Sweep)算法,如同它的名字一样,算法分为“标记”和“清除”两个阶段:
首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,它的标记过程其实在前- -节讲述对象标记判定时已经介绍过了。
它的主要不足有两个:
一个是效率问题,标记和清除两个过程的效率都不高;
另一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作
标记-复制算法
为了解决内存碎片的问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按量划分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效
那么,复制算法到底是按照什么来复制的,又开辟了多大空间来复制呢?
目前大多数虚拟机都采用复制算法来回收新生代,新生代中的对象98%是“朝生夕死”的,所以并不需要按照 1:1 的比例来划分内存空间,而是将内存分为一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 和其中一块 Survivor。 Survivor from 和Survivor to ,内存比例 8:1:1
当回收时,将 Eden 和 Survivor 中还存活着的对象一次性地复制到另外一块 Survivor 空间上,最后清理掉 Eden 和刚才用过的 Survivor 空间。HotSpot 虚拟机默认 Eden 和 Survivor 的大小比例是 8:1
也就是每次新生代中可用内存空间为整个新生代容量的 90% (80%+10%),只有 10% 的内存会被“浪费”。当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于 10%的对象存活,当 Survivor 空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)
复制算法的缺点:
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费 50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都 100%存活的极端情况,所以在老年代一般不能直接选用这种算法
标记-整理算法
根据老年代的特点,有人提出了另外一种“标记-整理(Mark- Compact)算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存
分代收集:
一般把 Java 堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法
在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记一整理”算法来进行回收
三、Serial收集器是什么
Serial是一个单线程运行的垃圾收集器,属于最早期的垃圾收集器,也是JDK1.3版本之前唯一的垃圾收集器。
Serial垃圾收集器的特点:
简单和高效,并且本身的运行对内存要求不高,“Stop The World”,它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。在用户不可见的情况下把用户正常工作的线程全部停掉
使用场景:多用于桌面应用,Client端的垃圾回收器
桌面应用内存小,进行垃圾回收的时间比较短,只要不频繁发生停顿就可以接受
四、ParNew垃圾收集器是什么
ParNew 收集器其实就是 Serial 收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包括 Serial 收集器可用的收集算法、Stop The World、对象分配规则、回收策略等都与 Serial 收集器完全一样。
ParNew 垃圾收集器的特点:
ParNew 收集器除了多线程收集之外,其他与 Serial 收集器相比并没有太多创新之处,但它却是许多运行在 Server 模式下的虚拟机中首选的新生代收集器,其中有一个与性能无关但很重要的原因是,除了 Serial 收集器外,目前只有它能与 CMS 收集器配合工作。
使用-XX: ParallelGCThreads 参数来限制垃圾收集的线程数,多线程操作存在上下文切换的问题,所以建议将-XX: ParallelGCThreads设置成和CPU核数相同,如果设置太多的话就会产生上下文切换消耗
并发与并行的概念 CMS垃圾回收器(并发)
并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。
并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能
会交替执行),用户程序在继续运行,而垃圾收集程序运行于另一个 CPU 上
五、Parallel Scavenge收集器是什么
Parallel Scavenge 收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器
由于与吞吐量关系密切,Parallel Scavenge 收集器也经常称为“吞吐量优先”收集器,吞吐量是什么?CPU用于运行用户代码的时间与CPU总时间的比值,99%时间执行用户线程,1%时间回收垃圾 ,这时候吞吐量就是99%
Parallel Scavenge特点:
它的关注点与其他收集器不同,CMS 等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间,而 Parallel Scavenge 收集器的目标则是达到个可控制的吞吐(Throughput)。所谓吞吐量就是 CPU 用于运行用户代码的时间与 CPU 总消耗时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间),虚拟机总共运行了 100 分钟,其中垃圾收集花掉 1 分钟,那吞吐量就是 99% 停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户体验,而高吞吐量则可以高效率地利用 CPU 时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种调节方式称为 GC自适应调节策略
-XX:MaxGCPauseMillis 用来控制垃圾回收的最大停顿时间,500MB ——>300MB,这个参数配置太小的话会发生频繁GC
-XX:GCTimeRatio 设置吞吐量的值参数,99%
Serial old收集器,它是一个单线程收集器,使用"标记--整理"算法
Parallel old收集器Parallel Scavenge收集器的老年代版本,使用多线程+标记整理算法
六、你不得不懂的CMS收集器
CMS (Concurrent Mark Sweep)收集器是-种以获取最短回收停顿时间为目标的收集器。
目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。
CMS 收集器是基于“标记-清除”算法实现的
步骤流程:
初始标记(CMS initial mark) -----标记一下 GC Roots 能直接关联到的对象,速度很快
并发标记(CMS concurrent mark --------并发标记阶段就是进行 GC RootsTracing 的过程
重新标记(CMS remark) -----------为了修正并发标记期间因用户程序导致标记产生变动的标记记录
并发清除(CMS concurrent sweep)
CMS垃圾收集器缺点:
对CPU资源非常敏感
无法处理浮动垃圾,程序在进行并发清除阶段用户线程所产生的新垃圾
标记-清除暂时空间碎片
七、G1收集器
G1是一款面向服务端应用的垃圾收集器
特点:
G1 中每个 Region 都有一个与之对应的 Remembered Set,当进行内存回收时,在 GC 根节点的枚举范围中加入 Remembered Set 即可保证不对全堆扫描也不会有遗漏 检查Reference引用的对象是否处于不同的Region
G1 收集器的运作大致可划分为以下几个步骤:
初始标记(Initial Marking) --标记一下 GC Roots 能直接关联到的对象
并发标记(Concurrent Marking)---从GC Root 开始对堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行
最终标记(Final Marking) ---为了修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录。虚拟机将这段时间对象变化记录在线程 Remembered Set Logs 里面,最终标记阶段需要把 Remembered Set Logs的数据合并到 Remembered Set 中
筛选回收(Live Data Counting and Evacuation)
G1的优势有哪些:
空间整合:基于“标记一整理”算法实现为主和Region之间采用复制算法实现的垃圾收集
可预测的停顿:这是 G1 相对于 CMS 的另一大优势,降低停顿时间是 G1 和 CMS 共同的关注点,但 G1 除了追求低停顿外,还能建立可预测的停顿时间模型
在 G1 之前的其他收集器进行收集的范围都是整个新生代或者老年代,而 G1 不再是这样。使用 G1 收集器时,Java 堆的内存布局就与其他收集器有很大差别,它将整个 Java堆 划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分 Region(不需要连续)的集合。
八、ZGC收集器
ZGC收集器是JDK11中新增的垃圾收集器,它是由oracle官方开发的,并且支持TB级别的堆内存管理,而且ZGC收集器也非常高效,可以做到10ms以内完成垃圾收集。
在ZGC收集器中没有新生代和老生代的概念,它只有一代。ZGC收集器采用的着色指针技术,利用指针中多余的信息位来实现着色标记,并且ZGC使用了读屏障来解决GC线程和应用线程可能存在的并发(修改对象状态的)问题,从而避免了Stop The World全局停顿,因此使得GC的性能大幅度提升。
ZGC的执行流程和CMS比较相似
进行GC Roots标记,然后再通过指针进行并发着色标记,之后便是对标记死亡的对象进行回收(被标记为橘色的对象),最后是重定位,将GC之后存活的对象进行移动,以解决内存碎片的问题。



