avatar

垃圾收集器与内存分配策略

垃圾回收的三个问题


  • 哪些内存需要回收?
  • 什么时候回收?
  • 如何回收?

对象已死吗


垃圾收集器在对堆回收之前,首先需要考虑的就是哪些内存需要回收,确定哪些对象还活着,哪些对象已死去。

引用计数算法

给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。

可达性分析算法

通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链连接的时候,则证明该对象是不可用的。

在Java语言中,可作为GC Roots的对象包括:

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 方法区中类静态属性引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中JNI(native方法)引用的对象

再谈引用

在JDK1.2之后,Java将引用分为强引用、软引用、弱引用、虚引用,强度依次递减

  • 强引用就是指在程序代码中普遍存在的,类似”Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收被引用的对象。
  • 软引用是用来描述一些还有用但并非必需的对象。对于软引用关联着的对象,在系统将要发生内存溢出之前,将会把这些对象列进回收范围之中进行第二次回收。
  • 弱引用也是用来描述非必需对象的,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
  • 虚引用是最弱的引用关系,一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。

生存还是死亡

下面来叙述以下判断生存或是死亡的过程:

  • 首先进行可达性分析,若没有发现可达性连接,则对其进行一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize方法。若对象没有覆盖finalize方法,或finalize方法已经被虚拟机调用过,则虚拟机将这两种情况视为”没有必要执行“。
  • 若该对象被判定为有必要执行finalize方法,那么该对象会被放置在一个叫做F-Queue的队列中,并由一个虚拟机自动建立的、低优先级的Finalizer线程去执行。
  • 稍后GC将对F-Queue中的对象进行第二次小规模的标记。如果对象又重新与引用链上的任何一个对象建立关联,则可以脱离被回收的状态,比如将自己赋值给某个类变量或成员变量。若被第二次标记,它将被移出”即将回收“集合,然后基本上它就会被回收了。

回收方法区

永久代的垃圾收集主要回收两部分内容:废弃常量和无用的类。

判断废弃常量的方法

以常量池中字面值的回收为例,若一个字符串常量进入了常量池中,但是没有任何一个对象引用该常量,则该常量会被回收。

判断无用的类的方法

  • 该类所有的实例都已经被回收,即Java堆中不存在该类的实例
  • 加载该类的ClassLoader已经被回收
  • 该类对应的Class对象没有在任何地方被引用,无法在任何地方通过反射机制访问该类的方法

垃圾收集算法


标记—清除算法

首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。

其主要的不足有两个:

  • 效率问题,标记和清除的效率都不高
  • 空间问题,标记清除之后会产生大量不连续的内存碎片,而当需要分配一个较大对象时,若无法找到一个足够的连续内存,则会触发另一次垃圾收集动作

复制算法

复制算法将内存按容量划分为大小相等的两块,每次只使用其中的一块,当这一块内存用完了,则将还存活着的对象复制到另一块上,然后把已使用过的内存空间一次性清理掉。

  • 优点是效率高,且不需要考虑内存碎片问题
  • 缺点是每次只使用一半的内存,空间浪费太大

标记—整理算法

首先标记存活的对象,然后将存活的对象向一端移动,然后直接清理掉端边界以外的内存。

分代收集算法

在新生代中,每次垃圾收集时都会有大量对象死去,只有少量存活,则选用复制算法。

而老年代中,因为对象存活率高、没有额外空间对它进行分配担保,就使用”标记—清除“或”标记—整理”算法。

Minor GC和Full GC的区别

  • 新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为Java对象大多都拒赔朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也比较快。
  • 老年代GC(Full GC):指发生在老年代的GC,出现了Full GC,经常会伴随之至少一次的Minor GC。Full GC的速度一般会比Minor GC慢10倍以上。

内存分配与回收策略


对象的内存分配,在大方向上讲,就是在堆上分配,一般主要分配在新生代的Eden区上,如果启动了本地线程分配缓冲,则优先在TLAB上分配。少数情况下会直接在老年代分配。

分配的规则不是固定的,由垃圾收集器泽合、虚拟机和内存相关的参数设定来决定。

对象优先在Eden分配

大多数情况下,对象在新生代Eden区中分配,若当Eden区空间不足时,会触发一次Minor GC。

大对象直接进入老年代

大对象是指,需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组等。经常出现大对象容易导致内存不足而提前触发垃圾收集。

长期存活的对象进入老年代

在分代收集思想中,虚拟机为每一个对象都定义了一个对象年龄计数器。如果对象在Eden区出生,并经过第一次Minor GC后仍然存活,并进入Survivor区的话,对象年龄记为1。然后若该对象在Survivor区每熬过一次Minor GC,对象年龄就会加一,当它的年龄达到一个阈值时(默认是15岁),便会转移到老年代。

动态对象年龄判断

为了能更好地适应不同程序的内存状况,虚拟机并不是永远都要求对象的年龄必须达到 MaxTenuringThreshold 才能晋升老年代。如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代。

空间分配担保

在发生Minor GC之前,虚拟机是如何检查该Minor GC是否是安全的?

  1. 首先检查老年代最大可用的连续空间是否大于新生代所有对象的总空间
    1. 若该条件成立,则Minor GC是安全的
    2. 若不成立,则虚拟机会查看 HandlePromotionFailure 设置值是否允许担保失败
      1. 如果允许,则会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小
        1. 如果大于,则将尝试一次Minor GC
        2. 否则,改为进行一次Full GC
      2. 否则,进行一次Full GC
Author: WJZheng
Link: https://wellenzheng.github.io/2020/04/17/%E5%9E%83%E5%9C%BE%E6%94%B6%E9%9B%86%E5%99%A8%E4%B8%8E%E5%86%85%E5%AD%98%E5%88%86%E9%85%8D%E7%AD%96%E7%95%A5/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.

Comment