JVM - 垃圾回收与内存分配策略

2025-02-12

垃圾回收与内存分配策略

判断对象的存活

引用计数法

当一个对象有引用的时候计数+1,引用结束时计数-1,当计数大于0时则认为对象存活。
优点：快，方便，实现简单，缺点：对象相互引用时，很难判断对象是否改回收。
可达性分析

通过一系列的称为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，
搜索所走过的路径称为引用链（Reference Chain），当一个对象到GC Roots没有任何引用链相连时，则证明此对象是不可用的。
作为GC Roots的对象包括下面几种：
1. 虚拟机栈（栈帧中的本地变量表）中引用的对象。
2. 方法区中类静态属性引用的对象。
3. 方法区中常量引用的对象。
4. 本地方法栈中JNI（即一般说的Native方法）引用的对象。

java中的引用

强引用

一般的Object obj = new Object() ，就属于强引用。
软引用 SoftReference

一些有用但是并非必需，用软引用关联的对象，系统将要发生OOM之前，这些对象就会被回收。
弱引用 WeakReference

一些有用（程度比软引用更低）但是并非必需，用弱引用关联的对象，只能生存到下一次垃圾回收之前，
GC发生时，不管内存够不够，都会被回收。
虚引用 PhantomReference

软引用 SoftReference和弱引用 WeakReference，可以用在内存资源紧张的情况下以及创建不是很重要的数据缓存。当系统内存不足的时候，缓存中的内容是可以被释放的。
例如，一个程序用来处理用户提供的图片。如果将所有图片读入内存，这样虽然可以很快的打开图片，但内存空间使用巨大，一些使用较少的图片浪费内存空间，需要手动从内存中移除。如果每次打开图片都从磁盘文件中读取到内存再显示出来，虽然内存占用较少，但一些经常使用的图片每次打开都要访问磁盘，代价巨大。这个时候就可以用软引用构建缓存。

垃圾回收算法

标记-清除算法（Mark-Sweep）

算法分为“标记”和“清除”两个阶段：首先标记出所有需要回收的对象，在标记完成后统一回收所有被标记的对象。
它的主要不足空间问题，标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时，
无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
复制算法（Copying）

将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，
然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收，
内存分配时也就不用考虑内存碎片等复杂情况，只要按顺序分配内存即可，实现简单，运行高效。
只是这种算法的代价是将内存缩小为了原来的一半。
标记-整理算法（Mark-Compact）

首先标记出所有需要回收的对象，在标记完成后，后续步骤不是直接对可回收对象进行清理，
而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存。

当前商业虚拟机的垃圾收集都采用“分代收集”（Generational Collection）算法，这种算法并没有什么新的思想，只是根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代，这样就可以根据各个年代的特点采用最适当的收集算法。
专门研究表明，新生代中的对象98%是“朝生夕死”的，所以并不需要按照1:1的比例来划分内存空间，而是将内存分为一块较大的Eden空间和两块较小的Survivor空间，每次使用Eden和其中一块Survivor[1]。当回收时，将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上，最后清理掉Eden和刚才用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8:1，也就是每次新生代中可用内存空间为整个新生代容量的90%（80%+10%），只有10%的内存会被“浪费”。当然，98%的对象可回收只是一般场景下的数据，我们没有办法保证每次回收都只有不多于10%的对象存活，当Survivor空间不够用时，需要依赖其他内存（这里指老年代）进行分配担保（Handle Promotion）。
在新生代中，每次垃圾收集时都发现有大批对象死去，只有少量存活，那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保，就必须使用“标记—清理”或者“标记—整理”算法来进行回收。

垃圾回收器

Serial

新生代,复制算法,单线程,进行垃圾收集时,必须暂停所有工作线程,直到完成(stop the world).简单高效,适合内存不大的情况.

ParNew

新生代,复制算法,并行的多线程收集器,ParNew垃圾收集器是Serial收集器的多线程版本.搭配CMS垃圾回收器的首选.

Parallel Scavenge吞吐量优先收集器

新生代,复制算法,并行的多线程收集器,类似ParNew,更加关注吞吐量,达到一个可控制的吞吐量.适合本身是Server级别多CPU机器上的默认GC方式,主要适合后台运算不需要太多交互的任务.

Serial Old

老年代,标记整理算法,单线程,jdk7/8默认的老生代垃圾回收器.适合Client模式下虚拟机使用.

Parallel Old

老年代,标记整理算法,并行的多线程收集器,Parallel Scavenge收集器的老年代版本,为了配合Parallel Scavenge的面向吞吐量的特性而开发的对应组合. 在注重吞吐量以及CPU资源敏感的场合采用

CMS

老年代,标记清除算法 ,并行与并发收集器,尽可能的缩短垃圾收集时用户线程停止时间；缺点在于：

内存碎片
需要更多cpu资源
浮动垃圾问题，需要更大的堆空间
适合于重视服务的响应速度、系统停顿时间和用户体验的互联网网站或者B/S系统。互联网后端目前cms是主流的垃圾回收器.

G1

跨新生代和老年代；标记整理 + 化整为零,并行与并发收集器 JDK1.7才正式引入，采用分区回收的思维，基本不牺牲吞吐量的前提下完成低停顿的内存回收；可预测的停顿是其最大的优势,面向服务端应用的垃圾回收器，目标为取代CMS

回收器之间的关系：

垃圾回收器

回收器相关配置:

-XX:+UseSerialGC 新生代和老年代都用串行收集器
-XX:+UseParNewGC 新生代使用ParNew，老年代使用Serial Old
-XX:+UseParallelGC 新生代使用ParallerGC，老年代使用Serial Old
-XX:+ UseParallelOldGC 新生代使用ParallerGC，老年代使用Parallel Old
-XX:+UseConcMarkSweepGC 表示新生代使用ParNew，老年代的用CMS
-XX:+UseG1GC 使用G1收集器

Stop The World现象

GC收集器和我们GC调优的目标就是尽可能的减少STW的时间和次数.

内存分配与回收策略

对象优先在Eden分配，如果说Eden内存空间不足，就会发生Minor GC
大对象直接进入老年代，大对象：需要大量连续内存空间的Java对象，比如很长的字符串和大型数组，1、导致内存有空间，还是需要提前进行垃圾回收获取连续空间来放他们，2、会进行大量的内存复制。
-XX:PretenureSizeThreshold 参数，大于这个数量直接在老年代分配，缺省为0 ，表示绝不会直接分配在老年代。
长期存活的对象将进入老年代，默认15岁，-XX:MaxTenuringThreshold调整
动态对象年龄判定，为了能更好地适应不同程序的内存状况，虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代，如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代，无须等到MaxTenuringThreshold中要求的年龄
空间分配担保：新生代中有大量的对象存活，survivor空间不够，当出现大量对象在MinorGC后仍然存活的情况（最极端的情况就是内存回收后新生代中所有对象都存活），就需要老年代进行分配担保，把Survivor无法容纳的对象直接进入老年代.只要老年代的连续空间大于新生代对象的总大小或者历次晋升的平均大小，就进行Minor GC，否则FullGC。

内存泄漏和内存溢出辨析(todo)

内存溢出：实实在在的内存空间不足导致.
内存泄漏：该释放的对象没有释放，多见于自己使用容器保存元素的情况下.

JDK为我们提供的工具

jps
jstat
jinfo
jmap
jhat
jstack

其它分析工具 MAT