垃圾收集器与内存分配策略(23)


在并发标记阶段如何保证收集线程与用户线程互不干扰地运行?
CMS收集器采用增量更新算法实现,而G1收集器则是通过原始快照(SATB)算法来实现的 。此外,垃圾收集对用户线程的影响还体现在回收过程中新创建对象的内存分配上,程序要继续运行就肯定会持续有新对象被创建,G1为每一个设计了两个名为TAMS(Top at Mark Start)的指针,把中的一部分空间划分出来用于并发回收过程中的新对象分配,并发回收时新分配的对象地址都必须要在这两个指针位置以上 。G1收集器默认在这个地址以上的对象是被隐式标记过的,即默认它们是存活的,不纳入回收范围 。与CMS中的“ Mode ”失败会导致Full GC类似,如果内存回收的速度赶不上内存分配的速度,G1收集器也要被迫冻结用户线程执行,导致Full GC而产生长时间“Stop The World” 。
怎样建立起可靠的停顿预测模型?
用户通过-XX:参数指定的停顿时间只意味着垃圾收集发生之前的期望值,但G1收集器要怎么做才能满足用户的期望呢?G1收集器的停顿预测模型是以衰减均值( )为理论基础来实现的,在垃圾收集过程中,G1收集器会记录每个的回收耗时、每个记忆集里的脏卡数量等各个可测量的步骤花费的成本,并分析得出平均值、标准偏差、置信度等统计信息 。这里强调的“衰减平均值”是指它会比普通的平均值更容易受到新数据的影响,平均值代表整体平均状态,但衰减平均值更准确地代表“最近的”平均状态 。换句话说,的统计状态越新越能决定其回收的价值 。然后通过这些信息预测现在开始回收的话,由哪些组成回收集才可以在不超过期望停顿时间的约束下获得最高的收益 。
G1收集器的运作过程大致可划分为以下四个步骤:
·初始标记( ):仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS指针的值,让下一阶段用户线程并发运行时,能正确地在可用的中分配新对象 。这个阶段需要停顿线程,但耗时很短,而且是借用进行Minor GC的时候同步完成的,所以G1收集器在这个阶段实际并没有额外的停顿 。--stop the world
·并发标记( ):从GC Root开始对堆中对象进行可达性分析,递归扫描整个堆里的对象图,找出要回收的对象,这阶段耗时较长,但可与用户程序并发执行 。当对象图扫描完成以后,还要重新处理SATB记录下的在并发时有引用变动的对象 。
·最终标记(Final ):对用户线程做另一个短暂的暂停,用于处理并发阶段结束后仍遗留下来的最后那少量的SATB记录 。--stop the world
·筛选回收(Live Dataand ):负责更新的统计数据,对各个的回收价值和成本进行排序,根据用户所期望的停顿时间来制定回收计划,可以自由选择任意多个构成回收集,然后把决定回收的那一部分的存活对象复制到空的中,再清理掉整个旧的全部空间 。这里的操作涉及存活对象的移动,是必须暂停用户线程,由多条收集器线程并行完成的 。--stop the world
从上述阶段的描述可以看出,G1收集器除了并发标记外,其余阶段也是要完全暂停用户线程的,换言之,它并非纯粹地追求低延迟,官方给它设定的目标是在延迟可控的情况下获得尽可能高的吞吐量,所以才能担当起“全功能收集器”的重任与期望
从G1开始,最先进的垃圾收集器的设计导向都不约而同地变为追求能够应付应用的内存分配速率( Rate),而不追求一次把整个Java堆全部清理干净 。这样,应用在分配,同时收集器在收集,只要收集的速度能跟得上对象分配的速度,那一切就能运作得很完美 。这种新的收集器设计思路从工程实现上看是从G1开始兴起的,所以说G1是收集器技术发展的一个里程碑 。