垃圾回收(GC)是程序运行中必不可少的一环,lua 内部则实现了一套垃圾回收流程。
简介
- 在游戏项目中,lua 的主要优势,在于能进行热更新,能及时修复线上运行过程中出现的问题,尽可能地缩短流程时长。另一方面,对于开发者来讲,lua 的另一个优势,即其内部实现了一套垃圾回收流程,可以自动进行垃圾回收,不需要开发者进行主动管理,为开发者提供了较大的便利。
- 尽管 lua 有垃圾回收机制,但如果不了解其内部实现,就不知道需要注意的地方。为了做好内存管理,还是需要进一步了解掌握 lua 的垃圾回收机制。
初始化
- lua 初始化的方法如下:
// lstate.c
LUA_API lua_State *lua_newstate (lua_Alloc f, void *ud) {
int i;
lua_State *L;
global_State *g;
LG *l = cast(LG *, (*f)(ud, NULL, LUA_TTHREAD, sizeof(LG)));
if (l == NULL) return NULL;
L = &l->l.l;
g = &l->g;
L->tt = LUA_VTHREAD;
g->currentwhite = bitmask(WHITE0BIT);
L->marked = luaC_white(g);
preinit_thread(L, g);
g->allgc = obj2gco(L); /* by now, only object is the main thread */
L->next = NULL;
g->Cstacklimit = L->nCcalls = LUAI_MAXCSTACK + CSTACKERR;
incnny(L); /* main thread is always non yieldable */
g->frealloc = f;
g->ud = ud;
g->warnf = NULL;
g->ud_warn = NULL;
g->mainthread = L;
g->seed = luai_makeseed(L);
g->gcrunning = 0; /* no GC while building state */
g->strt.size = g->strt.nuse = 0;
g->strt.hash = NULL;
setnilvalue(&g->l_registry);
g->panic = NULL;
g->gcstate = GCSpause;
g->gckind = KGC_INC;
g->gcemergency = 0;
g->finobj = g->tobefnz = g->fixedgc = NULL;
g->firstold1 = g->survival = g->old1 = g->reallyold = NULL;
g->finobjsur = g->finobjold1 = g->finobjrold = NULL;
g->sweepgc = NULL;
g->gray = g->grayagain = NULL;
g->weak = g->ephemeron = g->allweak = NULL;
g->twups = NULL;
g->totalbytes = sizeof(LG);
g->GCdebt = 0;
g->lastatomic = 0;
setivalue(&g->nilvalue, 0); /* to signal that state is not yet built */
setgcparam(g->gcpause, LUAI_GCPAUSE);
setgcparam(g->gcstepmul, LUAI_GCMUL);
g->gcstepsize = LUAI_GCSTEPSIZE;
setgcparam(g->genmajormul, LUAI_GENMAJORMUL);
g->genminormul = LUAI_GENMINORMUL;
for (i=0; i < LUA_NUMTAGS; i++) g->mt[i] = NULL;
if (luaD_rawrunprotected(L, f_luaopen, NULL) != LUA_OK) {
/* memory allocation error: free partial state */
close_state(L);
L = NULL;
}
return L;
}
- 其中,gc 相关的参数也进行了初始化状态,主要参数有:
- currentwhite
- 当前 gc 过程的白色类型,包括 WHITE0BIT 、WHITE1BIT ,通过两种类型交替使用,来表示对象是上一轮还是当前轮 gc 处理的对象。
- allgc
- 所有需要 gc 的对象链表。
- gcstate
- 当前 gc 过程所处的状态,有以下状态:
- GCSpropagate :扫描标记状态。
- GCSenteratomic :准备进入原子处理的状态。
- GCSatomic :原子处理状态。
- GCSswpallgc :清除 allgc 列表状态。
- GCSswpfinobj :清除 finobj 列表状态。
- GCSswptobefnz :清除 tobefnz 列表状态。
- GCSswpend :清除完成状态。
- GCScallfin :执行析构方法状态。
- GCSpause :暂停状态(初始化时的默认状态)。
- 当前 gc 过程所处的状态,有以下状态:
- gckind
- gc 类型,有两种类型:
- KGC_INC :增量式 gc(初始化时的默认状态)。
- KGC_GEN :分代式 gc 。
- gc 类型,有两种类型:
- gcemergency
- 紧急 gc 标记,如果不为 0 ,则会跳过一些操作,避免某些操作(如执行析构方法、缩小数据结构等)在非预期的情况下,更改解释器状态。
- finobj
- 带析构方法的对象列表。
- tobefnz
- 将要执行析构方法的对象列表。
- sweepgc
- 当前清除对象列表。
- gray
- 灰色对象列表(用于记录当前灰色对象,和对象的 gclist 组合使用)。
- grayagain
- 需要进行原子处理遍历的对象列表。
- weak
- 弱值(value)类型 table 列表。
- ephemeron
- 弱键(key)类型 table 列表。
- allweak
- 弱键值(key-value)类型 table 列表。
- GCdebt
- 已经申请且还没被收集器补偿的内存字节数,用于管理 gc 启动的时机,当大于 0 时才会开启 gc 。创建新对象时增加,释放时减少。
- totalbytes
- 已经申请且被收集器补偿的内存字节数,和 GCdebt 相加表示未释放的总内存。
- gcpause
- 下一轮 gc 开启时内存需要达到的倍数 * 100 ,默认为 200(LUAI_GCPAUSE)。
- gcstepsize
- 每一步处理的大小,以 2 为底的对数表示,默认为 13(LUAI_GCSTEPSIZE),即 8 KB 。
- gcstepmul
- 每一步处理的大小的放大倍数,可近似为每单位新增内存需要 gc 处理的内存大小,默认为 100(LUAI_GCMUL)。
- GCestimate
- 使用中的内存估计大小,通常为当前未释放的总内存大小,和 gettotalbytes(g) 的值一致。
- currentwhite
- 所有需要 gc 的对象,最终都通过 luaC_newobj 方法创建。
// lgc.c
GCObject *luaC_newobj (lua_State *L, int tt, size_t sz) {
global_State *g = G(L);
GCObject *o = cast(GCObject *, luaM_newobject(L, novariant(tt), sz));
o->marked = luaC_white(g);
o->tt = tt;
o->next = g->allgc;
g->allgc = o;
return o;
}
- 创建一个新对象,会将其标记为当前的白色,并且会将该对象设置到 g->allgc 列表上,用于后续 gc 处理时进行遍历。
算法流程
- 标记清除算法的主要流程为:
- 所有对象创建的时候标记为白色。
- gc 开始后,遍历检查所有对象,如果还有引用的,就标记为黑色。
- 标记完成后,所有标记为白色的对象,表示对象没有引用,直接清除。
- 清除完成后,将所有黑色的对象重新标记为白色,等待下一次 gc 。
- 由于需要检查完所有对象进行标记,再对所有对象进行处理,执行一次 gc 的耗时相对较长。因此,lua 的 gc 加入了分步的概念,每次处理都有上限数量,将整个过程切分成多个小步骤循环执行,主要流程为:
- 设置当前白色为白色 1 ,所有对象创建的时候标记为白色 1 。
- gc 开始后,遍历检查所有对象,如果还有引用的,就标记为灰色,加入灰色列表。
- 取出灰色列表的对象,将其标记为黑色,并将其引用的所有对象标记为灰色,加入灰色列表。
- 所有对象标记完成后,设置当前白色为白色 2 。
- 遍历所有需要 gc 的对象,如果为白色 1 ,则该对象没有引用,直接清除。如果不为白色 1 ,则将该对象标记为白色 2 。
- 所有对象清除完成后,本轮 gc 结束。下轮 gc 则对白色 2 对象进行处理,两种白色交替使用。
- 如上图所示,检查引用从栈和全局表开始,红色箭头表示栈引用的对象,黄色箭头表示全局表引用的对象,绿色箭头表示对象引用的其他对象。
- 标记开始时,引用的对象会被标记为灰色,然后下一步处理时变成黑色,并将其引用的对象标记为灰色。循环上面过程,直到将所有引用的对象标记完成。然后遍历 allgc 列表,白色的对象清除,其他对象则重新设置为白色。
- 简单来说,lua 的 gc 流程就如图中所示。实际上,lua 的 gc 过程分为几个阶段,具体实现中有许多细节内容。
gc 阶段
- 初始化后,gcstate 为 GCSpause 状态,每个状态下 gc 执行步骤的代码为:
// lgc.c
static lu_mem singlestep (lua_State *L) {
global_State *g = G(L);
switch (g->gcstate) {
case GCSpause: {
restartcollection(g);
g->gcstate = GCSpropagate;
return 1;
}
case GCSpropagate: {
if (g->gray == NULL) { /* no more gray objects? */
g->gcstate = GCSenteratomic; /* finish propagate phase */
return 0;
}
else
return propagatemark(g); /* traverse one gray object */
}
case GCSenteratomic: {
lu_mem work = atomic(L); /* work is what was traversed by 'atomic' */
entersweep(L);
g->GCestimate = gettotalbytes(g); /* first estimate */;
return work;
}
case GCSswpallgc: { /* sweep "regular" objects */
return sweepstep(L, g, GCSswpfinobj, &g->finobj);
}
case GCSswpfinobj: { /* sweep objects with finalizers */
return sweepstep(L, g, GCSswptobefnz, &g->tobefnz);
}
case GCSswptobefnz: { /* sweep objects to be finalized */
return sweepstep(L, g, GCSswpend, NULL);
}
case GCSswpend: { /* finish sweeps */
checkSizes(L, g);
g->gcstate = GCScallfin;
return 0;
}
case GCScallfin: { /* call remaining finalizers */
if (g->tobefnz && !g->gcemergency) {
int n = runafewfinalizers(L, GCFINMAX);
return n * GCFINALIZECOST;
}
else { /* emergency mode or no more finalizers */
g->gcstate = GCSpause; /* finish collection */
return 0;
}
}
default: lua_assert(0); return 0;
}
}
启动阶段(GCSpause -> GCSpropagate)
- 启动阶段主要执行的代码如下:
// lgc.c
static void restartcollection (global_State *g) {
cleargraylists(g);
markobject(g, g->mainthread);
markvalue(g, &g->l_registry);
markmt(g);
markbeingfnz(g); /* mark any finalizing object left from previous cycle */
}
- 启动阶段也是 gc 循环开始的阶段,主要是将 lua 对象引用的起点进行标记,其步骤为:
- 清除 gc 循环过程中记录的链表(g->gray 、g->grayagain 、g->weak 、g->allweak 、g->ephemeron)。
- 将 lua 栈(g->mainthread)标记为灰色。
- 将注册表(g->l_registry)的标记为灰色。
- 将 lua 基础类型的元表标记为灰色。
- 将要执行析构方法的列表(g->tobefnz)的所有对象标记为灰色。
- 其中,标记的方法具体实现为:
// lgc.c
static void reallymarkobject (global_State *g, GCObject *o) {
switch (o->tt) {
case LUA_VSHRSTR:
case LUA_VLNGSTR: {
set2black(o); /* nothing to visit */
break;
}
case LUA_VUPVAL: {
UpVal *uv = gco2upv(o);
if (upisopen(uv))
set2gray(uv); /* open upvalues are kept gray */
else
set2black(o); /* closed upvalues are visited here */
markvalue(g, uv->v); /* mark its content */
break;
}
case LUA_VUSERDATA: {
Udata *u = gco2u(o);
if (u->nuvalue == 0) { /* no user values? */
markobjectN(g, u->metatable); /* mark its metatable */
set2black(o); /* nothing else to mark */
break;
}
/* else... */
} /* FALLTHROUGH */
case LUA_VLCL: case LUA_VCCL: case LUA_VTABLE:
case LUA_VTHREAD: case LUA_VPROTO: {
linkobjgclist(o, g->gray); /* to be visited later */
break;
}
default: lua_assert(0); break;
}
}
static void linkgclist_ (GCObject *o, GCObject **pnext, GCObject **list) {
lua_assert(!isgray(o)); /* cannot be in a gray list */
*pnext = *list;
*list = o;
set2gray(o); /* now it is */
}
/*
** Link a generic collectable object 'o' into the list 'p'.
*/
#define linkobjgclist(o,p) linkgclist_(obj2gco(o), getgclist(o), &(p))
- 可以看到,通常情况下,标记灰色的过程为:
- 将当前对象的 gclist 指向灰色对象列表 gray 。
- 将当前对象设置到 gray 列表。
- 将当前对象标记为灰色(非黑非白)。
- 而对于字符串类型,则是直接将对象标记为黑色。这是因为字符串类型的对象,不会再引用其他的对象,所以不需要再向后延伸。
传播阶段(GCSpropagate -> GCSenteratomic)
- 传播阶段的代码实现为:
// lgc.c
static lu_mem propagatemark (global_State *g) {
GCObject *o = g->gray;
nw2black(o);
g->gray = *getgclist(o); /* remove from 'gray' list */
switch (o->tt) {
case LUA_VTABLE: return traversetable(g, gco2t(o));
case LUA_VUSERDATA: return traverseudata(g, gco2u(o));
case LUA_VLCL: return traverseLclosure(g, gco2lcl(o));
case LUA_VCCL: return traverseCclosure(g, gco2ccl(o));
case LUA_VPROTO: return traverseproto(g, gco2p(o));
case LUA_VTHREAD: return traversethread(g, gco2th(o));
default: lua_assert(0); return 0;
}
}
- 该阶段执行一次,会将灰色列表的当前对象移除,标记为黑色,并将此对象的 gclist 设置为灰色列表(和启动阶段的设置对应)。之后,对此对象进行遍历,获取其引用的所有对象,标记成灰色,加入灰色列表。
- 此后,会重复上面的过程,持续标记过程,直到灰色列表的所有对象都已经标记为黑色,该阶段才算真正完成。
遍历 table
- 遍历检查 table 过程如下:
// lgc.c
static lu_mem traversetable (global_State *g, Table *h) {
const char *weakkey, *weakvalue;
const TValue *mode = gfasttm(g, h->metatable, TM_MODE);
markobjectN(g, h->metatable);
if (mode && ttisstring(mode) && /* is there a weak mode? */
(cast_void(weakkey = strchr(svalue(mode), 'k')),
cast_void(weakvalue = strchr(svalue(mode), 'v')),
(weakkey || weakvalue))) { /* is really weak? */
if (!weakkey) /* strong keys? */
traverseweakvalue(g, h);
else if (!weakvalue) /* strong values? */
traverseephemeron(g, h, 0);
else /* all weak */
linkgclist(h, g->allweak); /* nothing to traverse now */
}
else /* not weak */
traversestrongtable(g, h);
return 1 + h->alimit + 2 * allocsizenode(h);
}
- 对于 table 来说,根据 table 是否为弱表,有不同的检查方式。
- key 为强类型,value 为弱类型。
- 遍历 table 的哈希表部分,如果 value 为空,则清除 key 值。如果 value 不为空,则将 key 值标记为灰色。
- 如果当前是在 GCSatomic 状态,并且数组部分不为空,或者哈希表部分存在未标记的对象,则该 table 要加入到 g->weak 列表中,不然就将 table 加入到 g->grayagain 列表中。
- key 为弱类型,value 为强类型。
- 遍历 table 的数组部分,将所有对象标记为灰色。
- 遍历 table 的哈希表部分:
- 如果 value 为空,则清除 key 值。
- 如果 value 不为空,key 已标记,value 未标记过,则将 value 值标记为灰色。
- 如果当前为 GCSpropagate 状态,则将 table 加入 g->grayagain 列表。
- 如果遍历前存在 key-value 都未标记过的,则将 table 加入 g->ephemeron 列表。
- 如果遍历前存在 key 未标记过的,则将 table 加入 g->allweak 列表。
- key-value 都为弱类型。 -将 table 加入 g->allweak 列表。
- key-value 都为强类型。
- 遍历 table 的数组部分,将所有对象标记为灰色。
- 遍历 table 的哈希表部分:
- 如果 value 为空,则清除 key 值。
- 将 key 值标记为灰色。
- 将 value 值标记为灰色。
- key 为强类型,value 为弱类型。
- 遍历结束后,会返回处理的 TValue 对象数量,为:
- 当前 table :1 。
- table 的数组部分数量: h->alimit 。
- table 的哈希表部分数量(每个节点有 key 和 value 两个对象):2 * allocsizenode(h) 。
遍历 thread
- 遍历检查 thread 过程如下:
// lgc.c
static int traversethread (global_State *g, lua_State *th) {
UpVal *uv;
StkId o = th->stack;
if (isold(th) || g->gcstate == GCSpropagate)
linkgclist(th, g->grayagain); /* insert into 'grayagain' list */
if (o == NULL)
return 1; /* stack not completely built yet */
lua_assert(g->gcstate == GCSatomic ||
th->openupval == NULL || isintwups(th));
for (; o < th->top; o++) /* mark live elements in the stack */
markvalue(g, s2v(o));
for (uv = th->openupval; uv != NULL; uv = uv->u.open.next)
markobject(g, uv); /* open upvalues cannot be collected */
if (g->gcstate == GCSatomic) { /* final traversal? */
StkId lim = th->stack + th->stacksize; /* real end of stack */
for (; o < lim; o++) /* clear not-marked stack slice */
setnilvalue(s2v(o));
/* 'remarkupvals' may have removed thread from 'twups' list */
if (!isintwups(th) && th->openupval != NULL) {
th->twups = g->twups; /* link it back to the list */
g->twups = th;
}
}
else if (!g->gcemergency)
luaD_shrinkstack(th); /* do not change stack in emergency cycle */
return 1 + th->stacksize;
}
- 对于线程类型对象,主要操作对象为栈和 upvalue ,过程为:
- 从栈底到栈顶,把栈上的对象标记为灰色。
- 将 openupval 列表的对象标记为灰色。
- 如果当前是 GCSatomic 状态,从栈顶开始,到整个栈的最大值,将栈上所有对象清除。
- 如果当前不为 GCSatomic 状态,且 g->gcemergency 不为 0(即不为紧急 gc),则对当前栈进行缩减,缩减流程为:
- 获取当前栈正在使用的大小。
- 设置最佳大小为正在使用的大小加上 BASIC_STACK_SIZE(C 函数可用的最小 lua 栈大小的 2 倍,20)。
- 如果当前正在使用的大小没有超过 LUAI_MAXSTACK - EXTRA_STACK,并且最佳大小也小于当前栈的大小,才以最佳大小进行栈缩小。
- 遍历结束后,返回处理的大小为:
- 当前 thread 对象 :1 。
- 当前栈的大小:th->stacksize 。
原子阶段(GCSenteratomic -> GCSswpallgc)
- 原子阶段主要从头开始,对所有未标记过的对象进行检查标记,再执行一次清扫过程。
- 该阶段的标记方法为:
// lgc.c
static lu_mem atomic (lua_State *L) {
global_State *g = G(L);
lu_mem work = 0;
GCObject *origweak, *origall;
GCObject *grayagain = g->grayagain; /* save original list */
g->grayagain = NULL;
lua_assert(g->ephemeron == NULL && g->weak == NULL);
lua_assert(!iswhite(g->mainthread));
g->gcstate = GCSatomic;
markobject(g, L); /* mark running thread */
/* registry and global metatables may be changed by API */
markvalue(g, &g->l_registry);
markmt(g); /* mark global metatables */
work += propagateall(g); /* empties 'gray' list */
/* remark occasional upvalues of (maybe) dead threads */
work += remarkupvals(g);
work += propagateall(g); /* propagate changes */
g->gray = grayagain;
work += propagateall(g); /* traverse 'grayagain' list */
convergeephemerons(g);
/* at this point, all strongly accessible objects are marked. */
/* Clear values from weak tables, before checking finalizers */
clearbyvalues(g, g->weak, NULL);
clearbyvalues(g, g->allweak, NULL);
origweak = g->weak; origall = g->allweak;
separatetobefnz(g, 0); /* separate objects to be finalized */
work += markbeingfnz(g); /* mark objects that will be finalized */
work += propagateall(g); /* remark, to propagate 'resurrection' */
convergeephemerons(g);
/* at this point, all resurrected objects are marked. */
/* remove dead objects from weak tables */
clearbykeys(g, g->ephemeron); /* clear keys from all ephemeron tables */
clearbykeys(g, g->allweak); /* clear keys from all 'allweak' tables */
/* clear values from resurrected weak tables */
clearbyvalues(g, g->weak, origweak);
clearbyvalues(g, g->allweak, origall);
luaS_clearcache(g);
g->currentwhite = cast_byte(otherwhite(g)); /* flip current white */
lua_assert(g->gray == NULL);
return work; /* estimate of slots marked by 'atomic' */
}
- 可以看到,该阶段的标记过程,还是从 lua 栈、注册表、基础类型元表为起点进行检查标记。传播阶段中的 g->grayagain 、g->ephemeron 会在这个全部进行遍历标记,g->weak 、g->allweak 弱表列表,也会在这个阶段进行清除。
- 完成所有标记操作后,会将 g->currentwhite 切换为另一种白色,在这之后新建的对象,则不会在这轮 gc 中处理。
- 和传播阶段相比,原子阶段的标记操作是一步到位的,需要将所有对象都标记完成,才会执行其他操作,这个过程不能中断。
- 完成标记后,会执行清除阶段的准备过程。
// lgc.c
static void entersweep (lua_State *L) {
global_State *g = G(L);
g->gcstate = GCSswpallgc;
lua_assert(g->sweepgc == NULL);
g->sweepgc = sweeptolive(L, &g->allgc);
}
static GCObject **sweeptolive (lua_State *L, GCObject **p) {
GCObject **old = p;
do {
p = sweeplist(L, p, 1, NULL);
} while (p == old);
return p;
}
- 进入清除阶段前,会对 g->allgc 进行清除处理,直到找到第一个还有引用的对象,转为白色后,将其下一个对象设置到 g->sweepgc 上。经过一次清除处理后到进入清除阶段之间创建的新对象,就能直接跳过,因为这些在标记结束后的新对象需要在下一轮 gc 中才会处理,避免占用本轮 gc 处理的对象数量。
清除阶段(GCSswpallgc -> GCSswpfinobj -> GCSswptobefnz -> GCSswpend)
- 清除阶段主要对几个列表处理,包括 g->allgc 、g->finobj 、g->tobefnz。对 g->sweepgc 进行清除后,再依次将下一个列表设置到 g->sweepgc ,继续处理。清除的代码如下:
// lgc.c
static int sweepstep (lua_State *L, global_State *g,
int nextstate, GCObject **nextlist) {
if (g->sweepgc) {
l_mem olddebt = g->GCdebt;
int count;
g->sweepgc = sweeplist(L, g->sweepgc, GCSWEEPMAX, &count);
g->GCestimate += g->GCdebt - olddebt; /* update estimate */
return count;
}
else { /* enter next state */
g->gcstate = nextstate;
g->sweepgc = nextlist;
return 0; /* no work done */
}
}
static GCObject **sweeplist (lua_State *L, GCObject **p, int countin,
int *countout) {
global_State *g = G(L);
int ow = otherwhite(g);
int i;
int white = luaC_white(g); /* current white */
for (i = 0; *p != NULL && i < countin; i++) {
GCObject *curr = *p;
int marked = curr->marked;
if (isdeadm(ow, marked)) { /* is 'curr' dead? */
*p = curr->next; /* remove 'curr' from list */
freeobj(L, curr); /* erase 'curr' */
}
else { /* change mark to 'white' */
curr->marked = cast_byte((marked & ~maskgcbits) | white);
p = &curr->next; /* go to next element */
}
}
if (countout)
*countout = i; /* number of elements traversed */
return (*p == NULL) ? NULL : p;
}
- 清除的步骤为,检查每个对象的标记:
- 如果为白色,则表示该对象已经没有引用,将对象释放,并将 g->GCdebt 减去该对象释放的大小。
- 如果不为白色,则将该对象的标记设置为新的白色。
- 每次清除的最大数量为 100 (GCSWEEPMAX)个对象,当前列表完全清除后,才会进入下一个状态清除下一个列表。
- 所有列表清除完成后,就切换到 GCSswpend 状态,此时会进行字符串缓存的检查。
// lgc.c
static void checkSizes (lua_State *L, global_State *g) {
if (!g->gcemergency) {
if (g->strt.nuse < g->strt.size / 4) { /* string table too big? */
l_mem olddebt = g->GCdebt;
luaS_resize(L, g->strt.size / 2);
g->GCestimate += g->GCdebt - olddebt; /* correct estimate */
}
}
}
- 常规 gc 时,g->strt.nuse 为字符串缓存表当前 TString 的数量,如果小于当前大小的 1/4 ,则需要将 strt 缩小为当前大小的 1/2 ,
析构阶段(GCSswpend -> GCScallfin -> GCSpause)
- 析构阶段主要是对 g->tobefnz 列表的,执行析构函数(即元表的 __gc 方法),每个析构函数等价于 50(GCFINALIZECOST)个 TValue 处理对象。
- 处理完成后,就切换到 GCSpause 状态,本次 gc 循环结束。
完整 GC
- 一次完整的 GC ,可以通过调用 lua 提供的 collectgarbage(“collect”) 方法实现。
// lgc.c
static void fullinc (lua_State *L, global_State *g) {
if (keepinvariant(g)) /* black objects? */
entersweep(L); /* sweep everything to turn them back to white */
/* finish any pending sweep phase to start a new cycle */
luaC_runtilstate(L, bitmask(GCSpause));
luaC_runtilstate(L, bitmask(GCScallfin)); /* run up to finalizers */
/* estimate must be correct after a full GC cycle */
lua_assert(g->GCestimate == gettotalbytes(g));
luaC_runtilstate(L, bitmask(GCSpause)); /* finish collection */
setpause(g);
}
- 当调用一次完整 GC 时,操作流程如下:
- 如果当前状态在 GCSatomic 之前,即还未开始原子阶段的清除操作,则会进行原子阶段的清除操作。
- 将当前 gc 持续执行,直到当前状态为 GCSpause ,即完成上一轮未结束的 gc 。
- 再重新触发 gc ,同样执行到这一轮 gc 结束。
- 可以看到,一次完整的 GC ,需要不间断地完成上一轮和新的一轮操作,这个过程耗时将会随着内存增大而增大。如果在使用过程中,每次 gc 都需要占用较长的一段时间,则会经常出现主线程卡住的情况。因此,lua 中采用了单步 GC ,来优化这种情况。
单步 GC
- lua gc 的各个阶段,每次执行都是一次单步 gc 的操作,单步 gc 通过调用 luaC_step 方法实现。单步 gc 的触发方式有:
- lua 中调用 collectgarbage(“step”) 方法。
- 部分操作完成后,调用 luaC_condGC 方法,尝试进行 gc 。相关的操作主要有:
- lua_tolstring :将栈上的 lua 值转为 c 字符串。
- lua_pushlstring :将指针指向的指定长度的字符串,转为 lua 字符串后入栈。
- lua_pushstring :将指针指向的以'\0’结尾的字符串,转为 lua 字符串后入栈。
- lua_pushvfstring/lua_pushfstring :将格式化后的字符串,转为 lua 字符串后入栈。
- lua_pushcclosure :创建一个 lua 闭包后入栈。
- lua_createtable :创建一个空表后入栈。
- lua_concat :字符串拼接。
- lua_newuserdatauv :创建 userdata 后入栈。
- …
- 可以看到,在 lua 中创建需要 gc 的对象时,就会尝试进行一次单步 gc 。因此,在整个 lua 运行过程,gc 的过程基本上是一直在背后不断进行的,通常不需要手动调用 collectgarbage(“collect”) 来进行垃圾回收。
触发条件
- luaC_condGC 的代码实现如下:
// lgc.h
#define luaC_condGC(L,pre,pos) \
{ if (G(L)->GCdebt > 0) { pre; luaC_step(L); pos;}; \
condchangemem(L,pre,pos); }
- 调用 luaC_condGC 方法时,并不是每次都会触发 luaC_step 方法进行单步 gc ,只有当 GCdebt > 0 时,gc 才会继续进行。而 GCdebt 的修改方式有:
- 创建新对象的时候,GCdebt 加上新增对象的大小。
- 释放对象的时候,GCdebt 会减去释放对象的大小。
- 执行 luaC_step 后,如果本轮 gc 没完成,则会修改 GCdebt 的值。
- GCdebt 修改的代码如下:
// lgc.c
static void incstep (lua_State *L, global_State *g) {
int stepmul = (getgcparam(g->gcstepmul) | 1); /* avoid division by 0 */
l_mem debt = (g->GCdebt / WORK2MEM) * stepmul;
l_mem stepsize = (g->gcstepsize <= log2maxs(l_mem))
? ((cast(l_mem, 1) << g->gcstepsize) / WORK2MEM) * stepmul
: MAX_LMEM; /* overflow; keep maximum value */
do { /* repeat until pause or enough "credit" (negative debt) */
lu_mem work = singlestep(L); /* perform one single step */
debt -= work;
} while (debt > -stepsize && g->gcstate != GCSpause);
if (g->gcstate == GCSpause)
setpause(g); /* pause until next cycle */
else {
debt = (debt / stepmul) * WORK2MEM; /* convert 'work units' to bytes */
luaE_setdebt(g, debt);
}
}
/*
** performs a basic GC step if collector is running
*/
void luaC_step (lua_State *L) {
global_State *g = G(L);
lua_assert(!g->gcemergency);
if (g->gcrunning) { /* running? */
if(isdecGCmodegen(g))
genstep(L, g);
else
incstep(L, g);
}
}
- 修改的过程为:
- 通过 g->GCdebt / WORK2MEM ,将当前的 GCdebt 值转化为 TValue 的数量,表示本轮 gc 需要处理的数量 debt 。
- 将上一步得到的 TValue 的个数,乘上 g->gcstepmul 倍数值,即将本轮 gc 处理的数量进行放大。
- 通过 cast(l_mem, 1) « g->gcstepsize 得到单步需要处理的大小,同样转化为 TValue 数量后再乘上倍数,表示单步 gc 处理的数量 stepsize。
- 执行 singlestep 方法,得到处理的 TValue 数量 work ,将 debt 减去 work ,重复执行,结束循环条件有两个:
- 当前状态为 GCSpause ,即本轮 gc 已经完成。
- 当前状态不为 GCSpause ,本次 gc 处理的对象已经达到上限,需要等下一次触发。
- gc 完成时,会调用 setpause 方法修改 g->GCdebt 的值,从而调整下一次 gc 触发的所需新增的内存值。
// lgc.c
static void setpause (global_State *g) {
l_mem threshold, debt;
int pause = getgcparam(g->gcpause);
l_mem estimate = g->GCestimate / PAUSEADJ; /* adjust 'estimate' */
lua_assert(estimate > 0);
threshold = (pause < MAX_LMEM / estimate) /* overflow? */
? estimate * pause /* no overflow */
: MAX_LMEM; /* overflow; truncate to maximum */
debt = gettotalbytes(g) - threshold;
if (debt > 0) debt = 0;
luaE_setdebt(g, debt);
}
- 新的 g->GCdebt 值为当前未释放的总大小减去阈值, 而阈值为 g->GCestimate / PAUSEADJ * pause ,其中:
- g->GCestimate 和 gettotalbytes(g) 一样,表示当前未释放的总内存。
- PAUSEADJ 默认值为 100 。
- pause 为 LUAI_GCPAUSE ,默认值为 200 。
- 因此,阈值为当前未释放总内存的两倍,则 g->GCdebt 会为当前未释放总内存的负数值,也就是说,下一次 gc 开始需要等到内存值达到当前的 2 倍。
- 当内存值较小时,单步 gc 通常能完成所有阶段。随着内存慢慢增大,单步 gc 只能处理一部分阶段,甚至只能处理一个阶段里的一部分对象。此时,每一步能处理的大小为 debt + stepsize ,其中:
- debt 为当前 g->GCdebt 转化为 TValue 个数后,放大 g->gcstepmul 的结果。
- stepsize 为 g->gcstepsize 转化为 TValue 个数后,放大 g->gcstepmul 的结果。
- 由于 g->GCdebt 是增加到正数时,就会触发 gc ,因此,此时的 g->GCdebt 通常为 1 个 TValue 大小的值,而 g->gcstepsize 为 8 KB 。相比较于 g->gcstepsize ,g->GCdebt 可以近似为 0,也就是说,每一步能处理的大小近似为 g->gcstepsize 放大 g->gcstepmul ,即 8KB * 100 。
- 当单步 gc 达到上限值后,同样会修改 g->GCdebt 的值,此时 debt 同样近似 -stepsize ,因此,g->GCdebt 会设置为近似 -8 KB ,即下一次 gc 开始需要等到内存值增加超过 8 KB。
- 可以看到,当单步 gc 无法完成一次完整 gc 时,可以近似认为,内存每增加 8 KB,就会处理 800 KB 的对象,也就是说,g->gcstepmul 代表了每单位新增内存需要 gc 处理的内存大小。
- 然而,当未释放的内存大小超过上限值的一半时,阈值会设置为内存上限值大小,从而 debt 会慢慢接近 0 ,即下次 gc 触发所需的内存增加值会越来越小,也就是说,gc 会越来越频繁。
- 总体来说,如果本轮 gc 未结束,则每次内存新增 8KB 就会触发一次 gc ,直到本轮 gc 结束,则等到内存值达到当前的 2 倍时,会开启新的一轮 gc 。
存在问题
- 一次完整的 gc ,其耗时会随着内存增大而增大,因为内存增大代表需要遍历处理的对象增多,为了避免 gc 引起阻塞,lua 中将 gc 设计成分步 gc 的形式。然而,分步同样也带来了新的问题。由于传播过程是分步执行的,每一步执行过后,都有可能会创建新的对象,并被某些对象引用,此时新对象会设置为白色。如果引用的对象为黑色,表示该对象已经标记完成,子对象也已经加入灰色列表,因此新对象将不会再被标记,在清除阶段,则会被当作不再引用的对象清掉。
- 为了避免出现这种问题,lua 提供了设置屏障的方法,来阻挡 gc 过程,保证新对象能够被正确处理,有两种屏障设置方法:
- luaC_barrier_
- luaC_barrierback_
// lgc.c
void luaC_barrier_ (lua_State *L, GCObject *o, GCObject *v) {
global_State *g = G(L);
lua_assert(isblack(o) && iswhite(v) && !isdead(g, v) && !isdead(g, o));
if (keepinvariant(g)) { /* must keep invariant? */
reallymarkobject(g, v); /* restore invariant */
if (isold(o)) {
lua_assert(!isold(v)); /* white object could not be old */
setage(v, G_OLD0); /* restore generational invariant */
}
}
else { /* sweep phase */
lua_assert(issweepphase(g));
if (g->gckind == KGC_INC) /* incremental mode? */
makewhite(g, o); /* mark 'o' as white to avoid other barriers */
}
}
void luaC_barrierback_ (lua_State *L, GCObject *o) {
global_State *g = G(L);
lua_assert(isblack(o) && !isdead(g, o));
lua_assert((g->gckind == KGC_GEN) == (isold(o) && getage(o) != G_TOUCHED1));
if (getage(o) == G_TOUCHED2) /* already in gray list? */
set2gray(o); /* make it gray to become touched1 */
else /* link it in 'grayagain' and paint it gray */
linkobjgclist(o, g->grayagain);
if (isold(o)) /* generational mode? */
setage(o, G_TOUCHED1); /* touched in current cycle */
}
- 其中,新对象 v 为白色,父对象 o 为黑色。
- luaC_barrier_ 方法,如果当前 gc 状态在 GCSatomic 之前,则将新对象标记为灰色,加入到 g->gray 列表中。如果已经进入清除阶段,则将父对象设置为白色。通常用于引用关系变化较少的情况,如: metatable 的创建和设置。
- luaC_barrierback_ 方法,则将父对象标记为灰色,加入到 g->grayagain 列表中。通常用于引用欢喜变化频繁的情况,如:table 的 key-value 对象创建修改。
- 当父对象已经为黑色时,为了避免新对象被清除,就需要通过 luaC_barrier_ 方法,将新对象也标记为灰色,进入到本轮 gc 标记处理过程。然而,这个新对象从灰色列表取出前,可能已经不被父对象引用,那这个新对象都不需要修改标记,只要保持白色等待被清除即可。
- 以 table 为例,当 table 被标记为黑色后,创建了一个新的对象 value1 ,设置到 table[key] 上,之后又创建了一个新对象 value2 ,设置到 table[key] 上。当这个过程非常频繁时,就会出现大量的对象加入到 g->gray 列表,增加了标记过程的持续时间。
- 为了避免这种情况,可以把新对象的父对象,即把 table 标记为灰色,加入到 g->gray 列表中,这样就只需要对 table 重新标记。然而,这种情况下,仍可能出现,table 刚从灰色标记为黑色,又因为引用关系修改,再标记为灰色,而后再标记为黑色,又因为引用关系修改,在黑色和灰色之间频繁变化。
- 基于这种情况,luaC_barrierback_ 方法将对象加入到 g->grayagain 列表中,而 g->grayagain 在原子阶段中,会将所有对象都处理完成后才会结束。g->grayagain 列表存放的对象表示会频繁变换标记颜色,如果对 g->grayagain 列表中的对象进行分步处理,则 g->grayagain 列表就会变成和 g->gray 列表一样,对象会反复在黑色和灰色之间变换,从而造成处理周期增长,影响性能。
- 因此,原子阶段是必不可少的。传播阶段尽可能将对象标记过程分摊成多次 gc 步骤,再由原子阶段不中断地将剩下所有对象标记完成,才能顺利过渡到清除阶段。
总结
- 总体来说,lua 的 gc 是优化版的标记清除算法,将一个庞大的 gc 过程拆分成多个小步骤,穿插在新对象创建的过程中处理,从而保证了 gc 在尽可能少占用主线程资源的情况下持续推进,实现较好的内存管理。然而,即便是再好的机制,也需要开发者遵循良好的使用规则,例如:尽量不要频繁创建大量的对象,全局表的对象不需要使用的时候进行删除(设置为 nil)等。