地图的collect和spill过程解析

map的collect和spill过程解析
Map的输出缓冲是一个循环缓冲,collect和spill是在kvstart、kvend和kvindex三个指针的引导下进行的。初始时kvstart=kvend=kvindex=0
1、MapTask的collect过程
 collect是一个向缓冲区放东西的过程。此时,kvstart和kvend不动,每放一条记录,kvindex都会向后移动一位。
2、spillThread的spill过程
   spill是一个从缓冲区取东西的一个过程,当发生spill时,首先让kvend指向kvindex,即kvend=kvindex,然后kvstart向前移动,每移动一位就取出一条记录写回磁盘,当spill结束时,kvstart和kvend相遇,即kvstart=kvend,为下次collect又做好准备。