Linux用户态跟内核态内存管理技术

Linux用户态和内核态内存管理技术

 

通常程序访问的地址都是虚拟地址,用32位操作系统来讲,访问的地址空间为4Glinux4G分为两部分。如图1所示,其中0~3G为用户空间,3~4G为内核空间。通过MMU这两部分空间都可以访问到实际的物理内存。

进程在用户态只能访问0~3G,只有进入内核态才能访问3G~4G  
 
   *进程通过系统调用进入内核态
   
*每个进程虚拟空间的3G~4G部分是相同的  
   
*进程从用户态进入内核态不会引起CR3的改变但会引起堆栈的改变

Linux用户态跟内核态内存管理技术

1

Linux用户态跟内核态内存管理技术

 

1 虚拟地址和物理地址之间的映射关系

页作为基本的映射单元,一页的大小一般为4K,用户空间不是特别复杂,但内核空间又将1G的虚拟空间按区划分为3个部分:ZONE_DMA内存开始的16MB ZONE_NORMAL16MB~896MBZONE_HIGHMEM896MB ~ 结束

为什么要有高端内存的概念呢

   如逻辑地址0xc0000003对应的物理地址为0×30xc0000004对应的物理地址为0×4… …,逻辑地址与物理地址对应的关系为

物理地址 =逻辑地址 – 0xC0000000

逻辑地址

物理内存地址

0xc0000000

0×0

0xc0000001

0×1

0xc0000002

0×2

0xc0000003

0×3

0xe0000000

0×20000000

0xffffffff

0×40000000 ??

设按照上述简单的地址映射关系,那么内核逻辑地址空间访问为0xc0000000 ~ 0xffffffff,那么对应的物理内存范围就为0×0 ~ 0×40000000,即只能访问1G物理内存。若机器中安装8G物理内存,那么内核就只能访问前1G物理内存,后面7G物理内存将会无法访问,因为内核的地址空间已经全部映射到物理内存地址范围0×0 ~ 0×40000000。即使安装了8G物理内存,那么物理地址为0×40000001的内存,内核该怎么去访问呢?代码中必须要有内存逻辑地址的,0xc0000000 ~ 0xffffffff的地址空间已经被用完了,所以无法访问物理地址0×40000000以后的内存

Linux用户态跟内核态内存管理技术

            2

Linux用户态跟内核态内存管理技术

              3


   前面我们解释了高端内存的由来。 Linux将内核地址空间划分为三部分ZONE_DMAZONE_NORMALZONE_HIGHMEM,高端内存HIGH_MEM地址空间范围为 0xF8000000 ~ 0xFFFFFFFF896MB1024MB)。那么如内核是如何借助128MB高端内存地址空间是如何实现访问可以所有物理内存

当内核想访问高于896MB物理地址内存时,从0xF8000000 ~ 0xFFFFFFFF地址空间范围内找一段相应大小空闲的逻辑地址空间,借用一会。借用这段逻辑地址空间,建立映射到想访问的那段物理内存(即填充内核PTE页面表),临时用一会,用完后归还。这样别人也可以借用这段地址空间访问其他物理内存,实现了使用有限的地址空间,访问所有所有物理内存。如图3

2 进程在用户空间和内核空间的切换问题

    内核在创建进程的时候,在创建task_struct的同事,会为进程创建相应的堆栈。每个进程会有两个栈,一个用户栈,存在于用户空间,一个内核栈,存在于内核空间。当进程在用户空间运行时,cpu堆栈指针寄存器里面的内容是用户堆栈地址,使用用户栈;当进程在内核空间时,cpu堆栈指针寄存器里面的内容是内核栈空间地址,使用内核栈。

    当进程因为中断或者系统调用而陷入内核态之行时,进程所使用的堆栈也要从用户栈转到内核栈。

    进程陷入内核态后,先把用户态堆栈的地址保存在内核栈之中,然后设置堆栈指针寄存器的内容为内核栈的地址,这样就完成了用户栈向内核栈的转换;当进程从内核态恢复到用户态之行时,在内核态之行的最后将保存在内核栈里面的用户栈的地址恢复到堆栈指针寄存器即可。这样就实现了内核栈和用户栈的互转。

    那么,我们知道从内核转到用户态时用户栈的地址是在陷入内核的时候保存在内核栈里面的,但是在陷入内核的时候,我们是如何知道内核栈的地址的呢?

    关键在进程从用户态转到内核态的时候,进程的内核栈总是空的。这是因为,当进程在用户态运行时,使用的是用户栈,当进程陷入到内核态时,内核栈保存进程在内核态运行的相关信息,但是一旦进程返回到用户态后,内核栈中保存的信息无效,会全部恢复,因此每次进程从用户态陷入内核的时候得到的内核栈都是空的。所以在进程陷入内核的时候,直接把内核栈的栈顶地址给堆栈指针寄存器就可以了。