一 Windows 2000内存篇 分页机制介绍

基本概念
Windows 2000 使用基于分页机制的虚拟内存 。每个进程有4GB的虚拟地址空间 。基于分页机制,这4GB地址空间的一些部分被映射了物理内存,一些部分映射硬盘上的交换文件,一些部分什么也没有映射 。程序中使用的都是4GB地址空间中的虚拟地址 。而访问物理内存,需要使用物理地址 。
下面我们看看什么是物理地址,什么是虚拟地址 。
物理地址 (physical address): 放在寻址总线上的地址 。放在寻址总线上,如果是读,电路根据这个地址每位的值就将相应地址的物理内存中的数据放到数据总线中传输 。如果是写,电路根据这个地址每位的值就将相应地址的物理内存中放入数据总线上的内容 。物理内存是以字节(8位)为单位编址的 。
虚拟地址 (virtual address): 4G虚拟地址空间中的地址,程序中使用的都是虚拟地址 。
如果CPU寄存器中的分页标志位被设置,那么执行内存操作的机器指令时,CPU会自动根据页目录和页表中的信息,把虚拟地址转换成物理地址,完成该指令 。比如 mov eax,004227b8h,这是把地址004227b8h处的值赋给寄存器的汇编代码,004227b8这个地址就是虚拟址 。CPU在执行这行代码时,发现寄存器中的分页标志位已经被设定,就自动完成虚拟地址到物理地址的转换,使用物理地址取出值,完成指令 。对于Intel CPU 来说,分页标志位是寄存器CR0的第31位,为1表示使用分页,为0表示不使用分页 。对于初始化之后的 Win2k 我们观察CR0,发现第31位为1 。表明Win2k是使用分页的 。
【一 Windows 2000内存篇 分页机制介绍】 使用了分页机制之后,4G的地址空间被分成了固定大小的页,每一页或者被映射到物理内存,或者被映射到硬盘上的交换文件中,或者没有映射任何东西 。对于一般程序来说,4G的地址空间,只有一小部分映射了物理内存,大片大片的部分是没有映射任何东西 。物理内存也被分页,来映射地址空间 。对于32bit的Win2k,页的大小是4K字节 。CPU用来把虚拟地址转换成物理地址的信息存放在叫做页目录和页表的结构里 。
物理内存分页,一个物理页的大小为4K字节,第0个物理页从物理地址 0x00000000 处开始 。由于页的大小为4KB,就是0x1000字节,所以第1页从物理地址 0x00001000处开始 。第2页从物理地址0x00002000处开始 。可以看到由于页的大小是4KB,所以只需要32bit的地址中高20bit来寻址物理页 。
页表,一个页表的大小为4K字节,放在一个物理页中 。由1024个4字节的页表项组成 。页表项的大小为4个字节(32bit),所以一个页表中有1024个页表项 。页表中的每一项的内容(每项4个字节,32bit)高20bit用来放一个物理页的物理地址,低12bit放着一些标志 。
页目录,一个页目录大小为4K字节,放在一个物理页中 。由1024个4字节的页目录项组成 。页目录项的大小为4个字节(32bit),所以一个页目录中有1024个页目录项 。页目录中的每一项的内容(每项4个字节)高20bit用来放一个页表(页表放在一个物理页中)的物理地址,低12bit放着一些标志 。
对于x86系统,页目录的物理地址放在CPU的CR3寄存器中 。
CPU把虚拟地址转换成物理地址:
一个虚拟地址,大小4个字节(32bit),包含着找到物理地址的信息,分为3个部分:第22位到第31位这10位(最高10位)是页目录中的索引,第12位到第21位这10位是页表中的索引,第0位到第11位这12位(低12位)是页内偏移 。对于一个要转换成物理地址的虚拟地址,CPU首先根据CR3中的值,找到页目录所在的物理页 。然后根据虚拟地址的第22位到第31位这10位(最高的10bit)的值作为索引,找到相应的页目录项(PDE,page Directory entry),页目录项中有这个虚拟地址所对应页表的物理地址 。有了页表的物理地址,根据虚拟地址的第12位到第21位这10位的值作为索引,找到该页表中相应的页表项(PTE,page table entry),页表项中就有这个虚拟地址所对应物理页的物理地址 。最后用虚拟地址的最低12位,也就是页内偏移,加上这个物理页的物理地址,就得到了该虚拟地址所对应的物理地址 。

推荐阅读