5 通往32位模式之路
我们一直都没有说明asmhead.nas中的如同谜一样的大约100行程序。等笔者回过神儿来,已经到了可以说明的时候了。现在就是个好机会,我们来具体看看。
在没有说明的这段程序中,最开始做的事情如下:
asmhead.nas节选
; PIC关闭一切中断 ; 根据AT兼容机的规格,如果要初始化PIC, ; 必须在CLI之前进行,否则有时会挂起。 ; 随后进行PIC的初始化。 MOV AL,0xff OUT 0x21, AL NOP ; 如果连续执行OUT指令,有些机种会无法正常运行 OUT 0xa1, AL CLI ; 禁止CPU级别的中断
这段程序等同于以下内容的C程序。
io_out(PIC0_IMR, 0xff); /* 禁止主PIC的全部中断 */ io_out(PIC1_IMR, 0xff); /* 禁止从PIC的全部中断 */ io_cli(); /* 禁止CPU级别的中断*/
如果当CPU进行模式转换时进来了中断信号,那可就麻烦了。而且,后来还要进行PIC的初始化,初始化时也不允许有中断发生。所以,我们要把中断全部屏蔽掉。
顺便说一下,NOP指令什么都不做,它只是让CPU休息一个时钟长的时间。
■■■■■
再往下看,会看到以下部分。
asmhead.nas节选(续)
; 为了让CPU能够访问1MB以上的内存空间,设定A20GATE CALL waitkbdout MOV AL,0xd1 OUT 0x64, AL CALL waitkbdout MOV AL,0xdf ; enable A20 OUT 0x60, AL CALL waitkbdout
这里的waitkbdout,等同于wait_KBC_sendready(以后还会详细说明)。这段程序在C语言里的写法大致如下:
#define KEYCMD_WRITE_OUTPORT 0xd1 #define KBC_OUTPORT_A20G_ENABLE 0xdf /* A20GATE的设定 */ wait_KBC_sendready(); io_out8(PORT_KEYCMD, KEYCMD_WRITE_OUTPORT); wait_KBC_sendready(); io_out8(PORT_KEYDAT, KBC_OUTPORT_A20G_ENABLE); wait_KBC_sendready(); /* 这句话是为了等待完成执行指令 */
程序的基本结构与init_keyboard完全相同,功能仅仅是往键盘控制电路发送指令。
这里发送的指令,是指令键盘控制电路的附属端口输出0xdf。这个附属端口,连接着主板上的很多地方,通过这个端口发送不同的指令,就可以实现各种各样的控制功能。
这次输出0xdf所要完成的功能,是让A20GATE信号线变成ON的状态。这条信号线的作用是什么呢?它能使内存的1MB以上的部分变成可使用状态。最初出现电脑的时候,CPU只有16位模式,所以内存最大也只有1MB。后来CPU变聪明了,可以使用很大的内存了。但为了兼容旧版的操作系统,在执行激活指令之前,电路被限制为只能使用1MB内存。和鼠标的情况很类似哟。A20GATE信号线正是用来使这个电路停止从而让所有内存都可以使用的东西。
最后还有一点,“wait_KBC_sendready(); ”是多余的。在此之后,虽然不会往键盘送命令,但仍然要等到下一个命令能够送来为止。这是为了等待A20GATE的处理切实完成。
■■■■■
我们再往下看。
asmhead.nas节选(续)
; 切换到保护模式 [INSTRSET "i486p"] ; “想要使用486指令”的叙述 LGDT [GDTR0] ; 设定临时GDT MOV EAX, CR0 AND EAX,0x7fffffff;设bit31为0(为了禁止分页) OR EAX,0x00000001;设bit0为1(为了切换到保护模式) MOV CR0, EAX JMP pipelineflush pipelineflush: MOV AX,1*8 ; 可读写的段 32bit MOV DS, AX MOV ES, AX MOV FS, AX MOV GS, AX MOV SS, AX
INSTRSET指令,是为了能够使用386以后的LGDT, EAX, CR0等关键字。
LGDT指令,不管三七二十一,把随意准备的GDT给读进来。对于这个暂定的GDT,我们以后还要重新设置。然后将CR0这一特殊的32位寄存器的值代入EAX,并将最高位置为0,最低位置为1,再将这个值返回给CR0寄存器。这样就完成了模式转换,进入到不用颁的保护模式。CR0,也就是control register 0,是一个非常重要的寄存器,只有操作系统才能操作它。
保护模式与先前的16位模式不同,段寄存器的解释不是16倍,而是能够使用GDT。这里的“保护”,来自英文的“protect”。在这种模式下,应用程序既不能随便改变段的设定,又不能使用操作系统专用的段。操作系统受到CPU的保护,所以称为保护模式。
在保护模式中,有带保护的16位模式,和带保护的32位模式两种。我们要使用的,是带保护的32位模式。
讲解CPU的书上会写到,通过代入CR0而切换到保护模式时,要马上执行JMP指令。所以我们也执行这一指令。为什么要执行JMP指令呢?因为变成保护模式后,机器语言的解释要发生变化。CPU为了加快指令的执行速度而使用了管道(pipeline)这一机制,就是说,前一条指令还在执行的时候,就开始解释下一条甚至是再下一条指令。因为模式变了,就要重新解释一遍,所以加入了JMP指令。
而且在程序中,进入保护模式以后,段寄存器的意思也变了(不再是乘以16后再加算的意思了),除了CS以外所有段寄存器的值都从0x0000变成了0x0008。CS保持原状是因为如果CS也变了,会造成混乱,所以只有CS要放到后面再处理。0x0008,相当于“gdt + 1”的段。
■■■■■
我们再往下读程序。
asmhead.nas节选(续)
; bootpack的转送 MOV ESI, bootpack ; 转送源 MOV EDI, BOTPAK ; 转送目的地 MOV ECX,512*1024/4 CALL memcpy ; 磁盘数据最终转送到它本来的位置去 ; 首先从启动扇区开始 MOV ESI,0x7c00 ; 转送源 MOV EDI, DSKCAC ; 转送目的地 MOV ECX,512/4 CALL memcpy ; 所有剩下的 MOV ESI, DSKCAC0+512 ; 转送源 MOV EDI, DSKCAC+512 ; 转送目的地 MOV ECX,0 MOV CL, BYTE [CYLS] IMUL ECX,512*18*2/4 ; 从柱面数变换为字节数/4 SUB ECX,512/4 ; 减去IPL CALL memcpy
简单来说,这部分程序只是在调用memcpy函数。为了让大家掌握这段程序的大意,我们将这段程序写成了C语言形式。虽然写法本身可能不很正确,但有助于大家抓住程序的中心思想。
memcpy(bootpack, BOTPAK, 512*1024/4); memcpy(0x7c00, DSKCAC, 512/4 ); memcpy(DSKCAC0+512, DSKCAC+512, cyls * 512*18*2/4-512/4);
函数memcpy是复制内存的函数,语法如下:
memcpy(转送源地址,转送目的地址,转送数据的大小);
转送数据大小是以双字为单位的,所以数据大小用字节数除以4来指定。在上面3个memcpy语句中,我们先来看看中间一句。
memcpy(0x7c00, DSKCAC, 512/4);
DSKCAC是0x00100000,所以上面这句话的意思就是从0x7c00复制512字节到0x00100000。这正好是将启动扇区复制到1MB以后的内存去的意思。下一个memcpy语句:
memcpy(DSKCAC0+512, DSKCAC+512, cyls * 512*18*2/4-512/4);
它的意思就是将始于0x00008200的磁盘内容,复制到0x00100200那里。
上文中“转送数据大小”的计算有点复杂,因为它是以柱面数来计算的,所以需要减去启动区的那一部分长度。这样始于0x00100000的内存部分,就与磁盘的内容相吻合了。顺便说一下,IMUL是乘法运算,SUB是减法运算。它们与ADD(加法)运算同属一类。
现在我们还没说明的函数就只有有程序开始处的memcpy了。bootpack是asmhead.nas的最后一个标签。haribote.sys是通过asmhead.bin和bootpack.hrb连接起来而生成的(可以通过Makefile确认),所以asmhead结束的地方,紧接着串连着bootpack.hrb最前面的部分。
memcpy(bootpack, BOTPAK, 512*1024/4); → 从bootpack的地址开始的512KB内容复制到0x00280000号地址去。
这就是将bootpack.hrb复制到0x00280000号地址的处理。为什么是512KB呢?这是我们酌情考虑而决定的。内存多一些不会产生什么问题,所以这个长度要比bootpack.hrb的长度大出很多。
■■■■■
后面还剩50行程序,我们继续往下看。
asmhead.nas节选(续)
; 必须由asmhead来完成的工作,至此全部完毕 ; 以后就交由bootpack来完成 ; bootpack的启动 MOV EBX, BOTPAK MOV ECX, [EBX+16] ADD ECX,3 ; ECX += 3; SHR ECX,2 ; ECX /= 4; JZ skip ; 没有要转送的东西时 MOV ESI, [EBX+20] ; 转送源 ADD ESI, EBX MOV EDI, [EBX+12] ; 转送目的地 CALL memcpy skip: MOV ESP, [EBX+12] ; 栈初始值 JMP DWORD 2*8:0x0000001b
结果我们仍然只是在做memcpy。它对bootpack.hrb的header(头部内容)进行解析,将执行所必需的数据传送过去。EBX里代入的是BOTPAK,所以值如下:
[EBX + 16]......bootpack.hrb之后的第16号地址。值是0x11a8 [EBX + 20]......bootpack.hrb之后的第20号地址。值是0x10c8 [EBX + 12]......bootpack.hrb之后的第12号地址。值是0x00310000
上面这些值,是我们通过二进制编辑器,打开harib05d的bootpack.hrb后确认的。这些值因harib的版本不同而有所变化。
SHR指令是向右移位指令,相当于“ECX >>=2; ”,与除以4有着相同的效果。因为二进制的数右移1位,值就变成了1/2;左移1位,值就变成了2倍。这可能不太容易理解。还是拿我们熟悉的十进制来思考一下吧。十进制的时候,向右移动1位,值就变成了1/10(比如120 → 12);向左移动1位,值就变成了10倍(比如3 → 30)。二进制也是一样。所以,向右移动2位,正好与除以4有着同样的效果。
JZ是条件跳转指令,来自英文jump if zero,根据前一个计算结果是否为0来决定是否跳转。在这里,根据SHR的结果,如果ECX变成了0,就跳转到skip那里去。在harib05d里,ECX没有变成0,所以不跳转。
而最终这个memcpy到底用来做什么事情呢?它会将bootpack.hrb第0x10c8字节开始的0x11a8字节复制到0x00310000号地址去。大家可能不明白为什么要做这种处理,但这个问题,必须要等到“纸娃娃系统”的应用程序讲完之后才能讲清楚,所以大家现在不懂也没关系,我们以后还会说明的。
最后将0x310000代入到ESP里,然后用一个特别的JMP指令,将2 * 8代入到CS里,同时移动到0x1b号地址。这里的0x1b号地址是指第2个段的0x1b号地址。第2个段的基地址是0x280000,所以实际上是从0x28001b开始执行的。这也就是bootpack.hrb的0x1b号地址。
这样就开始执行bootpack.hrb了。
■■■■■
下面要讲的内容可能有点偏离主题,但笔者还是想介绍一下“纸娃娃系统”的内存分布图。
0x00000000-0x000fffff : 虽然在启动中会多次使用,但之后就变空。(1MB) 0x00100000-0x00267fff : 用于保存软盘的内容。(1440KB) 0x00268000-0x0026f7ff : 空(30KB) 0x0026f800-0x0026ffff : IDT(2KB) 0x00270000-0x0027ffff : GDT(64KB) 0x00280000-0x002fffff : bootpack.hrb(512KB) 0x00300000-0x003fffff : 栈及其他(1MB) 0x00400000- : 空
这个内存分布图当然是笔者所做出来的。为什么要做成这呢?其实也没有什么特别的理由,觉得这样还行,跟着感觉走就决定了。另外,虽然没有明写,但在最初的1MB范围内,还有BIOS, VRAM等内容,也就是说并不是1MB全都空着。
从软盘读出来的东西,之所以要复制到0x00100000号以后的地址,就是因为我们意识中有这个内存分布图。同样,前几天,之所以能够确定正式版的GDT和IDT的地址,也是因为这个内存分布图。
如果一开始就制作内存分布图,那么做起操作系统来就会顺利多了。
■■■■■
关于内存分布图就讲这么多,还是让我们回到asmhead.nas的说明上来吧。
asmhead.nas节选(续)
waitkbdout: IN AL,0x64 AND AL,0x02 IN AL,0x60 ; 空读(为了清空数据接收缓冲区中的垃圾数据) JNZ waitkbdout ; AND的结果如果不是0,就跳到waitkbdout RET
这就是waitkbdout所完成的处理。基本上,如前面所说的那样,它与wait_KBC_sendready相同,但也添加了部分处理,就是从Ox60号设备进行IN的处理。也就是说,如果控制器里有键盘代码,或者是已经累积了鼠标数据,就顺便把它们读取出来。
JNZ与JZ相反,意思是“jump if not zero”。
■■■■■
只剩下一点点内容了,下面是memcpy程序。
asmhead.nas节选(续)
memcpy: MOV EAX, [ESI] ADD ESI,4 MOV [EDI], EAX ADD EDI,4 SUB ECX,1 JNZ memcpy ; 减法运算的结果如果不是0,就跳转到memcpy RET
这是复制内存的程序。不用笔者解释,大家也能明白。
■■■■■
最后是剩下来的全部内容。
asmhead.nas节选(续)
ALIGNB 16 GDT0: RESB 8 ; NULL selector DW 0xffff,0x0000,0x9200,0x00cf ; 可以读写的段(segment)32bit DW 0xffff,0x0000,0x9a28,0x0047 ; 可以执行的段(segment)32bit(bootpack用) DW 0 GDTR0: DW 8*3-1 DD GDT0 ALIGNB 16 bootpack:
ALIGNB指令的意思是,一直添加DBO,直到时机合适的时候为止。什么是“时机合适”呢?大家可能有点不明白。ALIGNB 16的情况下,地址能被16整除的时候,就称为“时机合适”。如果最初的地址能被16整除,则ALIGNB指令不作任何处理。
如果标签GDT0的地址不是8的整数倍,向段寄存器复制的MOV指令就会慢一些。所以我们插入了ALIGNB指令。但是如果这样,“ALIGNB 8”就够了,用“ALIGNB 16”有点过头了。最后的“bootpack:”之前,也是“时机合适”的状态,所以笔者就适当加了一句“ALIGNB 16”。
GDT0也是一种特定的GDT。0号是空区域(null sector),不能够在那里定义段。1号和2号分别由下式设定。
set_segmdesc(gdt + 1, 0xffffffff, 0x00000000, AR_DATA32_RW); set_segmdesc(gdt + 2, LIMIT_BOTPAK, ADR_BOTPAK, AR_CODE32_ER);
我们用纸笔事先计算了一下,然后用DW排列了出来。
GDTR0是LGDT指令,意思是通知GDT0说“有了GDT哟”。在GDT0里,写入了16位的段上限,和32位的段起始地址。
■■■■■
到此为止,关于asmhead.nas的说明就结束了。就是说,最初状态时,GDT在asmhead.nas里,并不在0x00270000~0x0027ffff的范围里。IDT连设定都没设定,所以仍处于中断禁止的状态。应当趁着硬件上积累过多数据而产生误动作之前,尽快开放中断,接收数据。
因此,在bootpack.c的HariMain里,应该在进行调色板(palette)的初始化以及画面的准备之前,先赶紧重新创建GDT和IDT,初始化PIC,并执行“io_sti(); ”。
bootpack.c节选
void HariMain(void) { struct BOOTINFO *binfo = (struct BOOTINFO *) ADR_BOOTINFO; char s[40], mcursor[256], keybuf[32], mousebuf[128]; int mx, my, i; struct MOUSE_DEC mdec; init_gdtidt(); init_pic(); io_sti(); /* IDT/PIC的初始化已经完成,于是开放CPU的中断 */ fifo8_init(&keyfifo, 32, keybuf); fifo8_init(&mousefifo, 128, mousebuf); io_out8(PIC0_IMR, 0xf9); /* 开放PIC1和键盘中断(11111001) */ io_out8(PIC1_IMR, 0xef); /* 开放鼠标中断(11101111) */ init_keyboard(); init_palette(); init_screen8(binfo->vram, binfo->scrnx, binfo->scrny);
■■■■■
夜已经深了,今天就到此为止。在考虑明天要做什么的同时,笔者也决定要睡觉了。晚安!