接我的上一 篇博客
当成功跳转到loader时,所有的指挥权就都在loader手中,因为上文boot.bin中我们只实现了寻找,加载并跳入loader,而在操作系统内核执行之前的加载内核,跳入保护模式等步骤都没有完成。可想而知,这些任务都要交给Loader来完成。
一.加载内核
1.认识内核格式elf
elf文件由4个部分组成,分别是ELF header,Program header table,Sections和Section header table,其中只有ELF头的位置是固定的。
ELF的格式大致如下:
而ELF头格式如代码所示:
#define EI_NIDENT 16
typedef struct{ //大小
unsigned char e_ident[EI_NIDENT]; //16 包含用以表示ELF文件的字符及其他
Elf32_Half e_type; //2 文件类型(可执行文件为2)
Elf32_Half e_machine; //2 该程序的体系结构
Elf32_word e_version; //4 文件版本
Elf32_Addr e_entry; //4 程序入口地址
Elf32_Off e_phoff; //4 Program header table在文件的偏移
Elf32_Off e_shoff; // Section header table的偏移
Elf32_word e_flags; // 为0
Elf32_Half e_ehsize; // Elf header大小
Elf32_Half e_phentsize; // Program header table每个条目大小
Elf32_Half e_phnum; // Program header table的条目数
Elf32_Half e_shentsize; // Section header table条目大小
Elf32_Half e_shnum; // Section header table的条目数
Elf32_Half e _shstrndx; // 包含节名称的字符串表是第几个节
}Elf32_Ehdr;
为了完成加载并跳入内核,我们暂时只需要知道以上的e_entry,e_phoff,e_ehsize,e_phentsize,e_phnum
以及Program header 的结构
typedef struct{
Elf32_word p_type; //所描述的段的类型
Elf32_Off p_offset; //段的第一个字节在文件中的偏移
Elf32_Addr p_vaddr; //段的第一个字节在内存中的虚拟地址
Elf32_Addr p_paddr; //为物理地址保留
Elf32_word p_filesz; //段在文件中的长度
Elf32_word p_memsz; //段在内存中的长度
Elf32_word p_flags; //与段相关的标志
Elf32_word p_align; //根据此项值来确定段在文件以及内存中如何对齐
}Elf32_Phdr;
所以Program header描述了一个段的信息,我们把文件加载进内存就靠这些信息。
其他我们先不管。
假设我们已经有一个内核代码kernel.asm,我们用nasm的选项-f elf指定输出文件为elf文件格式。
nasm -f elf -o kernel.o kernel.asm
ld -s kernel.o -o kernel.bin
2.寻找并加载内核
我们把生成的内核拷贝到软盘上,然后修改loader.asm实现在软盘上寻找并加载内核到指定位置。
步骤同上文boot中寻找loader并加载。加载完成后关闭软驱马达,并显示一个字符串,具体代码如下:
org 0100h BaseOfStack equ 0100h BaseOfKernelFile equ 08000h ; KERNEL.BIN 被加载到的位置 ---- 段地址 OffsetOfKernelFile equ 0h ; KERNEL.BIN 被加载到的位置 ---- 偏移地址 jmp LABEL_START ; Start ; 下面是 FAT12 磁盘的头, 之所以包含它是因为下面用到了磁盘的一些信息 %include "fat12hdr.inc" LABEL_START: ; <--- 从这里开始 ************* mov ax, cs mov ds, ax mov es, ax mov ss, ax mov sp, BaseOfStack mov dh, 0 ; "Loading " call DispStr ; 显示字符串 ; 下面在 A 盘的根目录寻找 KERNEL.BIN mov word [wSectorNo], SectorNoOfRootDirectory xor ah, ah ; `. xor dl, dl ; | 软驱复位 int 13h ; / LABEL_SEARCH_IN_ROOT_DIR_BEGIN: cmp word [wRootDirSizeForLoop], 0 ; `. jz LABEL_NO_KERNELBIN ; | 判断根目录区是不是已经读完, dec word [wRootDirSizeForLoop] ; / 读完表示没有找到 KERNEL.BIN mov ax, BaseOfKernelFile mov es, ax ; es <- BaseOfKernelFile mov bx, OffsetOfKernelFile ; bx <- OffsetOfKernelFile mov ax, [wSectorNo] ; ax <- Root Directory 中的某 Sector 号 mov cl, 1 call ReadSector mov si, KernelFileName ; ds:si -> "KERNEL BIN" mov di, OffsetOfKernelFile cld mov dx, 10h LABEL_SEARCH_FOR_KERNELBIN: cmp dx, 0 ; `. jz LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR; | 循环次数控制, 如果已经读完 dec dx ; / 了一个 Sector, 就跳到下一个 mov cx, 11 LABEL_CMP_FILENAME: cmp cx, 0 ; `. jz LABEL_FILENAME_FOUND ; | 循环次数控制, 如果比较了 11 个字符都 dec cx ; / 相等, 表示找到 lodsb ; ds:si -> al cmp al, byte [es:di] ; if al == es:di jz LABEL_GO_ON jmp LABEL_DIFFERENT LABEL_GO_ON: inc di jmp LABEL_CMP_FILENAME ; 继续循环 LABEL_DIFFERENT: and di, 0FFE0h ; else`. 让 di 是 20h 的倍数 add di, 20h ; | mov si, KernelFileName ; | di += 20h 下一个目录条目 jmp LABEL_SEARCH_FOR_KERNELBIN; / LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR: add word [wSectorNo], 1 jmp LABEL_SEARCH_IN_ROOT_DIR_BEGIN LABEL_NO_KERNELBIN: mov dh, 2 ; "No KERNEL." call DispStr ; 显示字符串 %ifdef _LOADER_DEBUG_ mov ax, 4c00h ; `. int 21h ; / 没有找到 KERNEL.BIN, 回到 DOS %else jmp $ ; 没有找到 KERNEL.BIN, 死循环在这里 %endif LABEL_FILENAME_FOUND: ; 找到 KERNEL.BIN 后便来到这里继续 mov ax, RootDirSectors and di, 0FFF0h ; di -> 当前条目的开始 push eax mov eax, [es : di + 01Ch] ; `. mov dword [dwKernelSize], eax ; / 保存 KERNEL.BIN 文件大小 pop eax add di, 01Ah ; di -> 首 Sector mov cx, word [es:di] push cx ; 保存此 Sector 在 FAT 中的序号 add cx, ax add cx, DeltaSectorNo ; cl <- KERNEL.BIN 的起始扇区号(0-based) mov ax, BaseOfKernelFile mov es, ax ; es <- BaseOfKernelFile mov bx, OffsetOfKernelFile ; bx <- OffsetOfKernelFile mov ax, cx ; ax <- Sector 号 LABEL_GOON_LOADING_FILE: push ax ; `. push bx ; | mov ah, 0Eh ; | 每读一个扇区就在 "Loading " 后面 mov al, '.' ; | 打一个点, 形成这样的效果: mov bl, 0Fh ; | Loading ...... int 10h ; | pop bx ; | pop ax ; / mov cl, 1 call ReadSector pop ax ; 取出此 Sector 在 FAT 中的序号 call GetFATEntry cmp ax, 0FFFh jz LABEL_FILE_LOADED push ax ; 保存 Sector 在 FAT 中的序号 mov dx, RootDirSectors add ax, dx add ax, DeltaSectorNo add bx, [BPB_BytsPerSec] jmp LABEL_GOON_LOADING_FILE LABEL_FILE_LOADED: call KillMotor ; 关闭软驱马达 mov dh, 1 ; "Ready." call DispStr ; 显示字符串 jmp $ ;============================================================================ ;变量 ;---------------------------------------------------------------------------- wRootDirSizeForLoop dw RootDirSectors ; Root Directory 占用的扇区数 wSectorNo dw 0 ; 要读取的扇区号 bOdd db 0 ; 奇数还是偶数 dwKernelSize dd 0 ; KERNEL.BIN 文件大小 ;============================================================================ ;字符串 ;---------------------------------------------------------------------------- KernelFileName db "KERNEL BIN", 0 ; KERNEL.BIN 之文件名 ; 为简化代码, 下面每个字符串的长度均为 MessageLength MessageLength equ 9 LoadMessage: db "Loading " Message1 db "Ready. " Message2 db "No KERNEL" ;============================================================================ ;---------------------------------------------------------------------------- ; 函数名: DispStr ;---------------------------------------------------------------------------- ; 作用: ; 显示一个字符串, 函数开始时 dh 中应该是字符串序号(0-based) DispStr: mov ax, MessageLength mul dh add ax, LoadMessage mov bp, ax ; ┓ mov ax, ds ; ┣ ES:BP = 串地址 mov es, ax ; ┛ mov cx, MessageLength ; CX = 串长度 mov ax, 01301h ; AH = 13, AL = 01h mov bx, 0007h ; 页号为0(BH = 0) 黑底白字(BL = 07h) mov dl, 0 add dh, 3 ; 从第 3 行往下显示 int 10h ; int 10h ret ;---------------------------------------------------------------------------- ; 函数名: ReadSector ;---------------------------------------------------------------------------- ; 作用: ; 从序号(Directory Entry 中的 Sector 号)为 ax 的的 Sector 开始, 将 cl 个 Sector 读入 es:bx 中 ReadSector: ; ----------------------------------------------------------------------- ; 怎样由扇区号求扇区在磁盘中的位置 (扇区号 -> 柱面号, 起始扇区, 磁头号) ; ----------------------------------------------------------------------- ; 设扇区号为 x ; ┌ 柱面号 = y >> 1 ; x ┌ 商 y ┤ ; -------------- => ┤ └ 磁头号 = y & 1 ; 每磁道扇区数 │ ; └ 余 z => 起始扇区号 = z + 1 push bp mov bp, sp sub esp, 2 ; 辟出两个字节的堆栈区域保存要读的扇区数: byte [bp-2] mov byte [bp-2], cl push bx ; 保存 bx mov bl, [BPB_SecPerTrk] ; bl: 除数 div bl ; y 在 al 中, z 在 ah 中 inc ah ; z ++ mov cl, ah ; cl <- 起始扇区号 mov dh, al ; dh <- y shr al, 1 ; y >> 1 (其实是 y/BPB_NumHeads, 这里BPB_NumHeads=2) mov ch, al ; ch <- 柱面号 and dh, 1 ; dh & 1 = 磁头号 pop bx ; 恢复 bx ; 至此, "柱面号, 起始扇区, 磁头号" 全部得到 ^^^^^^^^^^^^^^^^^^^^^^^^ mov dl, [BS_DrvNum] ; 驱动器号 (0 表示 A 盘) .GoOnReading: mov ah, 2 ; 读 mov al, byte [bp-2] ; 读 al 个扇区 int 13h jc .GoOnReading ; 如果读取错误 CF 会被置为 1, 这时就不停地读, 直到正确为止 add esp, 2 pop bp ret ;---------------------------------------------------------------------------- ; 函数名: GetFATEntry ;---------------------------------------------------------------------------- ; 作用: ; 找到序号为 ax 的 Sector 在 FAT 中的条目, 结果放在 ax 中 ; 需要注意的是, 中间需要读 FAT 的扇区到 es:bx 处, 所以函数一开始保存了 es 和 bx GetFATEntry: push es push bx push ax mov ax, BaseOfKernelFile ; ┓ sub ax, 0100h ; ┣ 在 BaseOfKernelFile 后面留出 4K 空间用于存放 FAT mov es, ax ; ┛ pop ax mov byte [bOdd], 0 mov bx, 3 mul bx ; dx:ax = ax * 3 mov bx, 2 div bx ; dx:ax / 2 ==> ax <- 商, dx <- 余数 cmp dx, 0 jz LABEL_EVEN mov byte [bOdd], 1 LABEL_EVEN:;偶数 xor dx, dx ; 现在 ax 中是 FATEntry 在 FAT 中的偏移量. 下面来计算 FATEntry 在哪个扇区中(FAT占用不止一个扇区) mov bx, [BPB_BytsPerSec] div bx ; dx:ax / BPB_BytsPerSec ==> ax <- 商 (FATEntry 所在的扇区相对于 FAT 来说的扇区号) ; dx <- 余数 (FATEntry 在扇区内的偏移)。 push dx mov bx, 0 ; bx <- 0 于是, es:bx = (BaseOfKernelFile - 100):00 = (BaseOfKernelFile - 100) * 10h add ax, SectorNoOfFAT1 ; 此句执行之后的 ax 就是 FATEntry 所在的扇区号 mov cl, 2 call ReadSector ; 读取 FATEntry 所在的扇区, 一次读两个, 避免在边界发生错误, 因为一个 FATEntry 可能跨越两个扇区 pop dx add bx, dx mov ax, [es:bx] cmp byte [bOdd], 1 jnz LABEL_EVEN_2 shr ax, 4 LABEL_EVEN_2: and ax, 0FFFh LABEL_GET_FAT_ENRY_OK: pop bx pop es ret ;---------------------------------------------------------------------------- ;---------------------------------------------------------------------------- ; 函数名: KillMotor ;---------------------------------------------------------------------------- ; 作用: ; 关闭软驱马达 KillMotor: push dx mov dx, 03F2h mov al, 0 out dx, al pop dx ret ;----------------------------------------------------------------------------
二.跳入保护模式
因为一开始CPU是工作在实模式下的,在实模式下CPU为16位,有着16位的寄存器,16位的数据总线及20位的地址总线。只能寻址1MB,所以内存最大也只为1MB。从80386始,intel的CPU开始进入32位,有32位的地址线,可以寻址4GB。
在实模式下CPU寻址是通过段:偏移,段值由16位的CS,DS,SS等寄存器表示。每一个段的最大长度为64K,物理地址的计算遵循以下公式:物理地址=段值*10h+偏移。而保护模式下CPU寻址虽然也是段:偏移,不过此时的段已经不是实模式下的段了,尽管它的值也由段寄存器表示。此时它变成了一个索引,指向一个数据结构中的表项。这个数据结构我们称之为GDT
所以为了跳入保护模式,我们需要以下步骤:
1.准备GDT
具体见代码:
; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------ ; 段基址 段界限 , 属性 LABEL_GDT: Descriptor 0, 0, 0 ; 空描述符 LABEL_DESC_FLAT_C: Descriptor 0, 0fffffh, DA_CR | DA_32 | DA_LIMIT_4K ; 0 ~ 4G LABEL_DESC_FLAT_RW: Descriptor 0, 0fffffh, DA_DRW | DA_32 | DA_LIMIT_4K ; 0 ~ 4G LABEL_DESC_VIDEO: Descriptor 0B8000h, 0ffffh, DA_DRW | DA_DPL3 ; 显存首地址 ; GDT ------------------------------------------------------------------------------------------------------------------------------------------------------------ GdtLen equ $ - LABEL_GDT GdtPtr dw GdtLen - 1 ; 段界限 dd BaseOfLoaderPhyAddr + LABEL_GDT ; 基地址 ; GDT 选择子 ---------------------------------------------------------------------------------- SelectorFlatC equ LABEL_DESC_FLAT_C - LABEL_GDT SelectorFlatRW equ LABEL_DESC_FLAT_RW - LABEL_GDT SelectorVideo equ LABEL_DESC_VIDEO - LABEL_GDT + SA_RPL3 ; GDT 选择子 ----------------------------------------------------------------------------------
初看感觉GDT是一个结构数组,数组的每一个元素就是类型为Descriptor的段,以上代码初始化了段的基址,界限及属性。
Descriptor的定义如下:
; 描述符 ; usage: Descriptor Base, Limit, Attr ; Base: dd ; Limit: dd (low 20 bits available) ; Attr: dw (lower 4 bits of higher byte are always 0) %macro Descriptor 3 dw %2 & 0FFFFh ; 段界限 1 (2 字节) dw %1 & 0FFFFh ; 段基址 1 (2 字节) db (%1 >> 16) & 0FFh ; 段基址 2 (1 字节) dw ((%2 >> 8) & 0F00h) | (%3 & 0F0FFh) ; 属性 1 + 段界限 2 + 属性 2 (2 字节) db (%1 >> 24) & 0FFh ; 段基址 3 (1 字节) %endmacro ; 共 8 字节
可以看出Descriptor是一个宏
代码段和数据段描述符的具体结构如下:
现在看GDT表中各描述符的属性,分别有DA_CR,DA_DRW,DA_32,DA_LIMIT_4K,DA_DPL3.
DA_CR=9Ah,存在的可执行可读代码段;DA_DRW=92h,存在的可读写数据段;DA_LIMIT_4K,段界限粒度为4k;DA_DPL3=60h,特权值为3
而GdtLen是整个GDT表的长度,GdtPtr也是一个数据结构,前2个字节为GDT长度,后4个字节为GDT表的基址。
以Selector开头的称为选择子,看上去好像是段在GDT中的索引。CPU寻址的时候就是靠这个从GDT表中得到段的信息,从而正确寻址。Selector存储在CS,DS,ES等段寄存器中,类似于实模式下的段基址。
最后通过一个命令:lgdt [GdtPtr];加载GdtPtr的值到CPU的gdtr寄存器。该寄存器的结构与GdtPtr完全相同。
2.将CPU的工作状态转换为实模式
首先关中断,因为实模式下中断处理机制和保护模式下不同,然后打开A20地址线,通过操作端口92h,最后将cr0寄存器的第零位置为1,该位为1时,cpu运行于保护模式下。
实现代码如下
; 关中断 cli ; 打开地址线A20 in al, 92h or al, 00000010b out 92h, al ; 准备切换到保护模式 mov eax, cr0 or eax, 1 mov cr0, eax
3.从实模式跳入保护模式
跳转只需要一句代码: jmp dword SelectorFlatC:(PM_START)
因为该跳转是在实模式下,而目的地址是在保护模式下,如果偏移超过64K,则可能被截断,所以在前面加dword
三.打开分页机制
分页机制就像一个函数,将物理地址映射为线性地址,那么如何映射呢?我相信看了下面的图就明白了:
在80386中每一个页的大小是4096字节,转换使用2级页表,每个表项4字节长,所以一个页表中最多有1024个表项。进行转换时,先从寄存器cr3指定的页目录中根据线性地址的高10位得到页表地址,再根据线性地址第12到21位得到物理页地址,最后根据低12位加上物理页首地址得到物理地址。
分页机制生效与否还取决于寄存器cr0的第31位称为PG位是否为1,若为1,则分页机制启动。关键代码如下:
SetupPaging: ; 为简化处理, 所有线性地址对应相等的物理地址. ; 首先初始化页目录 mov ax, SelectorPageDir ; 此段首地址为 PageDirBase mov es, ax mov ecx, 1024 ; 共 1K 个表项 xor edi, edi xor eax, eax mov eax, PageTblBase | PG_P | PG_USU | PG_RWW .1: stosd add eax, 4096 ; 为了简化, 所有页表在内存中是连续的. loop .1 ; 再初始化所有页表 (1K 个, 4M 内存空间) mov ax, SelectorPageTbl ; 此段首地址为 PageTblBase mov es, ax mov ecx, 1024 * 1024 ; 共 1M 个页表项, 也即有 1M 个页 xor edi, edi xor eax, eax mov eax, PG_P | PG_USU | PG_RWW .2: stosd add eax, 4096 ; 每一页指向 4K 的空间 loop .2 mov eax, PageDirBase mov cr3, eax mov eax, cr0 or eax, 80000000h mov cr0, eax jmp short .3 .3: nop ret ; 分页机制启动完毕 ----------------------------------------------------------
以上的程序实现了最简单的映射,将线性地址映射成相同的物理地址,若要映射成不同的物理地址,可以修改初始化页表时该页表指向的物理页地址。
四.重新放置内核并跳入内核
我们的内核已经被加载到内存中,但是我们并不能直接跳转到内核开始处执行,我们得重新放置我们的内核。
为了使内核放在指定的地址,在生成elf文件时就要带上参数,-s -Ttext 0x30400将程序入口地址变成30400,关键实现代码如下:; InitKernel --------------------------------------------------------------------------------- ; 将 KERNEL.BIN 的内容经过整理对齐后放到新的位置 ; 遍历每一个 Program Header,根据 Program Header 中的信息来确定把什么放进内存,放到什么位置,以及放多少。 ; -------------------------------------------------------------------------------------------- InitKernel: xor esi, esi mov cx, word [BaseOfKernelFilePhyAddr+2Ch];`. ecx <- pELFHdr->e_phnum movzx ecx, cx ;/ mov esi, [BaseOfKernelFilePhyAddr + 1Ch] ; esi <- pELFHdr->e_phoff add esi, BaseOfKernelFilePhyAddr;esi<-OffsetOfKernel+pELFHdr->e_phoff .Begin: mov eax, [esi + 0] cmp eax, 0 ; PT_NULL jz .NoAction push dword [esi + 010h] ;size ;`. mov eax, [esi + 04h] ; | add eax, BaseOfKernelFilePhyAddr; | memcpy((void*)(pPHdr->p_vaddr), push eax ;src ; | uchCode + pPHdr->p_offset, push dword [esi + 08h] ;dst ; | pPHdr->p_filesz; call MemCpy ; | add esp, 12 ;/ .NoAction: add esi, 020h ; esi += pELFHdr->e_phentsize dec ecx jnz .Begin ret ; InitKernel ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
根据elf文件的elf头和程序头表中的信息将内核复制到指定地址,最后跳转到该地址处,内核真正开始执行。