计算机 在开机启动的时候,是经历了以下的步骤:
1.运行内置在BIOS芯片中的加电自检程序
2.按照CMOS中对硬件的配置初始化硬件
3.按CMOS中存储的启动项顺序搜索启动盘
4.若该启动盘的第一个扇区最后是以0xaa55结尾,则为引导扇区,CPU将其512个字节加载到
内存地址0000:7c00处,然后跳转到0x7c00处开始执行引导扇区的代码
问题就在于此,我们的操作系统不可能只有512个字节,所以如何突破这512个字节的限制呢?我们可以再建立一个文件,通过引导扇区将其加载入内存,然后将控制权交给他,这样就不受512个字节的限制了。并可以由他来加载我们的操作系统。
( 为什么不从引导扇区的512个字节直接加载操作系统内核呢,如今的操作系统都是保护模式下运行的,在内核执行之前,必须要经历引导,加载内核,跳入保护模式等步骤,512个字节很有可能不够用,所以。。。)
这个文件可以称之为loader,存储在启动盘上,选择软盘作启动盘,为了以后操作方便,建立fat12格式的文件系统。几乎所有的文件系统都会把磁盘化分为若干层次以方便组织和管理,这些层次包括:扇区,簇,分区。(扇区是磁盘上的最小数据单元)
fat12文件系统划分的软盘格式如下:
根目录区的大小未定。
引导扇区中有一个数据结构叫做BPB,初始化代码如下:
BS_OEMName DB 'ForrestY' ; OEM String, 必须 8 个字节 BPB_BytsPerSec DW 512 ; 每扇区字节数 BPB_SecPerClus DB 1 ; 每簇多少扇区 BPB_RsvdSecCnt DW 1 ; Boot 记录占用多少扇区 BPB_NumFATs DB 2 ; 共有多少 FAT 表 BPB_RootEntCnt DW 224 ; 根目录文件数最大值 BPB_TotSec16 DW 2880 ; 逻辑扇区总数 BPB_Media DB 0xF0 ; 媒体描述符 BPB_FATSz16 DW 9 ; 每FAT扇区数 BPB_SecPerTrk DW 18 ; 每磁道扇区数 BPB_NumHeads DW 2 ; 磁头数(面数) BPB_HiddSec DD 0 ; 隐藏扇区数 BPB_TotSec32 DD 0 ; 如果 wTotalSectorCount 是 0 由这个值记录扇区数 BS_DrvNum DB 0 ; 中断 13 的驱动器号 BS_Reserved1 DB 0 ; 未使用 BS_BootSig DB 29h ; 扩展引导标记 (29h) BS_VolID DD 0 ; 卷序列号 BS_VolLab DB 'OrangeS0.02'; 卷标, 必须 11 个字节 BS_FileSysType DB 'FAT12 ' ; 文件系统类型, 必须 8个字节
处理器从该数据结构中可以了解软盘格式信息。
而根目录区则由若干目录条目组成,每个条目占32个字节,条目定义了文件的名称,属性,大小,日期以及在磁盘中的位置,其中文件名相对条目首地址偏移为0,长度为0xB,条目对应的开始簇号偏移为0x1A,长度为2,由于在BPB中定义一个簇包含一个扇区,则条目对应的开始簇号就是开始扇区号,不过该扇区号是相对数据区的偏移扇区号。数据区就是存储文件的具体数据了。
根目录区条目在磁盘中的存储格式如下:
[root@localhost bochs-2.4.5]# xxd -u -a -g 1 -c 16 -s 0x2600 -l 512 x.img 0002600: 52 49 56 45 52 20 20 20 54 58 54 20 00 00 00 00 RIVER TXT .... 0002610: 00 00 00 00 00 00 A0 59 3D 3E 02 00 0F 00 00 00 .......Y=>...... (蓝色标出的是文件名,红色标出的是文件在数据区中的簇号)
若该文件只存放在一个扇区,好像只要通过根目录区的条目就可以确定文件位置了,不过若文件太大,存储超过一个扇区,而且存储的几个扇区不一定连续时,我们怎么确定文件的位置呢?
不是还有2个FAT表么,如上图的fat1和fat2通常是一样的,fat2可以看作是fat1的备份。
fat1的结构类似于一个位图,每12位为一个项,代表一个簇。第0个和第一个项始终不使用,从第二个项开始表示数据区的每一个簇。所以根目录区的条目中文件位置是从02开始排列的,也就是说数据区的第一个簇的簇号是2。
一般FAT项代表的是文件的下一个簇号,如果值大于或等于0xFF8就表示当前簇已经是本文件的最后一个簇。如果值为0xFF7,就表示它是一个坏簇。
fat在磁盘中的格式如下:
0000200: F0 FF FF FF FF FF FF FF FF FF FF FF 00 00 00 00 ................ 0000210: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ................
我们要实现将软盘上的loader加载到内存某地址处。步骤如下:
一.搜索软盘上的文件
由于磁盘的最小数据单元是扇区,所以一切操作都是以扇区为单位进行
1.复位软驱
2.在根目录寻找loader.bin(其中复位软驱及读取扇区使用中断13)
遍历根目录区的所有扇区,将每一个扇区加载入内存,然后从中寻找文件名为 loader.bin的条目,直到找到为止。
二.加载到内存
1.由扇区号求得FAT项的值
2.根据簇号加载loader.bin到指定内存
三.将控制权交给loader.bin
具体程序如下:
;%define _BOOT_DEBUG_ ; 做 Boot Sector 时一定将此行注释掉!将此行打开后用 nasm Boot.asm -o Boot.com 做成一个.COM文件易于调试 %ifdef _BOOT_DEBUG_ org 0100h ; 调试状态, 做成 .COM 文件, 可调试 %else org 07c00h ; Boot 状态, Bios 将把 Boot Sector 加载到 0:7C00 处并开始执行 %endif ;================================================================================================ %ifdef _BOOT_DEBUG_ BaseOfStack equ 0100h ; 调试状态下堆栈基地址(栈底, 从这个位置向低地址生长) %else BaseOfStack equ 07c00h ; Boot状态下堆栈基地址(栈底, 从这个位置向低地址生长) %endif BaseOfLoader equ 09000h ; LOADER.BIN 被加载到的位置 ---- 段地址 OffsetOfLoader equ 0100h ; LOADER.BIN 被加载到的位置 ---- 偏移地址 RootDirSectors equ 14 ; 根目录占用空间 SectorNoOfRootDirectory equ 19 ; Root Directory 的第一个扇区号 SectorNoOfFAT1 equ 1 ; FAT1 的第一个扇区号 = BPB_RsvdSecCnt DeltaSectorNo equ 17 ; DeltaSectorNo = BPB_RsvdSecCnt + (BPB_NumFATs * FATSz) - 2 ; 文件的开始Sector号 = DirEntry中的开始Sector号 + 根目录占用Sector数目 + DeltaSectorNo ;================================================================================================ jmp short LABEL_START ; Start to boot. nop ; 这个 nop 不可少 ; 下面是 FAT12 磁盘的头 BS_OEMName DB 'ForrestY' ; OEM String, 必须 8 个字节 BPB_BytsPerSec DW 512 ; 每扇区字节数 BPB_SecPerClus DB 1 ; 每簇多少扇区 BPB_RsvdSecCnt DW 1 ; Boot 记录占用多少扇区 BPB_NumFATs DB 2 ; 共有多少 FAT 表 BPB_RootEntCnt DW 224 ; 根目录文件数最大值 BPB_TotSec16 DW 2880 ; 逻辑扇区总数 BPB_Media DB 0xF0 ; 媒体描述符 BPB_FATSz16 DW 9 ; 每FAT扇区数 BPB_SecPerTrk DW 18 ; 每磁道扇区数 BPB_NumHeads DW 2 ; 磁头数(面数) BPB_HiddSec DD 0 ; 隐藏扇区数 BPB_TotSec32 DD 0 ; 如果 wTotalSectorCount 是 0 由这个值记录扇区数 BS_DrvNum DB 0 ; 中断 13 的驱动器号 BS_Reserved1 DB 0 ; 未使用 BS_BootSig DB 29h ; 扩展引导标记 (29h) BS_VolID DD 0 ; 卷序列号 BS_VolLab DB 'OrangeS0.02'; 卷标, 必须 11 个字节 BS_FileSysType DB 'FAT12 ' ; 文件系统类型, 必须 8个字节 LABEL_START: mov ax, cs mov ds, ax mov es, ax mov ss, ax mov sp, BaseOfStack ; 清屏 mov ax, 0600h ; AH = 6, AL = 0h mov bx, 0700h ; 黑底白字(BL = 07h) mov cx, 0 ; 左上角: (0, 0) mov dx, 0184fh ; 右下角: (80, 50) int 10h ; int 10h mov dh, 0 ; "Booting " call DispStr ; 显示字符串 xor ah, ah ; ┓ xor dl, dl ; ┣ 软驱复位 int 13h ; ┛ ; 下面在 A 盘的根目录寻找 LOADER.BIN mov word [wSectorNo], SectorNoOfRootDirectory LABEL_SEARCH_IN_ROOT_DIR_BEGIN: cmp word [wRootDirSizeForLoop], 0 ; ┓ jz LABEL_NO_LOADERBIN ; ┣ 判断根目录区是不是已经读完 dec word [wRootDirSizeForLoop] ; ┛ 如果读完表示没有找到 LOADER.BIN mov ax, BaseOfLoader mov es, ax ; es <- BaseOfLoader mov bx, OffsetOfLoader ; bx <- OffsetOfLoader 于是, es:bx = BaseOfLoader:OffsetOfLoader mov ax, [wSectorNo] ; ax <- Root Directory 中的某 Sector 号 mov cl, 1 call ReadSector mov si, LoaderFileName ; ds:si -> "LOADER BIN" mov di, OffsetOfLoader ; es:di -> BaseOfLoader:0100 = BaseOfLoader*10h+100 cld mov dx, 10h LABEL_SEARCH_FOR_LOADERBIN: cmp dx, 0 ; ┓循环次数控制, jz LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR ; ┣如果已经读完了一个 Sector, dec dx ; ┛就跳到下一个 Sector mov cx, 11 LABEL_CMP_FILENAME: cmp cx, 0 jz LABEL_FILENAME_FOUND ; 如果比较了 11 个字符都相等, 表示找到 dec cx lodsb ; ds:si -> al cmp al, byte [es:di] jz LABEL_GO_ON jmp LABEL_DIFFERENT ; 只要发现不一样的字符就表明本 DirectoryEntry 不是 ; 我们要找的 LOADER.BIN LABEL_GO_ON: inc di jmp LABEL_CMP_FILENAME ; 继续循环 LABEL_DIFFERENT: and di, 0FFE0h ; else ┓ di &= E0 为了让它指向本条目开头 add di, 20h ; ┃ mov si, LoaderFileName ; ┣ di += 20h 下一个目录条目 jmp LABEL_SEARCH_FOR_LOADERBIN; ┛ LABEL_GOTO_NEXT_SECTOR_IN_ROOT_DIR: add word [wSectorNo], 1 jmp LABEL_SEARCH_IN_ROOT_DIR_BEGIN LABEL_NO_LOADERBIN: mov dh, 2 ; "No LOADER." call DispStr ; 显示字符串 %ifdef _BOOT_DEBUG_ mov ax, 4c00h ; ┓ int 21h ; ┛没有找到 LOADER.BIN, 回到 DOS %else jmp $ ; 没有找到 LOADER.BIN, 死循环在这里 %endif LABEL_FILENAME_FOUND: ; 找到 LOADER.BIN 后便来到这里继续 mov ax, RootDirSectors and di, 0FFE0h ; di -> 当前条目的开始 add di, 01Ah ; di -> 首 Sector mov cx, word [es:di] push cx ; 保存此 Sector 在 FAT 中的序号 add cx, ax add cx, DeltaSectorNo ; cl <- LOADER.BIN的起始扇区号(0-based) mov ax, BaseOfLoader mov es, ax ; es <- BaseOfLoader mov bx, OffsetOfLoader ; bx <- OffsetOfLoader mov ax, cx ; ax <- Sector 号 LABEL_GOON_LOADING_FILE: push ax ; `. push bx ; | mov ah, 0Eh ; | 每读一个扇区就在 "Booting " 后面 mov al, '.' ; | 打一个点, 形成这样的效果: mov bl, 0Fh ; | Booting ...... int 10h ; | pop bx ; | pop ax ; / mov cl, 1 call ReadSector pop ax ; 取出此 Sector 在 FAT 中的序号 call GetFATEntry cmp ax, 0FFFh jz LABEL_FILE_LOADED push ax ; 保存 Sector 在 FAT 中的序号 mov dx, RootDirSectors add ax, dx add ax, DeltaSectorNo add bx, [BPB_BytsPerSec] jmp LABEL_GOON_LOADING_FILE LABEL_FILE_LOADED: mov dh, 1 ; "Ready." call DispStr ; 显示字符串 ; ***************************************************************************************************** jmp BaseOfLoader:OffsetOfLoader ; 这一句正式跳转到已加载到内 ; 存中的 LOADER.BIN 的开始处, ; 开始执行 LOADER.BIN 的代码。 ; Boot Sector 的使命到此结束 ; ***************************************************************************************************** ;============================================================================ ;变量 ;---------------------------------------------------------------------------- wRootDirSizeForLoop dw RootDirSectors ; Root Directory 占用的扇区数, 在循环中会递减至零. wSectorNo dw 0 ; 要读取的扇区号 bOdd db 0 ; 奇数还是偶数 ;============================================================================ ;字符串 ;---------------------------------------------------------------------------- LoaderFileName db "LOADER BIN", 0 ; LOADER.BIN 之文件名 ; 为简化代码, 下面每个字符串的长度均为 MessageLength MessageLength equ 9 BootMessage: db "Booting "; 9字节, 不够则用空格补齐. 序号 0 Message1 db "Ready. "; 9字节, 不够则用空格补齐. 序号 1 Message2 db "No LOADER"; 9字节, 不够则用空格补齐. 序号 2 ;============================================================================ ;---------------------------------------------------------------------------- ; 函数名: DispStr ;---------------------------------------------------------------------------- ; 作用: ; 显示一个字符串, 函数开始时 dh 中应该是字符串序号(0-based) DispStr: mov ax, MessageLength mul dh add ax, BootMessage mov bp, ax ; ┓ mov ax, ds ; ┣ ES:BP = 串地址 mov es, ax ; ┛ mov cx, MessageLength ; CX = 串长度 mov ax, 01301h ; AH = 13, AL = 01h mov bx, 0007h ; 页号为0(BH = 0) 黑底白字(BL = 07h) mov dl, 0 int 10h ; int 10h ret ;---------------------------------------------------------------------------- ; 函数名: ReadSector ;---------------------------------------------------------------------------- ; 作用: ; 从第 ax 个 Sector 开始, 将 cl 个 Sector 读入 es:bx 中 ReadSector: ; ----------------------------------------------------------------------- ; 怎样由扇区号求扇区在磁盘中的位置 (扇区号 -> 柱面号, 起始扇区, 磁头号) ; ----------------------------------------------------------------------- ; 设扇区号为 x ; ┌ 柱面号 = y >> 1 ; x ┌ 商 y ┤ ; -------------- => ┤ └ 磁头号 = y & 1 ; 每磁道扇区数 │ ; └ 余 z => 起始扇区号 = z + 1 push bp mov bp, sp sub esp, 2 ; 辟出两个字节的堆栈区域保存要读的扇区数: byte [bp-2] mov byte [bp-2], cl push bx ; 保存 bx mov bl, [BPB_SecPerTrk] ; bl: 除数 div bl ; y 在 al 中, z 在 ah 中 inc ah ; z ++ mov cl, ah ; cl <- 起始扇区号 mov dh, al ; dh <- y shr al, 1 ; y >> 1 (其实是 y/BPB_NumHeads, 这里BPB_NumHeads=2) mov ch, al ; ch <- 柱面号 and dh, 1 ; dh & 1 = 磁头号 pop bx ; 恢复 bx ; 至此, "柱面号, 起始扇区, 磁头号" 全部得到 ^^^^^^^^^^^^^^^^^^^^^^^^ mov dl, [BS_DrvNum] ; 驱动器号 (0 表示 A 盘) .GoOnReading: mov ah, 2 ; 读 mov al, byte [bp-2] ; 读 al 个扇区 int 13h jc .GoOnReading ; 如果读取错误 CF 会被置为 1, 这时就不停地读, 直到正确为止 add esp, 2 pop bp ret ;---------------------------------------------------------------------------- ; 函数名: GetFATEntry ;---------------------------------------------------------------------------- ; 作用: ; 找到序号为 ax 的 Sector 在 FAT 中的条目, 结果放在 ax 中 ; 需要注意的是, 中间需要读 FAT 的扇区到 es:bx 处, 所以函数一开始保存了 es 和 bx GetFATEntry: push es push bx push ax mov ax, BaseOfLoader; `. sub ax, 0100h ; | 在 BaseOfLoader 后面留出 4K 空间用于存放 FAT mov es, ax ; / pop ax mov byte [bOdd], 0 mov bx, 3 mul bx ; dx:ax = ax * 3 mov bx, 2 div bx ; dx:ax / 2 ==> ax <- 商, dx <- 余数 cmp dx, 0 jz LABEL_EVEN mov byte [bOdd], 1 LABEL_EVEN:;偶数 ; 现在 ax 中是 FATEntry 在 FAT 中的偏移量,下面来 ; 计算 FATEntry 在哪个扇区中(FAT占用不止一个扇区) xor dx, dx mov bx, [BPB_BytsPerSec] div bx ; dx:ax / BPB_BytsPerSec ; ax <- 商 (FATEntry 所在的扇区相对于 FAT 的扇区号) ; dx <- 余数 (FATEntry 在扇区内的偏移) push dx mov bx, 0 ; bx <- 0 于是, es:bx = (BaseOfLoader - 100):00 add ax, SectorNoOfFAT1 ; 此句之后的 ax 就是 FATEntry 所在的扇区号 mov cl, 2 call ReadSector ; 读取 FATEntry 所在的扇区, 一次读两个, 避免在边界 ; 发生错误, 因为一个 FATEntry 可能跨越两个扇区 pop dx add bx, dx mov ax, [es:bx] cmp byte [bOdd], 1 jnz LABEL_EVEN_2 shr ax, 4 LABEL_EVEN_2: and ax, 0FFFh LABEL_GET_FAT_ENRY_OK: pop bx pop es ret ;---------------------------------------------------------------------------- times 510-($-$$) db 0 ; 填充剩下的空间,使生成的二进制代码恰好为512字节 dw 0xaa55 ; 结束标志
以上程序来自《Orange`s 一个操作系统的实现》