当前位置：首页 > news >正文

linux0.11源码分析第一弹——bootset.s内容

news 2025/4/26 23:26:20

🚀前言

本系列主要参考的《linux源码趣读》，也结合之前《一个64位操作系统的设计与实现》的内容结合起来进行整理成本系列博客。在这一篇博客对应的是《linux源码趣读》第一~四回

🏆启动后的第一步

📃启动区

操作系统启动后，BIOS将硬盘中启动区（0道0盘1磁道，以0x55aa结尾）的512字节复制到内存的0x07c00h处，并跳转至对应位置运行代码。至于为什么是这个位置，只能说是最初的BIOS定义的，记住便好。流程便如下图所示。
在这里插入图片描述

📃为什么是0x07c00

这个问题其实包含了两个问题。
第一个问题，为什么是0x7c00，而不是其他位置。这个问题在大疆面试我的时候就被问到了，当时我说的是这是硬件厂商之间的规定，启动区为这个位置，是约定俗成的位置，《一个64位操作系统的设计与实现》里面也是说为什么是0x7c00只有当年的BIOS工程师才知道。但显然面试官不满意我的回答，又问了我一次，最后不出意外的和大疆擦肩而过了。但是我后来还是去找了其他资料，抛开说约定俗称的，还是被我找到了真实的解释，下面正片开始：

这个就是一个历史遗留问题，具体可以看参考资料的第三个。简单来说就是IBM早期电脑5150采用了8088芯片，而芯片本身需要占用0x0000～0x03FF用来保存各种中断处理程序的储存位置。为了把尽量多的连续内存留给操作系统，主引导记录（MBR）就被放到了内存地址的尾部。而搭载的系统为86-DOS，该操作系统最少要32KB，即0x0000～0x7FFF。因此结合前面的，加上MBR本身也要产生数据，预留512字节，一个扇区也是512字节，因此开始位置就变成了

0x7FFF - 512 - 512 = 0x7c00

后续的操作系统为了兼容，就都采用了0x7c00作为启动地址，而现在操作系统的内存分区大致如下划分：

在这里插入图片描述

第二个问题，明明是0x7c00，为什么变成了0x07c00呢？别小看前面多了个0，实际上是多了四位！原本只有16位寻址线，因此是0x7c00，后来x86 为了让自己在 16 位这个实模式下能访问到 20 位的地址线这个历史因素，段基地址要左移4位，那么0x07c00左移四位就正好会变成0x7c00。因此说最后是0x07c00这个内存位置。

📃设置寄存器基地址

设置ds段寄存器
这是第一次设置ds寄存器，ds寄存器表示数据段，linux0.11中的代码如下所示：

BOOTSEG  = 0x07c0			; original address of boot-sector
start:mov	ax,#BOOTSEGmov	ds,ax

以上这段是先将0x07c0放入ax寄存器，再将ax寄存器的值写入ds寄存器。为什么需要用一个ax寄存器作为中转，而不是直接写入ds寄存器呢？这是因为在8086 CPU架构的限制下，不能将立即数（直接给出的数值）写入段寄存器中（如ds，cs，es，ss等），因此就必须通过一个中转，这个中转就是ax寄存器。

复制到0x9000

这一步我理解的作用是保护0x7C00位置，防止后续加载代码进行覆盖，因此将第一个磁盘的内容从0x7c00处复制到0x9000处，并将后续磁盘的内容依次复制到后面。linux0.11中的实现源码如下：

INITSEG  = 0x9000			; we move boot here - out of the way
mov	ax,#INITSEG
mov	es,ax
mov	cx,#256
sub	si,si
sub	di,di
rep
movw
jmpi	go,INITSEG

这段代码中同样是通过ax寄存器设置了es寄存器，同时清空了si（源地址）与di（目的地址）。rep指令表示重复执行后面的指令，后面的指令是movw，表示复制一个字（16位，两个字节），重复次数根据cx寄存器而定，cx寄存器为256，因此一共复制了512个字节。复制的位置是从ds:si 到 es:di 也就是从0x07c00复制到0x9000位置。现在内存中是如下所示：

在这里插入图片描述

📃设置其他寄存器

接下来还需要设置别的段寄存器，包括ds，es，ss。
ds是数据段，表示如何访问数据；
es是附加段，可先不管；
ss是堆栈段，结合sp堆栈指针访问栈；
cs是代码段，结合ip指针访问代码。

	jmpi	go,INITSEG
go:	mov	ax,csmov	ds,axmov	es,ax
; put stack at 0x9ff00.mov	ss,axmov	sp,#0xFF00		; arbitrary value >>512

在上面复制完成之后，执行jmpi指令进行跳转，跳转的位置是：0x9000:go 而这个jmpi指令等同于

cs = 0x9000
ip = go

因为jmpi后，cs指针已经被置为0x9000，因此后面的mov中，ds，es，ss均被置为了0x9000。至于为什么ds是数据段，cs是代码段，ss是堆栈段，但是指向同一个地址呢，这就不得不提到一个新概念了，这里刚上电还处于实模式，所有物理地址都可以被访问，因此暂时不会对这三个的内存地址做功能上的区分。
ss指针被置为0x9000，同时sp指针被置为了0xff00。因此栈顶指针此时就是 ss:sp = 0x9ff00

🏆复制其他文件进内存

📃整体流程

上面我们将第一个磁盘512个字节复制进了内存空间，接下来就需要将剩下的磁盘也复制进内存空间，源码如下：

load_setup:mov	dx,#0x0000		; drive 0, head 0mov	cx,#0x0002		; sector 2, track 0mov	bx,#0x0200		; address = 512, in INITSEGmov	ax,#0x0200+4	; service 2, nr of sectorsint	0x13			; read itjnc	ok_load_setup		; ok - continuemov	dx,#0x0000mov	ax,#0x0000		; reset the disketteint	0x13jmp	load_setup

首先是设置dx，cx，bx，ax的参数，然后使用int指令调用BIOS的0x13指令，该指令对应的位置是BIOS预留的中断处理程序入口地址，会为我们处理对应的中断程序。放在此处就是从第二个扇区开始，将数据加载到0x90200处，共4个扇区。

这之后，我们就要加载剩下的240个扇区进内存，至于这4个扇区，240个扇区各存的什么，这之后再说，代码里面实现是这样的（去除掉其他代码之后）：

mov ax, #0x1000
mov es, ax			; segment of 0x10000
call read_itjmpi 0, 0x9020

这段代码的作用就是将剩下的240个扇区加载到0x10000处。至于读取的逻辑就和上面读取的那四个扇区是一样的：设置ax，bx，cx，dx的参数，然后调用0x13中断。

最后会跳转到0x9020位置，即第二个扇区的位置，第二个扇区开始就是setup.s的内容了。最终整个内存如下图所示

在这里插入图片描述

📃一些其他细节

下面是read_it函数的细节，用来读取240个扇区的

SETUPLEN = 4				; nr of setup-sectorssread:	.word 1+SETUPLEN	; sectors read of current track
head:	.word 0			; current head
track:	.word 0			; current trackread_it:mov ax,es          ; 将ES寄存器的值移动到AX寄存器test ax,#0x0fff     ; 测试AX的低12位是否为0（检查ES是否在64KB边界上）
die:	jne die          ; 如果不是，跳转到标签die，形成无限循环xor bx,bx          ; 将BX寄存器清零，用作段内起始地址
rp_read:mov ax,es          ; 再次将ES寄存器的值移动到AX寄存器cmp ax,#ENDSEG      ; 比较AX和ENDSEG，检查是否已经读取了所有数据jb ok1_read        ; 如果AX小于ENDSEG，跳转到ok1_readret                 ; 如果已经读取完毕，返回
ok1_read:seg cs             ; 将下一段代码的段寄存器设置为csmov ax,sectors      ; 将sectors的值（在最后）移动到AX寄存器sub ax,sread        ; 从AX中减去sread的值，计算剩余需要读取的扇区数mov cx,ax          ; 将计算结果移动到CX寄存器shl cx,#9          ; 将CX左移9位，转换为字节偏移量add cx,bx          ; 将BX（段内起始地址）加到CX（偏移量）jnc ok2_read       ; 如果没有发生进位，跳转到ok2_readje ok2_read        ; 如果CX等于0xFFFF，也跳转到ok2_readxor ax,ax          ; 清零AX寄存器sub ax,bx          ; 计算BX的补码shr ax,#9          ; 将AX右移9位，转换回扇区数
ok2_read:call read_track     ; 调用read_track函数读取磁盘扇区mov cx,ax          ; 将返回的扇区数移动到CX寄存器add ax,sread       ; 将sread的值加到AX（已读取扇区数）seg cs             ; 再次将代码段寄存器的值移动到ES寄存器cmp ax,sectors     ; 比较AX和sectors，检查是否已经读取了所有扇区jne ok3_read       ; 如果没有，跳转到ok3_readmov ax,#1          ; 设置AX为1sub ax,head        ; 从1减去head的值，检查是否需要更新trackjne ok4_read       ; 如果不相等，跳转到ok4_readinc track          ; 如果相等，增加track的值
ok4_read:mov head,ax        ; 更新head的值xor ax,ax          ; 清零AX寄存器
ok3_read:mov sread,ax       ; 更新sread的值shl cx,#9          ; 将CX（扇区数）左移9位，转换为字节偏移量add bx,cx          ; 将偏移量加到BX（段内起始地址）jnc rp_read        ; 如果没有发生进位，跳转到rp_read继续读取mov ax,es          ; 将ES寄存器的值移动到AX寄存器add ax,#0x1000     ; 增加AX的值，移动到下一个64KB段mov es,ax          ; 更新ES寄存器的值xor bx,bx          ; 清零BX寄存器，重置段内起始地址jmp rp_read        ; 跳转到rp_read继续读取read_track:push ax            ; 保存AX寄存器的值push bx            ; 保存BX寄存器的值push cx            ; 保存CX寄存器的值push dx            ; 保存DX寄存器的值mov dx,track       ; 将track的值移动到DX寄存器mov cx,sread       ; 将sread的值移动到CX寄存器inc cx             ; 增加CX的值，准备读取下一个扇区mov ch,dl          ; 将DX的低8位（即CL）移动到CHmov dx,head        ; 将head的值移动到DX寄存器mov dh,dl          ; 将DX的低8位（即DL）移动到DHmov dl,#0          ; 清零DL寄存器and dx,#0x0100     ; 取DX的第8位，设置为0，其他位清零mov ah,#2          ; 设置AH为2，准备读取扇区int 0x13           ; 调用BIOS中断0x13，执行读取操作jc bad_rt          ; 如果读取失败，跳转到bad_rtpop dx             ; 恢复DX寄存器的值pop cx             ; 恢复CX寄存器的值pop bx             ; 恢复BX寄存器的值pop ax             ; 恢复AX寄存器的值ret                 ; 返回到调用read_track的地方
bad_rt:mov ax,#0          ; 设置AX为0mov dx,#0          ; 设置DX为0int 0x13           ; 再次调用BIOS中断0x13，执行读取操作pop dx             ; 恢复DX寄存器的值pop cx             ; 恢复CX寄存器的值pop bx             ; 恢复BX寄存器的值pop ax             ; 恢复AX寄存器的值jmp read_track     ; 跳转回read_track，尝试重新读取sectors:.word 0

🎯boot文件总结

整个boot文件其实只做了两件事，一件事是设置各个段寄存器的地址，第二个就是把磁盘加载进内存中，最开始是将自己放入0x7c00位置，然后又复制了自己到0x9000。之后把后续四个磁盘中的setup编译后的文件放入到0x9020处。最后将剩下的240个扇区放入到0x10000处。然后远跳到0x9020处准备执行第二个扇区，即setup中的部分。