当前位置: 首页 > news >正文

linux0.11源码分析第一弹——bootset.s内容

🚀前言

    本系列主要参考的《linux源码趣读》,也结合之前《一个64位操作系统的设计与实现》的内容结合起来进行整理成本系列博客。在这一篇博客对应的是《linux源码趣读》第一~四回

目录

  • 🚀前言
  • 🏆启动后的第一步
    • 📃启动区
    • 📃为什么是0x07c00
    • 📃设置寄存器基地址
    • 📃设置其他寄存器
  • 🏆复制其他文件进内存
    • 📃整体流程
    • 📃一些其他细节
  • 🎯boot文件总结
  • 📖参考资料

🏆启动后的第一步

📃启动区

    操作系统启动后,BIOS将硬盘中启动区(0道0盘1磁道,以0x55aa结尾)的512字节复制到内存的0x07c00h处,并跳转至对应位置运行代码。至于为什么是这个位置,只能说是最初的BIOS定义的,记住便好。流程便如下图所示。
在这里插入图片描述

📃为什么是0x07c00

    这个问题其实包含了两个问题。
    第一个问题,为什么是0x7c00,而不是其他位置。这个问题在大疆面试我的时候就被问到了,当时我说的是这是硬件厂商之间的规定,启动区为这个位置,是约定俗成的位置,《一个64位操作系统的设计与实现》里面也是说为什么是0x7c00只有当年的BIOS工程师才知道。但显然面试官不满意我的回答,又问了我一次,最后不出意外的和大疆擦肩而过了。但是我后来还是去找了其他资料,抛开说约定俗称的,还是被我找到了真实的解释,下面正片开始:

    这个就是一个历史遗留问题,具体可以看参考资料的第三个。简单来说就是IBM早期电脑5150采用了8088芯片,而芯片本身需要占用0x0000~0x03FF用来保存各种中断处理程序的储存位置。为了把尽量多的连续内存留给操作系统,主引导记录(MBR)就被放到了内存地址的尾部。而搭载的系统为86-DOS,该操作系统最少要32KB,即0x0000~0x7FFF。因此结合前面的,加上MBR本身也要产生数据,预留512字节,一个扇区也是512字节,因此开始位置就变成了

0x7FFF - 512 - 512 = 0x7c00

    后续的操作系统为了兼容,就都采用了0x7c00作为启动地址,而现在操作系统的内存分区大致如下划分:

在这里插入图片描述

    第二个问题,明明是0x7c00,为什么变成了0x07c00呢?别小看前面多了个0,实际上是多了四位!原本只有16位寻址线,因此是0x7c00,后来x86 为了让自己在 16 位这个实模式下能访问到 20 位的地址线这个历史因素,段基地址要左移4位,那么0x07c00左移四位就正好会变成0x7c00。因此说最后是0x07c00这个内存位置。

📃设置寄存器基地址

设置ds段寄存器
    这是第一次设置ds寄存器,ds寄存器表示数据段,linux0.11中的代码如下所示:

BOOTSEG  = 0x07c0			; original address of boot-sector
start:mov	ax,#BOOTSEGmov	ds,ax

    以上这段是先将0x07c0放入ax寄存器,再将ax寄存器的值写入ds寄存器。为什么需要用一个ax寄存器作为中转,而不是直接写入ds寄存器呢?这是因为在8086 CPU架构的限制下,不能将立即数(直接给出的数值)写入段寄存器中(如ds,cs,es,ss等),因此就必须通过一个中转,这个中转就是ax寄存器。

复制到0x9000

    这一步我理解的作用是保护0x7C00位置,防止后续加载代码进行覆盖,因此将第一个磁盘的内容从0x7c00处复制到0x9000处,并将后续磁盘的内容依次复制到后面。linux0.11中的 实现源码如下:

INITSEG  = 0x9000			; we move boot here - out of the way
mov	ax,#INITSEG
mov	es,ax
mov	cx,#256
sub	si,si
sub	di,di
rep
movw
jmpi	go,INITSEG

    这段代码中同样是通过ax寄存器设置了es寄存器,同时清空了si(源地址)与di(目的地址)。rep指令表示重复执行后面的指令,后面的指令是movw,表示复制一个字(16位,两个字节),重复次数根据cx寄存器而定,cx寄存器为256,因此一共复制了512个字节。复制的位置是从ds:sies:di 也就是从0x07c00复制到0x9000位置。现在内存中是如下所示:

在这里插入图片描述

📃设置其他寄存器

    接下来还需要设置别的段寄存器,包括ds,es,ss。
    ds是数据段,表示如何访问数据;
    es是附加段,可先不管;
    ss是堆栈段,结合sp堆栈指针访问栈;
    cs是代码段,结合ip指针访问代码。

	jmpi	go,INITSEG
go:	mov	ax,csmov	ds,axmov	es,ax
; put stack at 0x9ff00.mov	ss,axmov	sp,#0xFF00		; arbitrary value >>512

    在上面复制完成之后,执行jmpi指令进行跳转,跳转的位置是:0x9000:go 而这个jmpi指令等同于

cs = 0x9000
ip = go

    因为jmpi后,cs指针已经被置为0x9000,因此后面的mov中,ds,es,ss均被置为了0x9000。至于为什么ds是数据段,cs是代码段,ss是堆栈段,但是指向同一个地址呢,这就不得不提到一个新概念了,这里刚上电还处于实模式,所有物理地址都可以被访问,因此暂时不会对这三个的内存地址做功能上的区分。
    ss指针被置为0x9000,同时sp指针被置为了0xff00。因此栈顶指针此时就是 ss:sp = 0x9ff00

🏆复制其他文件进内存

📃整体流程

    上面我们将第一个磁盘512个字节复制进了内存空间,接下来就需要将剩下的磁盘也复制进内存空间,源码如下:

load_setup:mov	dx,#0x0000		; drive 0, head 0mov	cx,#0x0002		; sector 2, track 0mov	bx,#0x0200		; address = 512, in INITSEGmov	ax,#0x0200+4	; service 2, nr of sectorsint	0x13			; read itjnc	ok_load_setup		; ok - continuemov	dx,#0x0000mov	ax,#0x0000		; reset the disketteint	0x13jmp	load_setup

    首先是设置dx,cx,bx,ax的参数,然后使用int指令调用BIOS的0x13指令,该指令对应的位置是BIOS预留的中断处理程序入口地址,会为我们处理对应的中断程序。放在此处就是从第二个扇区开始,将数据加载到0x90200处,共4个扇区。

    这之后,我们就要加载剩下的240个扇区进内存,至于这4个扇区,240个扇区各存的什么,这之后再说,代码里面实现是这样的(去除掉其他代码之后):

mov ax, #0x1000
mov es, ax			; segment of 0x10000
call read_itjmpi 0, 0x9020

    这段代码的作用就是将剩下的240个扇区加载到0x10000处。至于读取的逻辑就和上面读取的那四个扇区是一样的:设置ax,bx,cx,dx的参数,然后调用0x13中断。

    最后会跳转到0x9020位置,即第二个扇区的位置,第二个扇区开始就是setup.s的内容了。最终整个内存如下图所示

在这里插入图片描述

📃一些其他细节

    下面是read_it函数的细节,用来读取240个扇区的

SETUPLEN = 4				; nr of setup-sectorssread:	.word 1+SETUPLEN	; sectors read of current track
head:	.word 0			; current head
track:	.word 0			; current trackread_it:mov ax,es          ; 将ES寄存器的值移动到AX寄存器test ax,#0x0fff     ; 测试AX的低12位是否为0(检查ES是否在64KB边界上)
die:	jne die          ; 如果不是,跳转到标签die,形成无限循环xor bx,bx          ; 将BX寄存器清零,用作段内起始地址
rp_read:mov ax,es          ; 再次将ES寄存器的值移动到AX寄存器cmp ax,#ENDSEG      ; 比较AX和ENDSEG,检查是否已经读取了所有数据jb ok1_read        ; 如果AX小于ENDSEG,跳转到ok1_readret                 ; 如果已经读取完毕,返回
ok1_read:seg cs             ; 将下一段代码的段寄存器设置为csmov ax,sectors      ; 将sectors的值(在最后)移动到AX寄存器sub ax,sread        ; 从AX中减去sread的值,计算剩余需要读取的扇区数mov cx,ax          ; 将计算结果移动到CX寄存器shl cx,#9          ; 将CX左移9位,转换为字节偏移量add cx,bx          ; 将BX(段内起始地址)加到CX(偏移量)jnc ok2_read       ; 如果没有发生进位,跳转到ok2_readje ok2_read        ; 如果CX等于0xFFFF,也跳转到ok2_readxor ax,ax          ; 清零AX寄存器sub ax,bx          ; 计算BX的补码shr ax,#9          ; 将AX右移9位,转换回扇区数
ok2_read:call read_track     ; 调用read_track函数读取磁盘扇区mov cx,ax          ; 将返回的扇区数移动到CX寄存器add ax,sread       ; 将sread的值加到AX(已读取扇区数)seg cs             ; 再次将代码段寄存器的值移动到ES寄存器cmp ax,sectors     ; 比较AX和sectors,检查是否已经读取了所有扇区jne ok3_read       ; 如果没有,跳转到ok3_readmov ax,#1          ; 设置AX为1sub ax,head        ; 从1减去head的值,检查是否需要更新trackjne ok4_read       ; 如果不相等,跳转到ok4_readinc track          ; 如果相等,增加track的值
ok4_read:mov head,ax        ; 更新head的值xor ax,ax          ; 清零AX寄存器
ok3_read:mov sread,ax       ; 更新sread的值shl cx,#9          ; 将CX(扇区数)左移9位,转换为字节偏移量add bx,cx          ; 将偏移量加到BX(段内起始地址)jnc rp_read        ; 如果没有发生进位,跳转到rp_read继续读取mov ax,es          ; 将ES寄存器的值移动到AX寄存器add ax,#0x1000     ; 增加AX的值,移动到下一个64KB段mov es,ax          ; 更新ES寄存器的值xor bx,bx          ; 清零BX寄存器,重置段内起始地址jmp rp_read        ; 跳转到rp_read继续读取read_track:push ax            ; 保存AX寄存器的值push bx            ; 保存BX寄存器的值push cx            ; 保存CX寄存器的值push dx            ; 保存DX寄存器的值mov dx,track       ; 将track的值移动到DX寄存器mov cx,sread       ; 将sread的值移动到CX寄存器inc cx             ; 增加CX的值,准备读取下一个扇区mov ch,dl          ; 将DX的低8位(即CL)移动到CHmov dx,head        ; 将head的值移动到DX寄存器mov dh,dl          ; 将DX的低8位(即DL)移动到DHmov dl,#0          ; 清零DL寄存器and dx,#0x0100     ; 取DX的第8位,设置为0,其他位清零mov ah,#2          ; 设置AH为2,准备读取扇区int 0x13           ; 调用BIOS中断0x13,执行读取操作jc bad_rt          ; 如果读取失败,跳转到bad_rtpop dx             ; 恢复DX寄存器的值pop cx             ; 恢复CX寄存器的值pop bx             ; 恢复BX寄存器的值pop ax             ; 恢复AX寄存器的值ret                 ; 返回到调用read_track的地方
bad_rt:mov ax,#0          ; 设置AX为0mov dx,#0          ; 设置DX为0int 0x13           ; 再次调用BIOS中断0x13,执行读取操作pop dx             ; 恢复DX寄存器的值pop cx             ; 恢复CX寄存器的值pop bx             ; 恢复BX寄存器的值pop ax             ; 恢复AX寄存器的值jmp read_track     ; 跳转回read_track,尝试重新读取sectors:.word 0

   

🎯boot文件总结

    整个boot文件其实只做了两件事,一件事是设置各个段寄存器的地址,第二个就是把磁盘加载进内存中,最开始是将自己放入0x7c00位置,然后又复制了自己到0x9000。之后把后续四个磁盘中的setup编译后的文件放入到0x9020处。最后将剩下的240个扇区放入到0x10000处。然后远跳到0x9020处准备执行第二个扇区,即setup中的部分。

📖参考资料

[1] linux源码趣读
[2] 一个64位操作系统的设计与实现
[3] 为什么主引导记录的内存地址是0x7C00?
[4] 为什么 x86 操作系统从 0x7c00 处开始


http://www.mrgr.cn/news/80593.html

相关文章:

  • 你了解TCP/IP参考模型吗
  • 【已解决】启动此实时调试器时未使用必需的安全权限。要调试该进程,必须以管理员身份运行此实时调试器。是否调试该进程?
  • [实操] 基于Firefly-III搭建个人财务管理系统
  • springboot controller get 如何获取参数
  • 1.C语言 typedef的使用方法
  • Ubuntu 挂载目录
  • kali Linux 2024.3安装教程2024(图文超详细)
  • LED 灯实验
  • C# WinForm移除非法字符的输入框
  • 四、CSS3
  • Java集合 HashMap 原理解读(含源码解析)
  • 灵当crm pdf.php存在任意文件读取漏洞
  • C#速成(GID+图形编程)
  • C++之二:类和对象
  • 基于STM32设计的粮食仓库(粮仓)环境监测系统_284
  • GIN
  • Latex 转换为 Word(使用GrindEQ )(英文转中文,毕业论文)
  • ubuntu升级python版本
  • 15.初始接口1.0 C#
  • Windows环境 (Ubuntu 24.04.1 LTS ) 国内镜像,用apt-get命令安装RabbitMQ,java代码样例
  • Yolo中OBB的角度范围和角度损失设计思路
  • flink SQL实现mysql source sink
  • 面试题整理2---Nginx 性能优化全方案
  • next.js 存在缓存中毒漏洞(CVE-2024-46982)
  • Qt之修改窗口标题、图标以及自定义标题栏(九)
  • 登陆harbor发现证书是错误的, 那么如何更新harbor的证书呢