当前位置：首页 > news >正文

Linux操作系统面试题记录

news 2025/12/25 14:52:27

一、进程与线程

并发和并行的区别？

并发：一个cpu处理器处理多个任务；
并行：多个cpu处理器处理多个任务；

进程和线程是什么？区别？何时用线程何时用进程？

Linux中其实没有进程线程之分，fork和pthraed_create都会do_fork来创建，只是参数不同，pthread的参数会指定多个进程之间共享某些资源；
进程：资源分配；独立的地址空间；进程之间的通信要用进程间通信；创建开销大，切换效率低，但资源管理和保护好
线程：程序执行；共享进程的地址空间和资源，但拥有独立的栈；线程通信方便（全局变量）；创建开销小，切换效率高，适合频繁切换；

为什么要用多线程？

解决负载均衡问题，提高CPU利用率，同时干几件事；

进程控制块PCB？

PCB在linux中就是task_srtuct,包含了pid，uid，状态，优先级，资源分配清单（进程地址空间，打开文件列表，IO设备信息）mm_struct，cpu各个寄存器的值；

PCB的组织方式：双向链表！把具有相同状态的进程PCB链在一起，组成各种队列，就绪链表，阻塞链表等

进程的创建过程？

创建进程：创建PCB（task_struct）、进程地址空间（mm_struct）、创建页表，将PCB插入任务链表，将进程的代码和数据载入内存；

进程的创建终止过程？

找到PCB、终止执行让出CPU、如果有子进程，将子进程给给init领养、进程资源还给os，将PCB从所在队列中删除；

僵尸进程？孤儿进程？

僵尸进程：子进程退出，但父进程没有getwait，为它清理；
孤儿进程：父进程退出，子进程还没退出，子进程将会被init领养；

守护进程?怎么实现？

守护进程：运行在后台的进程，只有需要才唤醒；
创建时有意将父进程退出，被init收养，进行setsid，chdir，umask，成为守护进程；

僵尸进程的危害？

子进程退出之后，PCB会维护退出信息，如果子进程退出越来越多，但父进程没wait清理，将会占用越来越多的内存，造成内存浪费，甚至会程序崩溃；

进程阻塞和唤醒进程？

找到PCB，保护/恢复现场，设置状态为就绪/阻塞，将pcb插入就绪/阻塞队列；

进程状态？转换图？

进程的状态有：创建，就绪，运行，阻塞，结束

linux系统通常将阻塞状态的进程，换出到硬盘，等到再次需要运行的时候再重新加载进内存；

进程上下文切换

进程是由内核管理和调度的，进程上下文切换发生在内核态；
进程上下文不仅包括：用户空间的虚拟内存，栈，全局变量，还包括内核空间的内核堆栈，寄存器等；通常会将保存的信息存储在PCB中；
情况：时间片耗尽，系统资源不足阻塞，主动sleep休眠，被高优先级抢占，硬件中断（执行内核中的中断服务程序）

线程上下文切换

同一个进程中的多个线程可以共享代码段和数据段（地址空间），打开的文件等，但每个线程有独立的寄存器和栈；

当进程中的一个线程崩溃时，会导致其所属进程的所有线程崩溃（这里是针对 C/C++ 语言）
解释：进程的崩溃是当非法访问内存（向只读写，访问无权限地址，访问不存在内存如空指针）通过发送kill信号退出进程，java不会崩溃是因为JVM对信号定义了自己的处理函数，恢复了进程的运行；

线程共享的资源是什么?

代码段，数据段，地址空间和文件资源；
当两个线程不是属于同一个进程，则切换的过程就跟进程上下文切换一样;
当两个线程是属于同一个进程，因为虚拟内存是共享的，所以在切换时，虚拟内存这些资源就保持不动，只需要切换线程的临时数据、寄存器等不共享的数据;

用户线程和内核线程？

用户线程：用户空间实现的线程，基于线程库而不由内核管理；用户级的线程库完成线程的管理，包括创建终止调度；
优点：线程切换不需要内核态用户态切换，切换速度快，创建销毁的开销小，线程管理更加灵活；
缺点：同一进程中只能同时有一个线程在运行，如果有一个线程使用了系统调用而阻塞，那么整个进程都会被挂起。时间片是分给进程，多线程的时候，每个线程的时间片更少，执行会比较慢；

用户级线程的系统内，CPU调度还是以进程为单位，有内核支持线程的系统内，CPU调度则以线程为单位；

内核线程：内核中实现的线程，由内核进行管理；
优点：内核线程系统调用阻塞，不影响其他内核线程；更多的执行时间；
缺点：线程的创建和销毁切换开销更大（系统调用核态切换）

调度原则和调度算法？
CPU利用率（I/O），系统吞吐量（长短任务），周转时间（运行+就绪+阻塞），等待时间（就绪时间），响应时间（提交到第一次响应）
先来先服务：
最短作业：（吞吐量up，单位时间内运行的任务更多）
高响应比：

时间片轮转：

最高优先级：
非抢占式:当就绪队列中出现优先级高的进程，运行完当前进程，再选择优先级高的进程；
抢占式:当就绪队列中出现优先级高的进程，当前进程挂起，调度优先级高的进程运行；
完全公平调度：静态优先级和动态优先级，红黑树；

多级反馈队列：
【多级】表示有多个队列，每个队列优先级从高到低，同时优先级越高时间片越短。
【反馈】表示如果有新的进程加入优先级高的队列时，立刻停止当前正在运行的进程，转而去运行优先级高的队列;
如果在第一级队列规定的时间片没运行完成，则将其转入到第二级队列的末尾，以此类推，直至完成;

可以发现，对于要办理短业务的客户来说，可以很快的轮到并解决。对于要办理长业务的客户，一下子解决不了，就可以放到下一个队列，虽然等待的时间稍微变长了，但是轮到自己的办理时间也变长了，也可以接受，不会造成极端的现象，可以说是综合上面几种算法的优点。

内核进程调度过程？

linux中有个queue，分为活动队列和过期队列，内核从优先级高到低遍历活动queue，找到进程运行，运行完这个优先级的进程，继续往后遍历，直到全部进程都运行完毕，活动队列和过期队列的指针内容交换，又有新的一批活动队列；

8.优先级如何修改？

PRI和NI加起来才是真正执行的优先级，修改优先级只需要修改top + r 修改NICE值就可以了；

进程的地址空间按低地址到高地址系统地讲述一下，为什么要用进程地址空间？

写时拷贝？为什么要写时拷贝？

9.进程上下文？线程上下文？中断上下文？

内核进程调度过程？

调度算法？

请问就绪状态的进程在等待什么？

空闲的进程和阻塞的进程状态会不会在唤醒的时候误判？

一个进程最多能创建多少个线程？

32 位系统，用户态的虚拟空间只有 3G，如果创建线程时分配的栈空间是 10M，那么一个进程最多只能创建 300 个左右的线程。虚拟空间上限限制；
64 位系统，用户态的虚拟空间大到有 128T，理论上不会受虚拟内存大小的限制，而会受系统的参数或cpu性能限制。

二、进程间通信方式

进程间有几种通信方式？

1.管道，匿名管道：父子间通信；管道是内核里的缓存，是特殊的文件，不在文件系统里面；匿名管道的生命周期，是随进程的创建而建立，随进程的结束而销毁。

有名管道：创建了管道的设备文件，可以在不相关的进程之间进行通信；（无格式的字节流）
2.消息队列；保存在内核的消息链表中，有固定的消息体大小（双态数据拷贝开销，消息体大小有限制）
3.共享内存；不同进程分配一段虚拟内存空间，映射到相同的物理内存中；
4.信号量；不用于缓冲数据，而用于进程之间的同步和互斥；
5.信号；唯一的异步通知机制；进程有三种方式响应信号 1. 执行默认操作、2. 捕捉信号、3. 忽略信号。
5.套接字；不同主机之间的通信；

Socket编程

共享内存怎么实现

3.进程和线程的资源？线程共享的资源是什么？

5.进程线程创建函数？进程的创建过程？

6.父子进程？通信？全局变量？

11.什么是进程调度？

12.进程调度的规则

13.进程调度的算法？

14.什么是上下文切换？

共享内存怎么实现？

三、同步与互斥

8.线程安全是什么？怎么实现？

线程安全就是多线程同时执行的时候和单个线程执行的时候，结果和变量不变，那就是线程安全的；
线程安全问题都是有全局变量和静态变量引起的，我们可以采取的方法有1.加锁互斥访问；2.线程本地化，为共享变量创建本地副本；3.非阻塞同步，没有其他线程争用才能操作成功；

9.同步与互斥？线程同步方法？

线程同步指的是多个线程安装预定的执行顺序去执行；
互斥指的是同一时间只能有一个线程去访问共享资源；
同步：信号量，事件通知；
互斥：互斥锁，临界区；

四、死锁

15.死锁？必要条件？如何解决？

16.如何预防死锁？

17.鸵鸟，银行家算法？

18.递归锁

用户态怎么进入内核态

系统调用和函数调用

五、堆和栈

堆和栈的区别？堆的作用？等

（见freertos章节）

六、内存

什么是虚拟内存？虚拟内存有什么作用？

虚拟内存是虚假的连续内存，需要通过mmu才能转换成真实的物理内存；
优点：
①扩大内存的地址空间，可以超过真实的物理内存；
②每个进程拥有自己独立的地址空间和独立的页表，相互独立，减少了多进程之间地址冲突的问题；
③页表项里记录了属性标志，例如读写权限，为os提供更好的安全性；
缺点：页表占内存，换入换出消耗时间，虚拟地址转换也消耗时间；

内存管理方式有几种？

主要有分块，分段，分页；和它们之间的结合
分块：把内存分为一块一块的，需要了就分配一大块；
分段：根据程序的逻辑，分成不同属性的段，栈段、堆段、数据段、代码段等
分页：分成大小固定的页，linux是4kb；

为什么要分页分段？

分块(内存碎片严重)——>分段(外部内存碎片和内存交换效率低)——>分页(维护页表数据结构占用内存大，页内部碎片)
每个段的长度不固定，所以多个段未必能恰好使用所有的内存空间；
硬盘读写比内存慢，如果读写大段的内存会导致卡顿；

分页的话一次性写入磁盘的也只有少数的一个页或者几个页，效率高很多；
分页我们可以不用一次性将程序加载入内存，我们建立完映射关系之后，可以等到用到的时候再加载到内存中去；

为什么使用多级页表？

页表一定要覆盖全部物理地址空间，如果单级页表就要100多万个页表项，而二级页表就只需要1024的项；当一级页表没有建立映射关系的时候，对应的二级页表项是可以不用建立的；
假设只有 20% 的一级页表项被用到了，4KB（一级页表） + 20% * 4MB（二级页表）= 0.804MB 节约内存！

解释下虚拟地址，逻辑地址，线性地址，物理地址？

程序在使用的地址，还未经段式内存管理单元映射的叫逻辑地址；
通过段式内存管理单元的映射的地址叫线性地址也是，虚拟地址；
在通过页式内存管理单元映射之后变成真实的物理地址；
补充：Linux 内核所采取的办法是使段式映射的过程实际上不起什么作用。linux每个段都是从0地址开始的整个4GB虚拟空间，相当于屏蔽了逻辑地址；