清华大学操作系统OS学习(十)——处理机调度

一、处理机调度概念

1、进程切换(上下文切换):切换CPU的当前任务,从一个进程/线程到另一个,保存当前在PCB/TCB中的执行上下文,读取下一个的上下文

2、CPU调度:从就绪队列中挑选一个进程/线程作为CPU将要运行的下一个线程/进程

3、调度程序:挑选进程/线程的内核函数(通过一切调度策略)使得效率最高,满足用户需求

4、在进程/线程的生命周期中的什么时候进行调度?

从一个状态变为另一个状态,特别是和运行(running)相关的状态。

内核运行调度程序的条件:进程从运行状态切换到等待状态or终结了(done)

不可抢占调度,调度必须等待事件/进程结束,早期OS。

现在多为可以抢占的进程,OS决定在何时打断进程,调度程序在中断被响应后执行,当前进程从运行切换到就绪,或者一个进程从等待切换到就绪,可以被换出。

5、针对的是用户态的进程。

进程在内核中通过系统调用执行,因为系统调用返回时是到发起这个调用的进程继续执行,所以内核中不会切换,抢占。只要进程在系统调用时不存在从运行态到阻塞态的变化,OS可以确保返回正常。

二、调度准则

1、处理机资源的使用模式

CPU的占用率是波状,CPU大量运算是高峰,而读写I/O时是平稳的低值。每个调度决定都是关于下一个CPU突发时将哪个工作交给CPU,在时间分片下,线程可能在结束当前CPU突发前被迫放弃CPU。 

程序在CPU突发和I/O中交替,CPU占用率高说明是在充分地使用CPU。

2、比较调度算法的准则

①CPU使用率:CPU处于忙状态的时间百分比

②吞吐量:单位时间内完成的进程数量

③周转时间:一个进程从初始化到结束包括(所有等待时间)所花费的总时间,周转时间=等待时间+服务时间

④等待时间:进程在就绪队列中的总时间,进程从就绪态到运行态的时间。

⑤响应时间:一个请求被提交到第一次响应所花费的总时间

2、吞吐量与延迟

什么是更快?

①高带宽:吞吐量高 (传输文件)

②低延迟:响应时间快(玩游戏)

3、调度算法的响应时间目标

  • 减少响应时间:及时处理用户的输入请求,尽快发馈给用户
  • 减少平均响应时间的波动:交互系统中,可预测性比高差异低平均更重要
  • 低延迟调度改善用户的交互体验 
  • 响应时间是操作系统的计算延迟

4、调度策略的吞吐量目标

①增加吞吐量:减少开销(操作系统开销,上下文切换) 、系统资源的高效利用(CPU,I/O设备)

②减少等待时间

5、处理机调度的公平性目标

①公平的定义:保证每个进程占用相同的CPU时间;保证每个进程的等待时间相同

②公平通常会增加平均响应时间

三、先来先服务、短进程优先和最高响应比优先调度算法

1、FCFS first come first served先来先服务算法

①依据进程进入就绪状态的先后顺序排列

②如果前面的进程运行的时间长,后面的进程就只能等着,导致周转时间慢。如果进程阻塞了,队列中的下一个会得到CPU

③特征

优点:简单 

缺点:平均等待时间波动大,花费时间少的可能反而排在后面,可能导致CPU和I/O之间的重叠处理,没考虑抢占,CPU密集的进程导致I/O闲置时,I/O密集型进程也在等。

2、短进程优先算法

①选择就绪队列中执行时间最短进程占用CPU进入运行状态,就绪队列按预期的执行时间来排序;

②短进程优先算法具有最优平均周转时间

不可抢占:SJF、SPN

可抢占:ready queue中的第一个进程正在运行时,来了一个比它的预测完成时间还短的进程,SPT

③特征

优点:最小的平均等待时间和周转时间

缺点:可能导致长任务饥饿,不能保证公平;需要预知未来下一个进程的时间,比如询问用户,如果用户欺骗就杀死进程。

④短进程优先算法的执行时间预估

根据执行历史看将来CPU突发的持续时间,递归展开

3、最高响应比优先算法(HRRN)

①选择就绪队列中响应比R值最高的进程

R=(w+s)/s

w:等待时间(waiting time)

s:执行时间(service time)

②在短进程优先算法的基础上改进;不可抢占;关注进程的等待时间;防止无限期推迟。

四、时间轮转、多级反馈队列、公平共享调度算法和ucore调度框架

1、时间片轮换算法(RR)

①、时间片:分配处理机资源的基本时间单元

②、算法思路:用时间切片和抢占来轮流执行,强调了公平 

在量子切片/时间切片的离散单元中分配处理器,时间片结束时切换到下一个准备好的进程 

③、时间片长度

开销: 额外的上下文切换; 时间片太大则等待时间过长会退化成FCFS,太小反应迅速但吞吐量由于大量的上下文切换开销受影响 ;选择一个合适的时间片,经验是维持上下文切换开销处于1%以内,现在LINUX是千分之一秒

2、多级队列调度算法(MQ)

①、就绪队列分为多个相对独立的队列,前台交互,RR,后台/底层批处理,FCFS,调度在队列间进行,每个队列拥有自己的调度策略。

②、队列间的调度:

Ⅰ、固定优先级:先前台,再处理后台,可能导致饥饿

Ⅱ、时间切片轮转:每个队列都得到一个确定的,调度其进程的CPU总时间,如80%给前台,20%给后台

3、多级反馈队列算法(MLFQ)

①、优先级队列中的时间片轮换有动态调整:

一个进程可以在不同队列中移动,N级优先级

在所有队列中优先级调度,每个级别内部RR轮换

时间片大小随优先级增加而增加,若当前时间量子中没有完成就给当前任务则降到下一个优先级

②、一个进程,先是I/O密集型,提到高优先级,然后变为CPU密集型,就随着不断消耗时间片就下降到低的优先级,保证I/O密集型任务停留在高优先级 

等待时间越长,优先级越高,服务时间越长优先级越低 ,能动态地根据进程的特征调整队列和调度

4、公平共享调度(FSS)

①在用户级别实现公平共享 

②FFS 一些用户组比其他组更重要,保证不重要的组无法垄断资源,未使用的资源按照每个组所分配的资源的比例来分配,没有达到资源使用率目标的组获得更高的优先级

5、评价调度方法

  • 确定性建模,对确定的工作量计算每个算法的表现
  • 队列模型:用来处理随机工作负载的数学方法
  • 实现/模拟:建立一个允许算法运行实际数据的系统,最灵活,一般性

五、实时调度和多处理器调度

1、实时调度

①、定义:正确性依赖于其时间和功能两方面的一种OS

②、性能指标:时间约束的及时性(deadlines),速度和平均性能相对不重要,重点是时间约束的可预测性。

③、实时任务:任务/工作单元(一次计算,一次文件读取,一次信息传递等等) 

任务属性:取得进展所需要的资源和实时参数 

任务请求时间(release time):进程处于就绪态的时间 

相对截止时间(relative deadline): 任务是间隔时间段完成,每个任务有个特定的时间,要在特定的时间段内完成 

绝对截止时间(absolute deadline):最终的结束时间

④、周期任务:一系列相似的任务,有规律的重复

周期p=任务请求时间间隔 (0 < p) 

执行时间e=最大执行时间,最大执行时间< p 

使用率/利用率:U=e/p

2、类别 

硬实时系统/强实时系统:如果某个任务没完成有严重后果 

软实时系统/弱实时系统:重要的进程优先级更高,要尽量完成,如看视频,帧数没控制好会掉帧。

3、实时调度算法

①、速率单调调度算法(RM):通过周期安排优先级,周期越短优先级越高,执行周期最短的任务;

②、最早截止时间优化算法(EDF):截止时间越早优先级越高,执行截止时间最早的任务

4、多处理器调度 

要考虑:1,任务来了,放在哪个CPU上执行?2,怎么考虑公平性?load balance负载平衡 

多处理器的CPU调度更加复杂,多个相同的单处理器组成一个多处理器,优点是负载共享。对称多处理器(SMP),每个处理器运行自己的调度程序,需要在调度程序中同步

六、优先级反置

①、优先级反转:可发生在任何基于优先级的可抢占的调度机制中,当高优先级任务要等待低优先级任务时发生,优先级反转的持续时间取决于其他不相关任务的不可预测的行为 

②、优先级继承:如果有共享资源,低优先级任务继承等待它所占的资源的最高优先级任务的优先级,当阻塞发生时资源的拥有者的优先级会自动提升,使中间优先级的不能抢占。

T3先执行,到t2时访问共享资源,t3时T1抢占,开始执行T1,某时刻需要访问已经被T3占用的共享资源,但T3还没有释放,所以不能继续T1开始等待,t5时T2又抢占执行,此时T1受制于T2的执行时间,因为T1必须要等T3,导致T1的时间延长了,引起不稳定状态,系统重启。

T3的优先级继承了T1的优先级

③优先级天花板:资源的优先级=所有可以锁定该资源的任务中优先级最高的那个任务的优先级。事先统计。一旦某任务占用该资源,则优先级提升为资源的优先级。不论阻塞是否发生。

除非优先级高于系统中所有被锁定的资源的优先级上限,否则任务在尝试执行临界区的时候会被阻塞。

持有最高优先级上限信号量锁的任务,会继承被该锁阻塞的任务的优先级

猜你喜欢

转载自blog.csdn.net/qq_36552489/article/details/92795915