K8S集群调度

scheduler:负责调度资源，把pod调度到指定的node节点

预算策略：

优选策略：

1、List-watch

K8S集群当中，通过list-watch的机制进行每个组件的协作，保持数据同步。每个组件之间的解耦。

kubectl：配置文件，向APIserver发送命令----apiserver把命令发送到各个组件

kubectl run nginx --image=nginx:1.22-----apiserver-----controller manager-----scheduler-----kubelet.

创建成功之后，kubectl get pod kubectl describe pod nginx-------->etcd的数据库当中。

list-watch---会在每一步把监听的消息（APIserver：6443）------controller manager ,scheduler .kubelet，etcd都会监听apiserver:6443端口

2、调度的过程和策略

scheduler是k8s集群的调取器，把pod分配到集群的节点

以下几个问题：

1、公平，每个节点都能够分配资源

2、资源高效利用：集群当中的资源可以被最大化使用

3、效率：调度的性能要搞好，能够尽快的完成大批量的pod的调度工作

4、灵活：允许用户根据自己的需求，控制和改变调度的逻辑。

scheduler是一个单独运行的程序，启动之后就会一直监听APIserver.获取报文中的字段：spec.nodeName

创建pod时，为每个Pod创建一个binding，表示该往哪个节点上部署。

创建pod到节点时，有两个策略，先执行预算策略，再执行优先策略这两步的操作都必须成功，否则立刻返回报错。

也就是说，部署的node，必须满足这两个策略。

预算策略：

predicate自带一些算法来选择Node节点（scheduler自带的算法策略，不需要人工干预）

1、podfitsresources:pod适应资源，检查节点上的剩余资源是否满足pod请求的资源。主要是cpu和内存

2、podfitshost：pod适应主机，如果pod指定了Node的name，nginx1pod--->node01,检测主机名是否存在，存在要和pod指定的名称匹配，才能调度过去

3、podeslectormatchers:pod选择器匹配，创建pod的时候可以根据node的标签来进行匹配。查找指定的node节点上标签是否存在，存在的标签是否匹配。

4、nodiskconflict：无磁盘冲突，确保已挂载的卷与pod的卷不发生冲突,除非目录是只读

如果预算策略都不满足，pod将始终处于pending状态，不断的重试调度，直到有节点满足条件为止

node1 node2 node3

经过预算策略，上述三个节点都满足，那该怎么办？---->优选

优先策略

leastrequestedpriority：最低请求优先级，通过算法计算节点上的cpu内存使用率，确定节点的权重

使用率越低的节点相应的权重越高。调度时会更倾向于使用率低的节点。实现资源合理的利用

balanceresourceallocation：平衡资源分配，cpu和内存的使用率，给节点赋予权重，权重算的是cpu和内存使用率接近。权重越高

和上面的leastrequestedpriority最低请求优先级一起使用

node1 cpu和内存使用率:20:60

node2 cpu和内存使用率：50:50

node2在被调度时会被优先选择。

imagelocalitypriority：节点上是否已经有了要部署的镜像。镜像的总数成正比，满足的镜像数越多，权重越好

nginx:1.22

node1 无

node2 有

以上这些策略scheduler自带的算法

通过预算选择出可以部署的节点，再通过优先选择出来最好的节点，以上都是自带的算法。k8s集群自己来选择

指定节点：

spec参数设置：

nodeName:node02

指定了节点，在参数中设置了nodeName,指定了节点的名称，会跳过scheduler的调度策略，这个规则是强制匹配

指定标签：

spec

nodeSelector:kubectl get nodes --show-labels 查看所有节点的标签

kubectl label nodes master01 test1=a kubectl label nodes node01 test2=b kubeclt label nodes node02 test3=c

以上三行，创建自定义标签的命令

kubectl get deployment.apps -o wide 可以看到已经部署的deployment的标签

nodeSelector:

指定节点标签部署pod，是要经过scheduler的算法，如果节点不满足条件，pod会进入pending状态，直到节点满足条件为止

亲和性：

节点亲和性和pod亲和性

软策略与硬策略

node节点的亲和性：

preferredDuringSchedulingIgnoredDuringExecution 软策略：

选择node节点时，我声明了我最好能部署在Node01,软策略会尽量满足这个条件。不一定会完全部署在node01节点上

requiredDuringSchedulinglgnoreFuringExecution 硬策略：

选择pod时，声明了node01,我是硬策略，必须满足硬策略的条件。必须部署在node01,强制性要求

pod的亲和性：

preferredDuringSchedulingIgnoredDuringExecution 软策略

要求调度器将pod调度到其他pod的亲和性匹配的节点上。可以是，也可以不是，尽量满足

pod nginx1 node01

pod nginx2 nginx2希望跟nginx1部署在一个节点上，尽量满足。

requiredDuringSchedulinglgnoreFuringExecution 硬策略

要求调度器将Pod调度到其他pod的亲和性匹配的节点上。必须是

pod nginx1 node01

pod nginx2 nginx2必须要和nginx的亲和性匹配，只能往node01

键值的运算关系：

标签，都是根据标签来选择亲和性

In：在

选择的标签值在node节点上存在

Notin:不在

选择label的值不在node节点上存在

Gt:大于，大于选择的标签值

Lt:小于，小于选择的标签值

Exists：存在，选择标签对象，值不考虑

DoesNotExist:不存在，选择不具有指定标签的对象。值不考虑。

软策略：

多个软策略看权重，权重高，执行指定的软策略

硬策略：

先满足硬策略，再考虑软策略

猜你喜欢