SQL Server 任务调度与 CPU

一. 概述

我们知道在操作系统看来, SQL Server 产品与其它应用程序一样,没有特别对待。但内存,硬盘,cpu 又是数据库系统最重要的核心资源,所以在 SQL Server 2005及 以后出现了 SQLOS,这个组件是SQL Server 和 windows 的中间层,用于 CPU 的任务调度,解决 I/O 的资源争用,协调内存管理等其它的资源协调工作。下面我来试着讲讲 SQLOS 下的 Scheduler 调度管理。

二.CPU 的配置

在 Sql server 里点击数据库实例右键到属性,选择处理器进行配置。
在这里插入图片描述
最大工作线程数的默认值是 0 (注意这里配置的是 worker,它是对 CPU 的真正封装)。这使得 SQL Server 能够在启动时自动配置工作线程的数量。默认设置对于大多数系统是最好的。但是,根据您的系统配置,将最大工作线程数设置为一个特定的值有时会提高性能。当查询请求的实际数量小于最大工作线程数时,一个线程处理一个查询请求。但是,如果查询请求的实际数量超过最大线程量时,SQL Server 会将 Worker Threads 线程池化,以便下一个可用的工作线程可以处理请求。

配置如下图所示:
在这里插入图片描述
也可以通过T-sql 配置,下例通过 sp_configure 将 max worker 线程选项配置为 900

USE AdventureWorks2012 ;  
GO  
EXEC sp_configure 'show advanced options', 1;  
GO  
RECONFIGURE ;  
GO  
EXEC sp_configure 'max worker threads', 900 ;  
GO  
RECONFIGURE; 

Max Worker Threads 服务器配置选项不考虑的线程, 像高可用、Service Broker、 Lock 管理等其它。如果配置的线程数量超过了,下面的查询将提供关于系统任务产生的额外线程信息

is_user_process = 0 表示系统任务,非用户任务。

SELECT  s.session_id, r.command, r.status,  r.wait_type, r.scheduler_id, w.worker_address,  
w.is_preemptive, w.state, t.task_state,  t.session_id, t.exec_context_id, t.request_id  
FROM sys.dm_exec_sessions AS s  
INNER JOIN sys.dm_exec_requests AS r  
ON s.session_id = r.session_id  
INNER JOIN sys.dm_os_tasks AS t  
ON r.task_address = t.task_address  
INNER JOIN sys.dm_os_workers AS w  
ON t.worker_address = w.worker_address  
WHERE s.is_user_process = 0;

下面显示每个用户的活动会话数

SELECT login_name ,COUNT(session_id) AS session_count  
FROM sys.dm_exec_sessions 
WHERE status<>'sleeping'
GROUP BY login_name;  

下表显示了各种 CPU 和SQL Server 组合的最大工作线程的自动配置数量。

Number of CPUs 32-bit computer 64-bit computer
<= 4 processors 256 512
8 processors 288 576
16 processors 352 704
32 processors 480 960
64 processors 736 1472
128 processors 4224 4480
256 processors 8320 8576

根据微软的建议:这个选项是一个高级选项,应该只由经验丰富的数据库管理员或经过认证的 SQL Server 专业人员更改。如果您怀疑存在性能问题,则可能不是工作线程的可用性。原因更像是 I/O,这会导致工作线程等待。在更改最大工作线程设置之前,最好找到性能问题的根本原因。

三.调度原理

扫描二维码关注公众号,回复: 12568480 查看本文章

3.1 Scheduler 任务调度

SQL Server 的一个Scheduler 对应操作系统上的一个逻辑 CPU 用于任务分配。调度分配从 NUMA 节点级别开始。基本算法是一个用于新连接的循环调度。当每个新的连接到达时,它被分配给基于循环的调度器。在相同的 NUMA 节点内,以最小的负载因子分配给调度器的新连接。

3.2 Worker

Worker 又称为 WorkerThread,每个 Worker 跟一个线程,是 SQL Server 任务的执行单位。 多个Worker 对应一个 Scheduler,公式 Workers=max worker threads/onlines scheduler。在一个 Scheduler 上,同一时间只能有一个 Worker 运行。例如 4 个处理器的 64 位操作系统,它的每个 Scheduler 的 Worker 是 512/4=128。

3.3 Task

在 Worker 上运行的最小任务单元。最简单的Task就是一个简单的 Batch,当一个会话发出一个请求时,SQL Server 会把这个请求拆分一个或多个任务(Tasks),然后关联对应个数的工作者线程(worker thread)。

例如下面是两个 Task ,两个 Task 可能不是同一个 Worker。两个 Worker 也可能不是同一个 Scheduler。

select @@servername
Go
select getdate()
GO

每个 Task 线程都有 3 种状态:

  • Running: 一个处理器在某个时间只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就是 running。

  • Suspended: 没有足够资源时,当前线程放弃占有处理器,变成挂起状态。

  • Runnable: 一个线程已完成了等待,但还没有轮到它运行,就会变成 runnable 状态,这种信号等待(signal wait)

在这里插入图片描述

3.4 Yielding
Yelding 就是所有逻辑 scheduler 上运行的 Worker 都是非抢占式的, 在 Scheduler 上 Worker 由于资源等待,让出给其它 Worker 就叫 Yielding。

下面讲述几种发生的状态:

  • 当 Woker 在 Scheduler 上运行了超过 4ms ,就做 Yielding。

  • 每做 64k 的结果集的排序,就会做一次 Yielding。

  • 做语句 Complie 编译的过程中,这个过程比较占 CPU 资源时,经常会有 Yielding 等待。

3.5 调度关系图

在这里插入图片描述
3.5 Task 调度运行图
在这里插入图片描述

  • 当 Task 处于 Runnig 状态时,它是 Schedler 的活动 Worker。
  • 当 Task 只等待 CPU 运行时,它被放入 Schedler 可运行的队列中。
  • 当 Task 在等待某个资源时(比如锁、磁盘输入/输出等)时,它处于Suspended 挂起状态。
  • 如果Task Scheduler 挂起状态完成了等待,那么它就会被放到 Scheduler 的 Runnable 队列的末尾。
  • 如果运行线程自动 Yidlding 让步,则将其放回 Scheduler 的 Runnable 队列的末尾。
  • 如果运行的线程需要等待某个资源,它将被调出 Scheduler 调度器并进入挂起状态 Waiter list。
  • 如果正在运行的线程完成它的工作,那么 Runnable 队列的顶部的第一个线程就变成了“运行”线程。

四. 使用 dmv 任务查看

4.1 通过 sys.dm_os_sys_info 查看 scheduler 与 cpu 的关系

SELECT cpu_count,max_workers_count,scheduler_count FROM sys.dm_os_sys_info

在这里插入图片描述
4.2 查看 查看Task与Worker关系

--在每一个连接里,我们可能会有很多 batch,分解成多个 task 以支持如并行查询
 select task_address,task_state,scheduler_id,session_id,worker_address  
 from sys.dm_os_tasks  where session_id>50

在这里插入图片描述

select state,last_wait_type,tasks_processed_count,task_address, worker_address, scheduler_address
 from sys.dm_os_workers where  worker_address  =0x0000000445C56160

在这里插入图片描述
4.3 查看 Scheduler

--scheduler_id<255 代表用户CPU,相反代表SYSTEM SCHEDULER
SELECT
    scheduler_id,
    cpu_id,
    is_online,
    current_tasks_count,
    runnable_tasks_count,
    current_workers_count,
    active_workers_count,
    work_queue_count
  FROM sys.dm_os_schedulers
  WHERE scheduler_id < 255

在这里插入图片描述

  • cpu_id:关联的 CPU 。 cpu_id >=255 这类 Scheduler 都用于系统内部使用。比如说资源管理、DAC、备份还原操作等。
  • is_online: 0 表示调度器离线,1 表示在线。
  • current_tasks_count: 当前任务数,状态包括:(等待,运行,已完成)。
  • runnable_tasks_count: 已分配任务,并在可运行队列中等待被调度的任务数,使用率不高的情况下,这个值会是 0。
  • current_workers_count: 此 scheduler 关联的线程数。包括处于空闲状态的线程 work 。
  • active_workers_count: 当前处理活动的线程数,它必须关联任务 task ,包括 running , runnable , suspend 。
  • work_queue_count: 队列中的任务 task 等待数,如果不为 0,意味着线程用尽的压力。

原文链接:https://www.cnblogs.com/MrHSR/p/9087686.html

猜你喜欢

转载自blog.csdn.net/Ruishine/article/details/114065786