SQL性能分析

SQL执行频率

SQL慢查询日志

Profile

SQL性能分析

通过SQL性能分析来做SQL的优化，主要是优化SQL的查询语句（其中索引的优化占主要部分）

SQL执行频率

通过以下命令来查看INSERT、UPDATE、DELETE、SELECT的访问频次（查看不同语句所占的比例）

根据不同语句的执行频率来进行不同的优化

SHOW SESSION/GLOBAL STATUS; 查看当前会话/全局服务器的状态信息

SHOW SESSION/GLOBAL STATUS LIKE ‘Com_______’ #(7个下划线)查看当前会话/全局的SQL增删改查的执行频率（就是从服务器的状态信息中提取关于增删改查的信息）

show global status like 'Com_______'; #查看全局的SQL语句插入、更新、删除、查询的执行频率

SQL慢查询日志

查看MySQL的慢查询日志的开关是否打开

SHOW VARIABLES LIKE 'slow_query_log';

慢查询日志的作用

通过慢查询日志可以定位到哪些查询语句需要进行优化

慢查询日志是记录了所有执行时间超过指定参数（long-query-time，默认10s）的SQL语句的日志（即：当SQL语句的执行时间超过10s，我们就会认为此语句是慢查询）

慢查询日志的路径

Linux系统关于MySQL慢查询日志

Linux关于MySQL的配置文件在/etc/my.cnf中

Linux中默认MySQL的慢日志查询没有开启，需要配置MySQL的配置文件中配置如下信息:

       #开启MySQL慢日志查询开关

       slow_query_log = 1

       #设置慢日志的时间为2s，SQL执行时间超过2s就会被视为慢查询

       log_query_time = 2

       #保存之后然后重启mysql服务

Linxu会自动生成相关的日志文件存放慢日志查询中记录的信息，存放的位置在/var/lib/mysql/localhost-slow.log中

Windows系统关于MySQL慢查询日志

Windows默认开启了慢查询日志的开关，可以在MySQL的配置问价查看慢查询日志信息

Windows关于MySQL的配置文件在C:\ProgramData\MySQL\MySQL Server 8.0\my.ini中（以下是关于慢查询日志的配置信息）

       slow-query-log=1       #开启MySQL慢日志查询开关

slow_query_log_file="慢查询日志的存放位置" #指定慢查询日志文件的存放位置

long_query_time=10    #设置慢日志的时间为10s

如果还是找不到对应的慢查询日志的存储位置

可以通过show variables like 'slow_%'来查看

慢查询日志的格式

Time：执行SQL的时间

User@Host：通过哪个用户，在哪个主机上登录到此SQL的

Query_time：当前命令执行耗时的时间

Lock_time：表锁的时间（InnoDB的行锁等待不会反应在这里）

Rows_sent：返回多少行

Rows_examined：检查了多少行

USE：使用的哪个数据库

SET timestamp：执行SQL的时间戳

ApplicationName：此字段会注释掉，用于告知此用户是通过什么软件连接到数据库的（此处为DataGrip）

以及查询语句

如果Rows_examined很大，而Rows_sent很小，则说明此查询需要优化

Profile

通过Profile可以帮助我们了解SQL语句执行的时间都耗费到哪里去了（也会记录错误的语句）

查看当前MySQL是否支持profile操作以及是否启用了此操作

show variables like '%profil%';

在MySQL中开启Profile功能

set session/global profiling = True;

Window和Linux默认Profile是关闭的（不同的版本可能有区别）

Profile相关语句

SHOW PROFILES; #查看会话中每一条SQL的耗时基本情况（每条SQL语句都有唯一的query_id）

SHOW PROFILE FOR QUERY query_id; #查看此query_id对应的SQL语句各个阶段的耗时情况

SHOW PROFILE CPU FOR QUERY query_id; #查看此query_id对应的SQL语句的CPU使用情况

Explain

前面的分析语句都是通过时间粗略分析；explan可以看到Sql语句的执行计划（如何执行select语句信息，select语句执行过程中如何连接以及连接的顺序），经常通过此判断SQL语句的性能

MySQL索引3——Explain关键字和索引优化（SQL提示、索引失效、索引使用规则）_静下心来敲木鱼的博客-CSDN博客

SQL优化

插入数据的优化

Inster 优化

1、当插入多条数据时使用批量插入

INSTER INTO 表名 VALUES(值1.1 , 值2.1),(值1.2 , 值2.2)……;

2、当要插入的数据超过百条时，建议使用事务来进行优化（手动提交事务，通过事务来优化）

START TRANSCANTION;

INSERT INTO 表名 VALUES(值1.1 , 值2.1),(值1.2 , 值2.2)……;

INSERT INTO 表名 VALUES(值1.100, 值2.100),(值1. 101, 值2.101)……;

COMMIT;

3、当要大批量的插入数据时，使用INSTER语句插入性能低，可以使用MySQL提供的LOAD进行进行插入（将符合一定规则的文件直接导入到Mysql生成相应的表）

客户端连接MySQL时加上参数--local-infile；表示当前客户端连接服务端时，需要加载客户端本地文件

mysql --local-infile -u root -p

     2、设置全局参数local_infile为1；表示开启从本地加载文件导入数据的开关

       show variables like '%infile%';       #查看是否开启load开关

set global local_infile=1;            #开启load开关

     3、执行load指令将准备好的本地文件中的数据加载到表结构中

       load data local infile ‘本地文件的路径’ into table 表名 fields terminated by ‘每个字段对应值的分隔符’ lines terminated by ‘每一行数据的分隔符’；

建议分隔符都使用英文符号

模拟load插入

员工信息.txt文件（路径为C:/Users/123/Desktop/员工信息.txt）

创建user123表

create table User123(
id int auto_increment primary key,
name varchar(10),
age int,
origo varchar(10)
);

将.txt文件导入表中

load data local infile 'C:/Users/Tdemo/Desktop/员工信息.txt' into table user123 fields terminated by ',' lines terminated by ';';

此时查看表的数据

select * from user123;

主键优化

在对主键进行插入数据时，顺序插入性能高于乱序插入

InnoDB关于主键的数据组织方式

表数据都是根据主键顺序组织存放的，这种存储方式的表称为索引组织表(index organized table IOT)，我们再进行主键存放时就是根据顺序存放的

页分裂——乱序插入可能出现

页时InnoDB磁盘管理的最小单元，一个页的大小默认为16k，叶子节是有序的

每个页包含了2-N行数据（如果一行数据过大，就会行溢出）

页可以为空、也可以填充一半、也可以填充100%

主键顺序插入

主键乱序插入——可能会出现页分裂

50找到要插入的位置在第1个页的末尾；

发现此时第1页没有空间进行插入，此时会新建1个页；

然后找到第1个页的中间位置，将其右边的数据都迁移到新建的页中，然后再将50添加到新建的页中

此时再对三个页重新排序（需要消耗较多的性能）

页合并

当删除一行记录时，实际上记录并没有被物理删除，只是记录被标记(flaged)为删除；并且它的空间变得允许被其它记录声明使用

当页中删除的记录达到MERGE_THRESHOLD（默认为页的50%）,InnoDB会开始寻找最靠近的页（前或后）看看是否可以将两个页合并以优化空间

Merge_threshold 合并页的阈值，可以自己设置（在创建表或索引时指定）

主键设计原则

1、满足业务需求的情况下，尽量降低主键的长度（此操作可以降低二级索引占用的空间）

2、插入数据时，建议主键进行顺序插入；可以使用AUTO_INCREMENT自增主键

3、尽量不要使用无序的值来作为主键，导致插入主键时可能乱序，在检索时也会耗费大量的IO

4、在进行业务操作时，尽量避免对主键的修改

Order By优化

进行排序时通过Explain显示的Extra字段的内容类型如果为Using Filsort，则需要进行优化，尽量将其优化为Using Index（通过满足覆盖索引实现）

Using Filesort和Index讲解

1、Using Filesort：通过表的索引或者全表扫描，读取满足条件的数据行，然后在排序缓冲区sort buffer中完成排序操作；所有不是通过索引直接返回排序结果的排序都叫FileSort排序

2、Using Index：查找使用了索引，并且通过索引可以接返回有序的数据，不需要额外排序，操作效率高

3、Backward index scan：反向扫描索引，进行降序排序时会出现；也是单独子啊排序缓冲区完成排序操作；需要进行优化

如何优化Backward index scan

在创建索引时，MySQL8之前的版本默认只是针对升序创建了索引；我们可以额外对字段创建关于降序的索引

格式如下（在字段后面跟上排序方式）

create index 索引名 on 表名(字段1 asc , 字段2 desc);

为字段1创建升序索引，为字段2创建倒序索引

总结

1、当创建联合索引后，在进行排序时如果一部分按照升序排序，一部分按照降序排序，则会产生using filesort；此时可以为此单独再创建索引

2、在使用索引时尽量实现覆盖索引

3、在使用是要避免索引失效

4、如果不可避免的出现filesort，在大数据排序时，可以适当增大排序缓冲区的大小sort_buffer_size（默认256k）

5、Show variables like ‘sort_buffer_size’; #查看排序缓冲区的大小；当排序缓冲区占满之后会占用磁盘进行排序

Group By优化

主要研究索引对分组查询的影响，思路和排序优化是一致的

进行分组时通过Explain显示的Extra字段的内容类型如果为Using Temporary，则需要进行优化，尽量将其优化为Using Index（通过满足覆盖索引实现）

Using Temporary讲解

Using temporary：查找使用到了临时表，性能比较低

总结

1、在分组操作时可以通过索引来提高效率

2、在分组操作时，索引的使用也是满足最左前缀法则的

3、在分组操作时，尽量实现覆盖索引，避免回表查询

4、在分组操作时，避免索引失效

Limit 优化

在大数据量情况下，越往后分页，耗时越长，可能也会造成资源浪费

当我们查询limit 10000,10时，我们需要排序MySQL前10010条记录，但是只范围10000-10010之间的10条记录，其它记录丢弃，此时查询的代价就很大（排序是为了保证每次通过limit查到的记录都一样）

可以通过覆盖索引+子查询的方式优化

通过子查询找到10000-10010对应数据的主键值，然后再通过主键值来查找对应的数据

需要注意有些版本Mysql不支持在in之后使用子查询的语法，所以以下的语句无法实现

Select * from 表名 where 主键值 in (select 主键值 from 表名 order by limit 10000,10);

方式二我们可以将子查询的结果看作一张表，通过多表查询来实现

Select a.* from 表1 a, (select 主键值 from 表1 order by limit 10000,10) b where a.主键值=b.主键值;

Count 优化

不同存储引擎对于Count(*)的不同处理方式

MyISAM引擎中会把一个表的总行数存在磁盘上，因此执行count(*)的时候才会直接返回这个数，效率很高（前提是查询时没有where条件）

InnoDB引擎在执行count()*时，需要把遍历整张表，把数据一行一行地从引擎里面读出来，然后积累计数（如果为Null则不加1，如果为非Null值则计数加1），最后将积累的计数输出（无论是否有where条件，InnoDB都是这样操作的）

Count的不同用法以及性能差异

Count的主要用法有count(*)、count(主键)、count(字段)、count(X)

Count(主键) ——主键的总记录行数

会遍历整张表，把每一行的主键值提取出来返回给服务层，服务层拿到主键后直接按照行数进行累加（不进行判断是否为Null）

Count(字段) ——统计此字段有多少值不为Null，不一定是总记录数

分为加了Not Null约束和没有加Null约束两种情况

没有加Not Null约束：需要判断值是否为Null

把每一行的字段对应的值提取出来返回给服务层，服务层判断是否为Null，如果为Null则不加1，如果为非Null值则计数加1

加了Not Null约束：不需要判断是否为Null

把每一行的字段对应的值提取出来返回给服务层，服务层进行累加

Count(x) ——x为数字，查询表的总记录行数

InnoDB会遍历整张表，不过不会进行取值；服务层对于返回的每一行放一个数字x进去，直接按照行进行累加

Count(*) ——表当中的总记录行数

Mysql对InnoDB引擎做了优化，InnoDB引擎在执行count()*时，需要把遍历整张表，不过不会进行取值，直接按照行数进行累加，最后将积累的计数输出；底层count(*)=count(0)

性能比较

Count(*) ≈ Count(x) > Count(主键) > Count(字段)

尽量使用Count(*)

如何优化InnoDB引擎对Count关键字的处理

没有较好的优化策略，想要优化的话可以在插入数据或删除数据时自行计数，只不过比较繁琐

Update 优化

对于InnoDB引擎来说，默认事务隔离级别是通过行锁实现的；并且该行锁是针对索引加的锁，不是针对记录加的锁；如果该索引失效了，则会从行锁升级为表锁

即：对于建立了索引的字段使用的是行锁；没有建立索引的字段使用的是表锁；一旦锁表，就会降低并发操作

因此，优化建议为

1、使用Update时使用索引列作为更新条件，避免表锁

2、避免出现索引失效，将行锁升级为表锁

多表连接查询优化

内连接时，Mysql会自动把输出结果小的表选为驱动表，所以大表（输出结果多的表）的字段最好加上索引

左外连接时，左表会全表查询（不可避免地，因为要显示左表的全部数据），建议右边表的字段最好加上索引

右外连接时，右表会全表查询，建议左边表的字段最好加上索引

优化手段

1、在外连接时，尽量将小表作为驱动表，并保证被驱动表上的字段建立了索引

3、内连接时，尽量将大表的字段加上索引

MySQL语句性能分析与优化

SQL性能分析

SQL执行频率

SQL慢查询日志

Profile

Explain

SQL优化

插入数据的优化

主键优化

Order By优化

Group By优化

Limit 优化

Count 优化

Update 优化

多表连接查询优化

猜你喜欢