MySQL order by 工作原理

MySQL order by 工作原理:

一、MySQL是怎么进行排序?

MySQL会为每个线程分配一个内存(sort_buffer)用于排序,内存大小为sort_buffer_size;

  1. 如果排序的数据量小于sort_buffer_size,排序会在内存中完成;
  2. 如果排序数据量很大,内存中无法存下这么多数据,会使用磁盘临时文件来辅助排序,也称外部排序
  3. 在使用外部排序时,MySQL会分成好几份单独的临时文件用来存放排序后的数据,然后在将这些文件合并成一个大文件;
  4. MySQL会通过遍历索引将满足条件的数据读取到sort_buffer,并且按照排序字段进行快速排序;
    • 如果查询的字段不包含在辅助索引中,需按照辅助索引记录的主键返回聚集索引取出所需字段;
    • 该方式会造成随机IO,在MySQL5.6提供了MRR的机制,会将复制索引匹配记录的主键取出来在内存中进行排序,然后再回表;
    • 按照情况建立联合索引来避免排序所带来的性能损耗,允许的情况下也可以建立覆盖索引来避免回表;

二、全字段排序:

  1. 通过索引将所需的字段全部读取到sort_buffer中;
  2. 按照排序字段进行排序;
  3. 将结果集返回给客户端;

如图所示
在这里插入图片描述

优点

  1. MySQL认为内存足够大时,会优先选择全字段排序,因为这种方式比rowid排序避免了一次回表操作;

缺点

  1. 造成sort_buffer中存放不下很多数据,因除了排序字段还会存放其他字段,对sort_buffer利用效率不高;
  2. 当所需排序数据量很大时,会有很多的临时文件,排序性能也会很差;

二、rowid排序:

  1. 通过控制排序的行数据的长度来让sort_buffer中尽可能多的存储数据,max_length_for_sort_data;
  2. 只将需要排序的字段和主键读取到sort_buffer中,并按照排序字段进行排序;
  3. 按照排序后的顺序,取id进行回表取出想要获取的数据;
  4. 将结果集返回给客户端;

如图所示
在这里插入图片描述
优点

  1. 更好的利用内存的sort_buffer进行排序操作,尽量减少对磁盘的访问;

缺点

  1. 回表的操作是随机IO,会造成大量的随机读,不一定就比全字段排序减少对磁盘的访问;
发布了147 篇原创文章 · 获赞 170 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/Fe_cow/article/details/103241021