“orderby”是怎么工作的
假设你要查询城市是“杭州”的所有人名字,并且按照姓名排序返回前1000个人的姓名、年龄。
假设这个表的部分定义是这样的:
`CREATE TABLE `t` (
`id` int(11) NOT NULL,
`city` varchar(16) NOT NULL,
`name` varchar(16) NOT NULL,
`age` int(11) NOT NULL,
`addr` varchar(128) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `city` (`city`)
) ENGINE=InnoDB;`
这时,你的SQL语句可以这么写:
`select city,name,age from t where city='杭州' order by name limit 1000 ;`
那么它的具体流程是怎么样的?以下将介绍order by的具体流程
全字段排序
通常情况下,这个语句执行流程如下所示 :
- 初始化sort_buffer,确定放入name、city、age这三个字段;
- 从索引city找到第一个满足city='杭州’条件的主键id,也就是图中的ID_X;
- 到主键id索引取出整行,取name、city、age三个字段的值,存入sort_buffer中;
- 从索引city取下一个记录的主键id;
- 重复步骤3、4直到city的值不满足查询条件为止,对应的主键id也就是图中的ID_Y;
- 对sort_buffer中的数据按照字段name做快速排序;
- 按照排序结果取前1000行返回给客户端。
我们暂且把这个排序过程,称为全字段排序,执行流程的示意图如下所示:
总的来说就一句话:从储存引擎层,获取满足条件的所需数据后,将数据放在内存进行排序后,返回给用户。
rowid排序
全字段排序是在原表的数据读了一遍,放在内存(sort——buffer)中排序后将数据返回给用户。但是如果需要的数据单行字段过大,在增大内存损耗的同时又减低了排序
那么,如果MySQL认为排序的单行长度太大会怎么做呢?
将max_length_for_sort_data设置为16后,流程如下所示:
- 初始化sort_buffer,确定放入两个字段,即name和id;
- 从索引city找到第一个满足city='杭州’条件的主键id,也就是图中的ID_X;
- 到主键id索引取出整行,取name、id这两个字段,存入sort_buffer中;
- 从索引city取下一个记录的主键id;
- 重复步骤3、4直到不满足city='杭州’条件为止,也就是图中的ID_Y;
- 对sort_buffer中的数据按照字段name进行排序;
- 遍历排序结果,取前1000行,并按照id的值回到原表中取出city、name和age三个字段返回给客户端。
我们暂且把这个排序过程,称为roeid排序,执行流程的示意图如下所示:
总的来说就一句话:从存储引擎层,获取满足条件的数据后,将数据放在内存中进行排序后,根据主键查询所需要的数据,返回给用户。
全字段排序 VS rowid排序
mysql的核心思想:如果内存够,就要多利用内存,尽量减少磁盘访问
- rowid对比对全字段排序流程图你会发现,rowid排序多访问了一次表t的主键索引。
- 当内存足够时,mysql优先使用全字段排序。
优化:正常是取出来的数据进行排序后,将数据返回给用户,又没有办法使取出来的数据就是有序的?
方法一:使用索引(city,name),这个需要回表操作
方法二:使用索引(city, name, age),覆盖式索引直接返回数据给用户
总结
需要掌握如下:
-
明白orderby的工作机制(全字段排序)
-
如何建立索引
面试题:
8.一个订单表有三种查询(1)按日期查询订单(2)按用户查询订单(3)查询用户一段时间内的订单SQL怎么写?怎么建索引?答曰: id-date; date
9.追问:那date-id; id可不可以?为什么?哪个好?
解答:
暴力解——又(1)(2)(3)建立3个索引:date,id,date-id/id-date
在暴力法下优化——date,id-date(最左原则)
再优化——id,date-id(时间序列式递增的,更好维护)