一、关系查询处理和查询优化
关系数据库系统的查询处理
查询处理的步骤分为4个阶段:查询分析、查询检查、查询优化和查询执行。
查询语句(由此语句进行查询)
1、查询分析
首先对查询语句进行扫描、词法分析和语法分析。对SQL关键字、属性名和关系名等,进行语法检查和语法分析 ,即判断查询语句是否符合SQL语法规则。
2、查询检查
对合法的查询语句进行语义检查,即根据数据字典中有关的模式定义检查语句的数据库对象,如关系名、属性名是否存在和有效。
3、查询优化
查询优化和分为代数优化和物理优化:代数优化是指按照一定的规则,通过对关系代数表达式进行等价变换,改变代数表达式中操作的次序和组合,使查询执行更高效;
物理优化则是指存取路径和底层操作算法的选择。选择的依据可以是基于规则的,也可以是基于代价的,也可以是基于语义的。
4、查询执行
依据优化器得到的执行策略生成查询执行计划,有代码生成器(code generator)生成执行这个查询计划的代码,然后加以执行,回送查询结果;
实现查询操作的实例:(数据库优化的最终操作:尽量减少IO的块数)
1、选择操作的实现
(1)、简单的全表扫描算法(table scan)(全扫:io代价:总的块数m block + O(n)元组代价)
(2)、索引扫描算法(index scan)
通过索引先找到满足条件的元组指针,再通过元组指针在查询的基本表中找到数组;
2、连接操作的实现:(连接操作是查询处理中最常用也是最耗时的操作之一。)
(1)、嵌套循环算法(nested loop join):在实际实现中数据存取是按照数据块读入内存,而不是按照元组进行I/O的。
(2)、排序-合并算法(sort-merge join或merge join):