第三章 关系数据库标准语言SQL
3.1 SQL概述
标准 |
大致页数 |
发布日期 |
SQL/86 |
1986.10 |
|
SQL/89(FIPS 127-1) |
120页 |
1989年 |
SQL/92 |
622页 |
1992年 |
SQL99(SQL 3) |
1700页 |
1999年 |
SQL2003 |
3600页 |
2003年 |
SQL2008 |
3777页 |
2006年 |
SQL2011 |
2010年 |
SQL(Structured Query Language)
结构化查询语言,是关系数据库的标准语言
SQL是一个通用的、功能极强的关系数据库语言
目前,没有一个数据库系统能够支持SQL标准的所有概念和特性
3.1.2 SQL的特点
综合统一
集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体。
可以独立完成数据库生命周期中的全部活动:
定义和修改、删除关系模式,定义和删除视图,插入数据,建立数据库;
对数据库中的数据进行查询和更新;
数据库重构和维护
数据库安全性、完整性控制,以及事务控制
嵌入式SQL和动态SQL定义
用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行。
数据操作符统一
非关系数据模型的数据操纵语言“面向过程”,必须指定存取路径。
SQL只要提出“做什么”,无须了解存取路径。
存取路径的选择以及SQL的操作过程由系统自动完成。
非关系数据模型采用面向记录的操作方式,操作对象是一条记录
SQL采用集合操作方式
操作对象、查找结果可以是元组的集合
一次插入、删除、更新操作的对象可以是元组的集合
SQL是独立的语言
能够独立地用于联机交互的使用方式
SQL又是嵌入式语言
SQL能够嵌入到高级语言(例如C,C++,Java)程序中,供程序员设计程序时使用
SQL功能极强,完成核心功能只用了9个动词。
3.1.3 SQL的基本概念
SQL |
视图2 |
视图1 |
基本表2 |
基本表1 |
基本表3 |
基本表4 |
存储文件2 |
存储文件1 |
外模式 |
模 式 |
内模式 |
基本表
1,本身独立存在的表
2,SQL中一个关系就对应一个基本表
3,一个(或多个)基本表对应一个存储文件
4,一个表可以带若干索引
存储文件
1,逻辑结构组成了关系数据库的内模式
2,物理结构对用户是隐蔽的
视图
1,从一个或几个基本表导出的表
2,数据库中只存放视图的定义而不存放视图对应的数据
3,视图是一个虚表
4,用户可以在视图上再定义视图
数据定义
SQL的数据定义功能:
1,模式定义
2,表定义
3,视图和索引的定义
现代关系数据库管理系统提供了一个层次化的数据库对象命名机制
1,一个关系数据库管理系统的实例(Instance)中可以建立多个数据库
2,一个数据库中可以建立多个模式
3,一个模式下通常包括多个表、视图和索引等数据库对象
模式的定义与删除
定义模式实际上定义了一个命名空间。
在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。
在CREATE SCHEMA中可以接受CREATE TABLE,CREATE VIEW和GRANT子句。
CREATE SCHEMA <模式名> AUTHORIZATION <用户名>[<表定义子句>|<视图定义子句>|<授权定义子句>]
DROP SCHEMA <模式名> <CASCADE|RESTRICT>
CASCADE(级联)
删除模式的同时把该模式中所有的数据库对象全部删除
RESTRICT(限制)
如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行。
仅当该模式中没有任何下属的对象时才能执行。
基本表的定义、删除与修改
定义基本表
CREATE TABLE <表名>
(<列名> <数据类型>[ <列级完整性约束条件> ]
[,<列名> <数据类型>[ <列级完整性约束条件>] ]
…
[,<表级完整性约束条件> ] );
<表名>:所要定义的基本表的名字
<列名>:组成该表的各个属性(列)
<列级完整性约束条件>:涉及相应属性列的完整性约束条件
<表级完整性约束条件>:涉及一个或多个属性列的完整性约束条件
如果完整性约束条件涉及到该表的多个属性列,则必须定义在表级上,否则既可以定义在列级也可以定义在表级。
SQL中域的概念用数据类型来实现
定义表的属性时需要指明其数据类型及长度
选用哪种数据类型
取值范围
要做哪些运算
数据类型 |
含义 |
CHAR(n),CHARACTER(n) |
长度为n的定长字符串 |
VARCHAR(n), CHARACTERVARYING(n) |
最大长度为n的变长字符串 |
CLOB |
字符串大对象 |
BLOB |
二进制大对象 |
INT,INTEGER |
长整数(4字节) |
SMALLINT |
短整数(2字节) |
BIGINT |
大整数(8字节) |
NUMERIC(p,d) |
定点数,由p位数字(不包括符号、小数点)组成,小数后面有d位数字 |
DECIMAL(p, d), DEC(p, d) |
同NUMERIC |
REAL |
取决于机器精度的单精度浮点数 |
DOUBLE PRECISION |
取决于机器精度的双精度浮点数 |
FLOAT(n) |
可选精度的浮点数,精度至少为n位数字 |
BOOLEAN |
逻辑布尔量 |
DATE |
日期,包含年、月、日,格式为YYYY-MM-DD |
TIME |
时间,包含一日的时、分、秒,格式为HH:MM:SS |
TIMESTAMP |
时间戳类型 |
INTERVAL |
时间间隔类型 |
每一个基本表都属于某一个模式
一个模式包含多个基本表
定义基本表所属模式
方法一:在表名中明显地给出模式名
Create table"S-T".Student(......); /*模式名为 S-T*/
Create table "S-T".Cource(......);
Create table "S-T".SC(......);
方法二:在创建模式语句中同时创建表
方法三:设置所属的模式
创建基本表(其他数据库对象也一样)时,若没有指定模式,系统根据搜索路径来确定该对象所属的模式
关系数据库管理系统会使用模式列表中第一个存在的模式作为数据库对象的模式名
若搜索路径中的模式名都不存在,系统将给出错误
显示当前的搜索路径: SHOW search_path;
搜索路径的当前默认值是:$user, PUBLIC
数据库管理员用户可以设置搜索路径,然后定义基本表
SET search_path TO "S-T",PUBLIC;
Create table Student(......);
结果建立了S-T.Student基本表。
关系数据库管理系统发现搜索路径中第一个模式名S-T,
就把该模式作为基本表Student所属的模式。
ALTER TABLE <表名>
[ ADD[COLUMN] <新列名> <数据类型> [ 完整性约束 ] ]
[ ADD <表级完整性约束>]
[ DROP [ COLUMN ] <列名> [CASCADE| RESTRICT] ]
[ DROP CONSTRAINT<完整性约束名>[ RESTRICT | CASCADE ] ]
[ALTER COLUMN <列名><数据类型> ] ;
<表名>是要修改的基本表
ADD子句用于增加新列、新的列级完整性约束条件和新的表级完整性约束条件
DROP COLUMN子句用于删除表中的列
如果指定了CASCADE短语,则自动删除引用了该列的其他对象
如果指定了RESTRICT短语,则如果该列被其他对象引用,关系数据库管理系统将拒绝删除该列
DROP CONSTRAINT子句用于删除指定的完整性约束条件
ALTER COLUMN子句用于修改原有的列定义,包括修改列名和数据类型
DROP TABLE <表名>[RESTRICT| CASCADE];
RESTRICT:删除表是有限制的。
欲删除的基本表不能被其他表的约束所引用
如果存在依赖该表的对象,则此表不能被删除
CASCADE:删除该表没有限制。
在删除基本表的同时,相关的依赖对象一起删除
DROP TABLE时,SQL2011 与 3个RDBMS的处理策略比较
序 号 |
标准及主流数据库 的处理方式 依赖基本表 的对象 |
SQL2011 |
Kingbase ES |
Oracle 12c |
MS SQL Server 2012 |
|||
R |
C |
R |
C |
C |
||||
1 |
索引 |
无规定 |
√ |
√ |
√ |
√ |
√ |
|
2 |
视图 |
× |
√ |
× |
√ |
√ 保留 |
√ 保留 |
√ 保留 |
3 |
DEFAULT,PRIMARY KEY,CHECK(只含该表的列)NOT NULL 等约束 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
4 |
外码FOREIGN KEY |
× |
√ |
× |
√ |
× |
√ |
× |
5 |
触发器TRIGGER |
× |
√ |
× |
√ |
√ |
√ |
√ |
6 |
函数或存储过程 |
× |
√ |
√ 保留 |
√ 保留 |
√ 保留 |
√ 保留 |
√ 保留 |
索引的建立与删除
建立索引的目的:加快查询速度
关系数据库管理系统中常见索引:
顺序文件上的索引
B+树索引(http://www.chinadb.org/home/nav/5/sub/21/third/98/)
散列(hash)索引
位图索引
特点:
B+树索引具有动态平衡的优点
HASH索引具有查找速度快的特点
谁可以建立索引
数据库管理员 或 表的属主(即建立表的人)
谁维护索引
关系数据库管理系统自动完成
使用索引
关系数据库管理系统自动选择合适的索引作为存取路径,用户不必也不能显式地选择索引
语句格式
CREATE [UNIQUE] [CLUSTER] INDEX <索引名>
ON <表名>(<列名>[<次序>][,<列名>[<次序>] ]…);
<表名>:要建索引的基本表的名字
索引:可以建立在该表的一列或多列上,各列名之间用逗号分隔
<次序>:指定索引值的排列次序,升序:ASC,降序:DESC。缺省值:ASC
UNIQUE:此索引的每一个索引值只对应唯一的数据记录
CLUSTER:表示要建立的索引是聚簇索引
ALTER INDEX <旧索引名> RENAME TO <新索引名>
删除索引时,系统会从数据字典中删去有关该索引的
描述。
数据字典
数据字典是关系数据库管理系统内部的一组系统表,它记录了数据库中所有定义信息:
1,关系模式定义
2,视图定义
3,索引定义
4,完整性约束定义
5,各类用户对数据库的操作权限
6,统计信息等
关系数据库管理系统在执行SQL的数据定义语句时,实际上就是在更新数据字典表中的相应信息。
数据查询
语句格式
SELECT [ALL|DISTINCT] <目标列表达式>[,<目标列表达式>] …
FROM <表名或视图名>[,<表名或视图名> ]…|(SELECT 语句)
[AS]<别名>
[ WHERE <条件表达式> ]
[ GROUP BY <列名1> [ HAVING <条件表达式> ] ]
[ ORDER BY <列名2> [ ASC|DESC ] ];
SELECT子句:指定要显示的属性列
FROM子句:指定查询对象(基本表或视图)
WHERE子句:指定查询条件
GROUP BY子句:对查询结果按指定列的值分组,该属性列值相等的元组为一个组。通常会在每组中作用聚集函数。
HAVING短语:只有满足指定条件的组才予以输出
ORDER BY子句:对查询结果表按指定列值的升序或降序排序
3.4.1 单表查询
查询仅涉及一个表
1.选择表中的若干列
2.选择表中的若干元组
3.ORDER BY子句
4.聚集函数
5.GROUP BY子句
1,查询指定列
[例3.16] 查询全体学生的学号与姓名。
SELECT Sno,Sname
FROM Student;
[例3.17] 查询全体学生的姓名、学号、所在系。
SELECT Sname,Sno,Sdept
FROM Student;
查询全部列
选出所有属性列:
在SELECT关键字后面列出所有列名
将<目标列表达式>指定为 *
查询经过计算的值
SELECT子句的<目标列表达式>不仅可以为表中的属性列,也可以是表达式
2,消除取值重复的行
如果没有指定DISTINCT关键词,则缺省为ALL
指定DISTINCT关键词,去掉表中重复的行
常用的查询条件
查 询 条 件 |
谓 词 |
比 较 |
=, >, <, >=, <=, !=, <>, !>, !<; NOT+上述比较运算符 |
确定范围 |
BETWEEN AND, NOT BETWEEN AND |
确定集合 |
IN, NOT IN |
字符匹配 |
LIKE, NOT LIKE |
空 值 |
IS NULL, IS NOT NULL |
多重条件(逻辑运算) |
AND, OR, NOT |
查 询 条 件 |
谓 词 |
比 较 |
=, >, <, >=, <=, !=, <>, !>, !<; NOT+上述比较运算符 |
确定范围 |
BETWEEN AND, NOT BETWEEN AND |
确定集合 |
IN, NOT IN |
字符匹配 |
LIKE, NOT LIKE |
空 值 |
IS NULL, IS NOT NULL |
多重条件(逻辑运算) |
AND, OR, NOT |
谓词: BETWEEN … AND …
NOT BETWEEN … AND …
谓词:IN <值表>, NOT IN <值表>
谓词: [NOT] LIKE ‘<匹配串>’ [ESCAPE ‘ <换码字符>’]
匹配串为固定字符串
匹配串为含通配符的字符串
使用换码字符将通配符转义为普通字符
谓词: IS NULL 或 IS NOT NULL
“IS” 不能用 “=” 代替
逻辑运算符:AND和 OR来连接多个查询条件
AND的优先级高于OR
可以用括号改变优先级
3,ORDER BY子句
可以按一个或多个属性列排序
升序:ASC;降序:DESC;缺省值为升序
对于空值,排序时显示的次序由具体系统实现来决定
4,聚集函数
聚集函数:
统计元组个数
COUNT(*)
统计一列中值的个数
COUNT([DISTINCT|ALL] <列名>)
计算一列值的总和(此列必须为数值型)
SUM([DISTINCT|ALL] <列名>)
计算一列值的平均值(此列必须为数值型)
AVG([DISTINCT|ALL] <列名>)
求一列中的最大值和最小值
MAX([DISTINCT|ALL] <列名>)
MIN([DISTINCT|ALL] <列名>)
5.GROUP BY子句
GROUP BY子句分组:
细化聚集函数的作用对象
如果未对查询结果分组,聚集函数将作用于整个查询结果
对查询结果分组后,聚集函数将分别作用于每个组
按指定的一列或多列值分组,值相等的为一组
HAVING短语与WHERE子句的区别:
作用对象不同
WHERE子句作用于基表或视图,从中选择满足条件的元组
HAVING短语作用于组,从中选择满足条件的组。
3.4.2 连接查询
连接查询:同时涉及两个以上的表的查询
连接条件或连接谓词:用来连接两个表的条件
一般格式:
[<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
[<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
连接字段:连接谓词中的列名称
连接条件中的各连接字段类型必须是可比的,但名字不必相同
连接查询:同时涉及两个以上的表的查询
连接条件或连接谓词:用来连接两个表的条件
一般格式:
[<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
[<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
连接字段:连接谓词中的列名称
连接条件中的各连接字段类型必须是可比的,但名字不必相同
1.等值与非等值连接查询
(1)嵌套循环法(NESTED-LOOP)
首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。
表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。
重复上述操作,直到表1中的全部元组都处理完毕
(2)排序合并法(SORT-MERGE)
常用于=连接
首先按连接属性对表1和表2排序
对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续
找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续
重复上述操作,直到表1或表2中的全部元组都处理完毕为止
(3)索引连接(INDEX-JOIN)
对表2按连接字段建立索引
对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组
一条SQL语句可以同时完成选择和连接查询,这时WHERE子句是由连接谓词和选择谓词组成的复合条件。
2.自身连接
自身连接:一个表与其自己进行连接
需要给表起别名以示区别
由于所有属性名都是同名属性,因此必须使用别名前缀
3.外连接
外连接与普通连接的区别
普通连接操作只输出满足连接条件的元组
外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出
左外连接
列出左边关系中所有的元组
右外连接
列出右边关系中所有的元组
4.多表连接
多表连接:两个以上的表进行连接
3.4.3 嵌套查询
嵌套查询概述
一个SELECT-FROM-WHERE语句称为一个查询块
将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询
SELECT Sname /*外层查询/父查询*/
FROM Student
WHERE Sno IN
( SELECT Sno /*内层查询/子查询*/
FROM SC
WHERE Cno= ' 2 ');
上层的查询块称为外层查询或父查询
下层查询块称为内层查询或子查询
SQL语言允许多层嵌套查询
即一个子查询中还可以嵌套其他子查询
子查询的限制
不能使用ORDER BY子句
不相关子查询:
子查询的查询条件不依赖于父查询
由里向外 逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。
相关子查询:子查询的查询条件依赖于父查询
首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表
然后再取外层表的下一个元组
重复这一过程,直至外层表全部检查完为止
1.带有IN谓词的子查询
查询与“刘晨”在同一个系学习的学生。
此查询要求可以分步来完成
① 确定“刘晨”所在系名
SELECT Sdept
FROM Student
WHERE Sname= ' 刘晨 ';
结果为: CS
2.带有比较运算符的子查询
当能确切知道内层查询返回单值时,可用比较运算符(>,<,=,>=,<=,!=或< >)。
在[例 3.55]中,由于一个学生只可能在一个系学习,则可以用 = 代替IN :
SELECT Sno,Sname,Sdept
FROM Student
WHERE Sdept =
(SELECT Sdept
FROM Student
WHERE Sname= '刘晨');
可能的执行过程
从外层查询中取出SC的一个元组x,将元组x的Sno值(201215121)传送给内层查询。
SELECT AVG(Grade)
FROM SC y
WHERE y.Sno='201215121‘;
执行内层查询,得到值88(近似值),用该值代替内层查询,得到外层查询:
SELECT Sno,Cno
FROM SC x
WHERE Grade >=88;
3.带有ANY(SOME)或ALL谓词的子查询
使用ANY或ALL谓词时必须同时使用比较运算
语义为:
> ANY 大于子查询结果中的某个值
> ALL 大于子查询结果中的所有值
< ANY 小于子查询结果中的某个值
< ALL 小于子查询结果中的所有值
>= ANY 大于等于子查询结果中的某个值
>= ALL 大于等于子查询结果中的所有值
使用ANY或ALL谓词时必须同时使用比较运算
语义为(续)
<= ANY 小于等于子查询结果中的某个值
<= ALL 小于等于子查询结果中的所有值
= ANY 等于子查询结果中的某个值
=ALL 等于子查询结果中的所有值(通常没有实际意义)
!=(或<>)ANY 不等于子查询结果中的某个值
!=(或<>)ALL 不等于子查询结果中的任何一个值
执行过程:
(1)首先处理子查询,找出CS系中所有学生的年龄,构成一个集合(20,19)
(2)处理父查询,找所有不是CS系且年龄小于
20 或 19的学生
[例 3.59] 查询非计算机科学系中比计算机科学系所有学生年龄都小的学生姓名及年龄。
方法一:用ALL谓词
SELECT Sname,Sage
FROM Student
WHERE Sage < ALL
(SELECT Sage
FROM Student
WHERE Sdept= ' CS ')
AND Sdept <> ' CS ’;
方法二:用聚集函数
SELECT Sname,Sage
FROM Student
WHERE Sage <
(SELECT MIN(Sage)
FROM Student
WHERE Sdept= ' CS ')
AND Sdept <>' CS ';
ANY(或SOME),ALL谓词与聚集函数、IN谓词的等价转换关系
|
= |
<>或!= |
< |
<= |
> |
>= |
ANY |
IN |
-- |
<MAX |
<=MAX |
>MIN |
>= MIN |
ALL |
-- |
NOT IN |
<MIN |
<= MIN |
>MAX |
>= MAX |
4.带有EXISTS谓词的子查询
EXISTS谓词
存在量词
带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值“true”或逻辑假值“false”。
若内层查询结果非空,则外层的WHERE子句返回真值
若内层查询结果为空,则外层的WHERE子句返回假值
由EXISTS引出的子查询,其目标列表达式通常都用 * ,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义
NOT EXISTS谓词
若内层查询结果非空,则外层的WHERE子句返回假值
若内层查询结果为空,则外层的WHERE子句返回真值
不同形式的查询间的替换
1,一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换
2,所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换
用EXISTS/NOT EXISTS实现全称量词(难点)
1,SQL语言中没有全称量词 (For all)
2,可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:
(x)P ≡ ( x( P))
用EXISTS/NOT EXISTS实现逻辑蕴涵(难点)
1,SQL语言中没有蕴涵(Implication)逻辑运算
2,可以利用谓词演算将逻辑蕴涵谓词等价转换为:
p q ≡ p∨q
解题思路:
1,用逻辑蕴涵表达:查询学号为x的学生,对所有的课程y,只要201215122学生选修了课程y,则x也选修了y。
2,形式化表示:
用P表示谓词 “学生201215122选修了课程y”
用q表示谓词 “学生x选修了课程y”
则上述查询为: (y) p q
等价变换:
(y)p q ≡ (y ((p q ))
≡ (y (( p∨ q) ))
≡ y(p∧q)
变换后语义:不存在这样的课程y,学生201215122选修了y,而学生x没有选。
3.4.4 集合查询
1,集合操作的种类
2,并操作UNION
3,交操作INTERSECT
差操作EXCEPT
参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同
3.4.5基于派生表的查询
1,子查询不仅可以出现在WHERE子句中,还可以出现在FROM子句中,这时子查询生成的临时派生表(Derived Table)成为主查询的查询对象
2,如果子查询中没有聚集函数,派生表可以不指定属性列,子查询SELECT子句后面的列名为其缺省属性。
3.4.6 SELECT语句的一般形式
SELECT [ALL|DISTINCT]
<目标列表达式> [别名] [ ,<目标列表达式> [别名]] …
FROM <表名或视图名> [别名]
[ ,<表名或视图名> [别名]] …
|(<SELECT语句>)[AS]<别名>
[WHERE <条件表达式>]
[GROUP BY <列名1>[HAVING<条件表达式>]]
[ORDER BY <列名2> [ASC|DESC]];
目标列表达式格式
(1) *
(2) <表名>.*
(3) COUNT([DISTINCT|ALL]* )
(4) [<表名>.]<属性列名表达式>[,<表名>.]<属性列名表达式>]…
其中<属性列名表达式>可以是由属性列、作用于属性列
的聚集函数和常量的任意算术运算(+,-,*,/)组成的
运算公式
3.5 数据更新
3.5.1 插入数据
- 两种插入数据方式
- 插入元组
- 插入子查询结果
可以一次插入多个元组
- 插入元组
- 语句格式
INSERT
INTO <表名> [(<属性列1>[,<属性列2 >…)]
VALUES (<常量1> [,<常量2>]… );
- 功能
- 将新元组插入指定表中
- INTO子句
- 指定要插入数据的表名及属性列
- 属性列的顺序可与表定义中的顺序不一致
- 没有指定属性列:表示要插入的是一条完整的元组,且属性列属性与表定义中的顺序一致
- 指定部分属性列:插入的元组在其余属性列上取空值
- VALUES子句
- 提供的值必须与INTO子句匹配
- 值的个数
- 提供的值必须与INTO子句匹配
值的类型
- 插入子查询结果
- 语句格式
INSERT
INTO <表名> [(<属性列1> [,<属性列2>… )]
子查询;
-
- INTO子句
- 子查询
- SELECT子句目标列必须与INTO子句匹配
- 值的个数
- 值的类型
- SELECT子句目标列必须与INTO子句匹配
- 关系数据库管理系统在执行插入语句时会检查所插元组是否破坏表上已定义的完整性规则
- 实体完整性
- 参照完整性
- 用户定义的完整性
- NOT NULL约束
- UNIQUE约束
- 值域约束
- 3.5.2 修改数据
- 语句格式
UPDATE <表名>
SET <列名>=<表达式>[,<列名>=<表达式>]…
[WHERE <条件>];
- 功能
- 修改指定表中满足WHERE子句条件的元组
- SET子句给出<表达式>的值用于取代相应的属性列
- 如果省略WHERE子句,表示要修改表中的所有元组
- 三种修改方式
- 修改某一个元组的值
- 修改多个元组的值
- 带子查询的修改语句
- 关系数据库管理系统在执行修改语句时会检查修改操作是否破坏表上已定义的完整性规则
- 实体完整性
- 主码不允许修改
- 用户定义的完整性
- NOT NULL约束
- UNIQUE约束
值域约束
3.5.3 删除数据
- 语句格式
DELETE
FROM <表名>
[WHERE <条件>];
- 功能
- 删除指定表中满足WHERE子句条件的元组
- WHERE子句
- 指定要删除的元组
- 缺省表示要删除表中的全部元组,表的定义仍在字典中
- 三种删除方式
- 删除某一个元组的值
- 删除多个元组的值
- 带子查询的删除语句
3.6 空值的处理
- 空值就是“不知道”或“不存在”或“无意义”的值。
- 一般有以下几种情况:
- 该属性应该有一个值,但目前不知道它的具体值
- 该属性不应该有值
- 由于某种原因不便于填写
- 空值是一个很特殊的值,含有不确定性。对关系运算带来特殊的问题,需要做特殊的处理。
- 空值的产生
[例 3.79]向SC表中插入一个元组,学生号是”201215126”,课程号是”1”,成绩为空。
INSERT INTO SC(Sno,Cno,Grade)
VALUES('201215126 ','1',NULL); /*该学生还没有考试成绩,取空值*/
或
INSERT INTO SC(Sno,Cno)
VALUES(' 201215126 ','1'); /*没有赋值的属性,其值为空值*/
- 判断一个属性的值是否为空值,用IS NULL或IS NOT NULL来表示。
- 属性定义(或者域定义)中
- 有NOT NULL约束条件的不能取空值
- 加了UNIQUE限制的属性不能取空值
- 码属性不能取空值
- 空值与另一个值(包括另一个空值)的算术运算的结果为空值
- 空值与另一个值(包括另一个空值)的比较运算的结果为UNKNOWN。
- 有UNKNOWN后,传统二值(TRUE,FALSE)逻辑就扩展成了三值逻辑
x y |
x AND y |
x OR y |
NOT x |
T T |
T |
T |
F |
T U |
U |
T |
F |
T F |
F |
T |
F |
U T |
U |
T |
U |
U U |
U |
U |
U |
U F |
F |
U |
U |
F T |
F |
T |
T |
F U |
F |
U |
T |
F F |
F |
F |
T |
3.7 视图
- 视图的特点
- 虚表,是从一个或几个基本表(或视图)导出的表
- 只存放视图的定义,不存放视图对应的数据
- 基表中的数据发生变化,从视图中查询出的数据也随之改变
- 3.7.1 定义视图
- 1.建立视图
- 2.删除视图
- 语句格式
CREATE VIEW
<视图名> [(<列名> [,<列名>]…)]
AS <子查询>
[WITH CHECK OPTION];
- WITH CHECK OPTION
- 对视图进行UPDATE,INSERT和DELETE操作时要保证更新、插入或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)
- 子查询可以是任意的SELECT语句,是否可以含有ORDER BY子句和DISTINCT短语,则决定具体系统的实现。
- 组成视图的属性列名:全部省略或全部指定
- 全部省略:
- 由子查询中SELECT目标列中的诸字段组成
- 明确指定视图的所有列名:
- 某个目标列是聚集函数或列表达式
- 多表连接时选出了几个同名列作为视图的字段
- 需要在视图中为某个列启用新的更合适的名字
- 全部省略:
- 关系数据库管理系统执行CREATE VIEW语句时只是把视图定义存入数据字典,并不执行其中的SELECT语句。
- 在对视图查询时,按视图的定义从基本表中将数据查出。
- 定义IS_Student视图时加上了WITH CHECK OPTION子句,对该视图进行插入、修改和删除操作时,RDBMS会自动加上Sdept='IS'的条件。
- 若一个视图是从单个基本表导出的,并且只是去掉了基本表的某些行和某些列,但保留了主码,我们称这类视图为行列子集视图。
- IS_Student视图就是一个行列子集视图。
- 基于多个基表的视图
- 基于视图的视图
- 带表达式的视图
- 分组视图
- 删除视图
- 语句的格式:
DROP VIEW <视图名>[CASCADE];
-
- 该语句从数据字典中删除指定的视图定义
- 如果该视图上还导出了其他视图,使用CASCADE级联删除语句,把该视图和由它导出的所有视图一起删除
- 删除基表时,由该基表导出的所有视图定义都必须显式地使用DROP VIEW语句删除
- 3.7.2 查询视图
- 用户角度:查询视图与查询基本表相同
- 关系数据库管理系统实现视图查询的方法
- 视图消解法(View Resolution)
- 进行有效性检查
- 转换成等价的对基本表的查询
- 执行修正后的查询
- 视图消解法(View Resolution)
- 视图消解法的局限
- 有些情况下,视图消解法不能生成正确的查询。
[例3.94]在S_G视图中查询平均成绩在90分以上的学生学号和平均成绩
SELECT *
FROM S_G
WHERE Gavg>=90;
S_G视图的子查询定义:
CREATE VIEW S_G (Sno,Gavg)
AS
SELECT Sno,AVG(Grade)
FROM SC
GROUP BY Sno;
3.7.3 更新视图
- 更新视图的限制:一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更新
- 允许对行列子集视图进行更新
- 对其他类型视图的更新不同系统有不同限制
- DB2对视图更新的限制:
- 若视图是由两个以上基本表导出的,则此视图不允许更新。
- 若视图的字段来自字段表达式或常数,则不允许对此视图执行INSERT和UPDATE操作,但允许执行DELETE操作。
- 若视图的字段来自集函数,则此视图不允许更新。
- 若视图定义中含有GROUP BY子句,则此视图不允许更新。
- 若视图定义中含有DISTINCT短语,则此视图不允许更新。
- 若视图定义中有嵌套查询,并且内层查询的FROM子句中涉及的表也是导出该视图的基本表,则此视图不允许更新。
- 3.7.4 视图的作用
- 视图能够简化用户的操作
- 视图使用户能以多种角度看待同一数据
- 视图对重构数据库提供了一定程度的逻辑独立性
- 视图能够对机密数据提供安全保护
- 适当的利用视图可以更清晰的表达查询
- 视图能够简化用户的操作
当视图中数据不是直接来自基本表时,定义视图能够简化用户的操作
-
- 基于多张表连接形成的视图
- 基于复杂嵌套查询的视图
- 含导出属性的视图
- 视图使用户能以多种角度看待同一数据
- 视图机制能使不同用户以不同方式看待同一数据,
适应数据库共享的需要
- 视图对重构数据库提供了一定程度的逻辑独立性
数据库重构
例:学生关系Student(Sno,Sname,Ssex,Sage,Sdept)
“垂直”地分成两个基本表:
SX(Sno,Sname,Sage)
SY(Sno,Ssex,Sdept)
通过建立一个视图Student:
CREATE VIEW Student(Sno,Sname,Ssex,Sage,Sdept)
AS
SELECT SX.Sno,SX.Sname,SY.Ssex,SX.Sage,SY.Sdept
FROM SX,SY
WHERE SX.Sno=SY.Sno;
使用户的外模式保持不变,用户的应用程序通过视图仍然能够
查找数据
- 视图对重构数据库提供了一定程度的逻辑独立性(续)
- 视图只能在一定程度上提供数据的逻辑独立性
- 由于对视图的更新是有条件的,因此应用程序中修改数据的语句可能仍会因基本表结构的改变而改变。
- 视图只能在一定程度上提供数据的逻辑独立性
- 视图能够对机密数据提供安全保护
- 对不同用户定义不同视图,使每个用户只能看到他有权看到的数据
- 适当的利用视图可以更清晰的表达查询
- 经常需要执行这样的查询“对每个同学找出他获得最高成绩的课程号”。可以先定义一个视图,求出每个同学获得的最高成绩
CREATE VIEW VMGRADE
AS
SELECT Sno, MAX(Grade) Mgrade
FROM SC
GROUP BY Sno;
然后用如下的查询语句完成查询:
SELECT SC.Sno,Cno
FROM SC,VMGRADE
WHERE SC.Sno=VMGRADE.Sno AND
SC.Grade=VMGRADE .Mgrade;
或Select sno,cno,grade
From sc x
Where grade=
(select max(grade)
from sc y
where y.sno=x.sno)
小结
- SQL可以分为数据定义、数据查询、数据更新、数据控制四大部分
- SQL是关系数据库语言的工业标准。大部分数据库管理系统产品都能支持SQL92,但是许多数据库系统只支持SQL99、SQL2008和SQL2011的部分特征,至今尚没有一个数据库系统能够完全支持SQL99以上的标准。
求选课在4门以上的学生的平均成绩,不统计不及格的课程,并按降序排列平均成绩
SELECT Sno,AVG(Grade) Average FROM Sc
WHERE Grade>=60
GROUP BY Sno
HAVING COUNT(*)>=4
ORDER BY Average DESC
SELECT Sno,AVG(Grade)
FROM Sc
WHERE Grade>=60
GROUP BY Sno
HAVING COUNT(*)>=4
ORDER BY 2 DESC
求解过程
(1) FROM:指明操作对象
(2) WHERE:选取
(3) GROUP:分组
(4) HAVING:选组
(5) SELECT:投影
(6) ORDER:排序