【系统架构设计师】数据库系统 ⑥ ( 规范化理论 | 非规范化问题 | 函数依赖 | 部分函数依赖 | 传递函数依赖 | 候选键

文章目录

一、非规范化问题
二、规范化理论 - 函数依赖
三、候选键
- 1、候选键概念简介
- 2、求取关系的候选键
四、软考考点

一、非规范化问题

1、非规范化问题简介

非规范化的关系模式 , 存在如下问题 :

数据冗余 : 同一数据在数据库的多个位置重复存储 , 造成存储空间的浪费 , 数据一致性维护成本增加 ;
- 非规范化设计 : 数据表未通过范式分解 , 导致字段之间存在不必要的依赖关系 ;
- 多字段组合存储 : 例如将学生信息和课程信息混合存储 , 导致学生姓名、学院等信息在每条课程记录中重复 ;
更新异常 : 修改数据时 , 可能因冗余导致部分数据未同步更新 , 引发数据不一致 , 导致数据可信度降低 , 维护一致性需要复杂的更新逻辑 ;
- 冗余数据未集中管理 : 同一数据分布在多个记录或表中 ;
- 依赖关系复杂 : 数据间的逻辑依赖未被合理约束 ;
插入异常 : 无法插入某些必需数据 , 除非同时插入其他不相关数据 ; 导致无法独立插入关键业务数据 , 需要设计临时占位数据 , 破坏数据完整性 ;
- 主键依赖不合理 : 主键包含不必要字段 , 导致插入时必须提供无效数据 ;
- 数据耦合性高 : 实体信息与关联信息未分离 ;
删除异常 : 删除数据时 , 意外丢失其他必要信息 ; 导致关键数据意外丢失 , 需通过额外逻辑保留必要数据 , 增加复杂度 ;
- 数据耦合性高 : 不同实体的数据存储在同一表中 ;
- 依赖关系未隔离 : 删除一个实体的数据会连带删除其他实体数据 ;

2、非规范化问题原因

非规范化关系模式原因总结 : 非规范化核心问题源于数据依赖关系不合理 ;

部分函数依赖 : 非主键字段仅依赖主键的一部分 , 违反 2NF ;
传递函数依赖 : 非主键字段间接依赖主键 , 违反 3NF ;

3、非规范化示例说明

下面的表格中 , 有学号、姓名、系号、系名、系位置属性 , 几乎将系统所需要的所有数据 , 放在了一个表格中进行处理 ;

在这里插入图片描述

上述表格中 , 会出现一系列的非规范化问题 ;

数据冗余 : 表格中 , 系名和系位置属性 , 每个属性都是一个长字符串 , 占用了很多的存储空间 , 假如有 100 万条学生数据相应的数据冗余是很大的 , 浪费了大量的存储空间 ;
更新异常 : 如果系位置发生了改变 , 那么就需要将 100 万个学生信息实体元组行都需要进行修改 , 操作数据量大 , 容易出错导致漏掉某些元组的修改 ;
插入异常 : 数据库表中的主键必须是非空的 , 如果新创建一个系 , 还没有招生 , 那么新插入的系的学号主键就是空的 ;
删除异常 : 有个系被取消 , 不再招生 , 删除某个系 , 删除过程会同时删除学生信息 ;

4、非规范化解决方案

解决上述问题 , 就是规范化上述关系 , 通过分解表结构 , 消除冗余和异常 ;

1NF : 确保字段原子性 ( 不可再分 ) ;
2NF : 消除非主键字段对主键的部分依赖 ;
3NF : 消除非主键字段间的传递依赖 ;
BCNF : 进一步消除主键字段间的依赖 ;

上述示例规范化后的表 :

学生表 ( 学号, 姓名, 系号 )
系表 ( 系号, 系名, 系位置 )

二、规范化理论 - 函数依赖

1、函数依赖概念说明

函数依赖概念 : R ( U , F ) 是二元关系 , R 是实体 , U 是属性集合 , F 是依赖集合 ,

X 、 Y 是属性集合 U 的子集 ,

r 是任意一个关系 ,

如果 r 中任意两个元组 u 、 v , 只要有 u[X] = v[X] 就有 u[Y] = v[Y] ,

X 函数决定 Y , Y 函数依赖于 X , 可以记做 X -> Y ;

决定因素 : " -> " 符号左侧的 X 是决定因素 ;
被决定因素 : " -> " 符号右侧的 Y 是被决定因素 ;

2、函数依赖示例说明

给定一个二元关系 :

学生 ( U , F )
U = {
    
    学号 , 姓名 , 年龄 , 班级编号}
F = {
    
    学号 -> 姓名 , 学号 -> 年龄 , 学号 -> 班级编号}

如 : X 是 {学号} , Y 是 {姓名} , 学号 -> 姓名 , 学号函数决定姓名 , 姓名函数依赖于学号 ;

X 属性存在 , 对应的 Y 属性自然而然的存在 , 如 : 给定一个学生的学号 , 肯定有一个对应的学生的姓名 , 学生的年龄 , 学号就可以函数决定姓名和年龄 , 姓名和年龄函数依赖于学号 ;

反过来说 Y 不能决定 X , 根据年龄是不能找到学生的学号的 , 一年级的学生年龄都是 6 岁 , 姓名和年龄是无法唯一确定一个学生实体的 ;

3、部分函数依赖

在关系模式中 , 若某个非主属性（Non-Prime Attribute）依赖于候选键（Candidate Key）的部分属性 , 而非整个候选键 , 则称为 " 部分函数依赖 " ;

非主属性仅依赖候选键的部分属性 , 常见于复合主键 ;

部分函数依赖示例 : 下面的关系模式 R1 中 , 属性 AB 函数决定属性 D , 属性 D 函数依赖于属性 AB ;

属性 A 和 B 不能单独决定 D , 必须组合在一起才能函数决定 D ;

在这里插入图片描述

在查找关系 R1 的候选键时 , 如果想要在有向图中遍历到 D , 必须将 A 和 B 属性一起放入到集合 L 中 ;

属性 C 依赖于候选键 { A , B } 中的一部分属性 { A } , 不是依赖于所有的候选键 { A , B } , 这种依赖称为 " 部分函数依赖 " ;

4、传递函数依赖

若存在属性集合 A -> B 且 B -> C，但 B 不决定 A , 则称 C 通过 B 传递依赖于 A ;

非主属性通过中间属性间接依赖候选键 , 形成依赖链 ;

传递函数依赖示例 : 下面的关系模式 R2 中 , 属性 A 函数决定属性 B , 属性 B 函数决定属性 C ;

属性 A 到属性 C 就是间接的传递函数依赖 ;

在这里插入图片描述

三、候选键

1、候选键概念简介

候选键是多属性集合 , 唯一可以标识元组行 , 且没有任何冗余 ;

一个关系可以有多个候选键 ;

任意选择一个候选键可以作为关系的主键 ;

主属性与非主属性 : 出现在候选键中的属性称为 " 主属性 " , 其它属性称为 " 非主属性 " ;

在这里插入图片描述

在这里插入图片描述

2、求取关系的候选键

使用 " 图示法 " 查找关系的候选键 , 使用 " 有向图 " 的方式分析关系模式的函数依赖关系 ;

R ( U , F ) 是关系模式的表示方式 , U 是属性集合 , F 是依赖集合 ;

属性集合 U 作为有向图的节点 ;
依赖集合 F 作为有向图的有向边 ;

有向图节点的入度和出度 : 箭头流出是出度 , 箭头流入是入度 ;

X、Y 是两个属性 , X 函数决定 Y , Y 函数依赖于 X , 记做 X -> Y ;
X 属性节点的出度为 1 , 入度为 0 ;
Y 属性节点的出度为 0 , 入度为 1 ;
上述依赖的有向边方向是 X -> Y ;

候选键遍历 : 在上述 " 有向图 " 中 , 找到 " 入度为 0 " 的属性节点 , 放在 " 遍历属性集合 " 中 , 以该属性集合中的属性节点为起点 , 遍历有向图 ,

遍历多次 : 不需要一次遍历完 , 可遍历多次 ;
间接遍历 : 不需要完全直接遍历 , 可以通过多个节点传导遍历 , 间接遍历也可 ;

分析遍历结果 :

如果能正常遍历有向图中的所有节点 , 则该 " 遍历属性集合 " 就是关系模式的候选键 ;
如果不能正常遍历有向图中的所有节点 , 则该 " 遍历属性集合 " 就不是关系模式的候选键 ;
- 此时需要尝试将 " 既有入度又有出度 " 的 " 中间结点 " 并入到 " 遍历属性集合 " 中 , 继续以集合中的属性节点为起点 , 遍历有向图 , 直到能够正常遍历有向图中的所有节点 ;

四、软考考点

1、求取候选码 1

给定关系 R ( A1 , A2 , A3 , A4 ) , 该关系上的函数依赖为 F = { A1 -> A2 , A3 -> A2 , A2 -> A3 , A2 -> A4 } ,

将属性 " A1 , A2 , A3 , A4 " 和函数依赖 F , 绘制成 " 有向图 " , 可以得到下面的有向图 ;

在这里插入图片描述

入度为 0 的属性节点是 A1 , 将 A1 属性放入 " 遍历属性集合 " L 中 , L = { A1 } ;

以 A1 为起点 , 遍历有向图 , 可以直接遍历到 A2 , 间接遍历到 A3 和 A4 , 可以完全遍历整个有向图 , 则 " 遍历属性集合 " L = { A1 } , 就是该关系 R 的 " 候选键 " ;

{ A1 } 属性集合是 R 的候选键 ;

A1 属性是 R 关系的主属性 , A2 、A3 、A4 是 R 关系的非主属性 ;

2、求取候选码 2

给定关系模式 R ( U , F ) , 其中

属性集合 U = { A , B , C , D , E , F , G , H , I , J } ;
依赖集合 F = { ABD -> E , AB -> G , B -> F , C -> J , CJ -> I , G -> H } ;

求上述关系 R 的候选键 ;

将上述属性集合 U 中的元素作为有向图的节点 , 依赖集合 F 作为有向图的有向边 , 绘制成的有向图如下图所示 :

在这里插入图片描述

找到入度为 0 的属性节点 , 将其放入集合 L 中 , L = { A , B , D , C } ;

以 L 集合属性为起点 , 可以遍历所有的属性节点 ;

L = { A , B , D , C } 集合 , 可以作为关系 R 的候选键 ;

3、求取候选码 3

给定关系模式 R ( U , F ) , 其中

属性集合 U = { A , B , C } ;
依赖集合 F = { B -> C , B -> A , A -> BC } ;

求上述关系 R 的候选键 ;

在这里插入图片描述

尝试找到入度为 0 的属性节点 , 将该属性节点放入集合 L , 发现没有入度为 0 的属性节点 ;

此时 L = { Φ } ;

查找入度为 1 的节点 , 放入集合 L 中 ;

将 A 节点放入集合 L 中 , L = { A } , 此时以 L 集合属性为起点 , 可以遍历所有的属性节点 ;
将 B 节点放入集合 L 中 , L = { B } , 此时以 L 集合属性为起点 , 可以遍历所有的属性节点 ;
C 的入度为 2 , 并且没有出度 , C 不能作为候选键 ;

上述关系 R 的候选键为 { A } 或者 { B } , 任意一个都可以作为候选键 ;

注意 : { A , B } 不能作为候选键 , 因为单独的 A 属性或者单独的 B 属性都可以作为候选键 , 两个属性一起就出现了冗余 ;