爬虫结果数据完整性校验

数据完整性分为三个方面:

1、域完整性(列)

  限制输入数据的类型,及范围,或者格式,如性别字段必须是“男”或者“女”,不允许其他数据插入,成绩字段只能是0-100的整型数据,email字段的内容必须符合邮箱的正则表达式

2、实体完整性(行)

  要求表中的所有行都有一个唯一标识符。这个唯一标识符可能是一列,也可能是几列的组合,称为主键。也就是说,表中的主键在所有行上必须取唯一值。

3、参照完整性(表)

  参照完整性是基于外键与主键之间的关系,从表中的外键必须在主表中存在数据,不能引用主表中不存在的主键值,在输入更改或者删除主表数据时,从表需要联动变化,保证了数据的一致性。

根据以上概念,对于数据的完整性校验是从 “列”、“行”、“表” 的维度进行的。

有些约束是在建表的时候就已经根据数据库定义语言DDL语句进行了约束。

1、域完整性约束

  强制域完整性的方法有:限制类型(通过设定列的数据类型)、格式(通过CHECK约束和规则)或可能值的范围(通过FOREIGN KEY约束、CHECK约束、DEFAULT定义、NOT NULL定义和规则)

2、实体完整性约束

  强制实体完整性的方法有:索引、UNIQUE约束、PRIMARY KEY约束或IDENTITY属性。

3、参照完整性约束

  强制参照完整性的方法有:主外键关系

可以看到其实实体完整性是肯定符合的,因为没有主键是不能建表的,参照完整性约束在建表时一般也会进行约束,校验的重点在于域完整性校验,即校验列数据的内容,

  

猜你喜欢

转载自www.cnblogs.com/gcgc/p/11403723.html