粗糙集理论中--属性约简部分相关概念

下面的知识,只要掌握等价关系、等价类、商集就可以明白

定义(知识和概念(范畴或信息粒))
设U是我们感兴趣的对象组成的非空有限集合,称为论域。论域U的任何一个子集X⊆U,称为论域U的一个概念或范畴。为了规范化,我们认为空集也是一个概念,称为空概念。论域U中的任何子集簇(概念簇)称为关于U的抽象知识,简称知识。论域中的每一个概念(子集)表示他的一个信息粒

在粗糙及理论中主要是讨论那些能够在论域U上形成划分或覆盖的知识,既然是划分(即不包含重叠部分)等价关系是为等同,通常在求解问题的过程中,处理的不是论域U上的单一划分(知识或分类),而是论域U上的一簇划分出现知识库概念。

定义(知识库)
U和U上的一簇等价关系S,U上的等价关系就代表这划分和知识,知识库就表示论域上的由等价关系(这里指属性特征及其有限个的交)到处的各种各样的知识,即划分和分类模式,同时代表了对论域的分类能力

知识表示:
知识就是一种对事物的分类能力
知识表达系统:
四元组,信息系统,决策系统

知识约简,分类能力不变的前提下,删除冗余知识

属性约简
①删除表中重复对象
②删除冗余属性
③删除冗余属性值
④求出约简

如果最终任务是机器学习数据库中知识发现含有决策的知识表达系统,加⑤
⑤根据约简求出决策规则

决策表属性约简
在不同条件的决策环境中,人们对决策表的属性约简的要求和期望是不同的。例如在决策表中存在一些条件属性,由于他们的属性值难以得到或测量这些属性值花费太大,故我们希望讲这些属性从决策表中有限删除。理论上讲,决策表的属性约简最优结果能够找到包含条件属性数目较少的约简,也称最小约简,他能使决策规则的数目最小,而又不损失决策标的任何信息。在解决实际问题时,还应该考虑求解成本,算法计算复杂度等,讨论有益于将决策属性算法构造汇丰使用

分类标准:
有无启发式信息
无:盲目式
有:属性重要度,差分矩阵

算法寻找途径
正向添加
反向删除

猜你喜欢

转载自blog.csdn.net/qq_29680161/article/details/103208588
今日推荐