6 知识融合 - 代码天地

6 知识融合

其他 2020-03-01 15:58:15 阅读次数: 0

知识融合Konwledge Fusion

目标：融合各层面的知识

合并两个知识图谱(本体)，需要确认：

1、等价实例sameAs

2、等价类、子类subClassOf

3、等价属性、子属性subPropertyOf

同一实体来源于不同知识库，KG的构建经常需要融合多种不同来源的数据

实体对齐是知识图谱融合的主要工作

KG中可以复用其他KG中的标签

跨语言知识融合

知识在线融合

Google Konwledge Vault

主要挑战：数据质量的挑战/数据规模的挑战

知识融合竞赛：OAEI本体对齐竞赛

知识融合的基本技术流程

本体对齐+实体匹配

数据预处理->分块->负载均衡->记录链接->结果评估->结果输出

一、数据预处理：

语法正规化

数据正规化(缩进/转义符/正式名....)

二、记录链接：

1、属性相似度

1)编辑距离：

Levenshtein distance最小编辑距离

用最少的编辑操作将一个字符串转换成另一个

是典型的动态规划问题

D(i,j)=min[D(i-1,j)+1.D(i,j-1)+1,D(i-1,j-1)+1]

Edit Distance with affine gaps

Dice系数用于度量两个集合的相似性

Jaccard系数适合处理短文本的相似度

2)基于向量的相似度

TF-IDF评估某个字或某个词对一个文档的重要程度

2、实体相似度

1)聚合：加权平均/手动指定规则/分类器

2)聚类：

层次聚类(SL算法/CL算法/AL算法)

相关性聚类(最大留，最小割)

Canopy(分块)+K-means

桥梁：预连接实体对(训练数据)：联合知识嵌入，双向监督训练

三、分块：

Falcon-AO

基于hash函数的分块

常用hash函数：

first n-grams

n-grams

集合多个简单的hash函数

邻近分块

Canopy聚类

四、负载均衡

保证所有块中数量相当

五、结果评估

准确率、召回率、F值、运行时间

典型知识融合工具简介

本体对齐：Falcon-AO

四类匹配算法：V-Doc虚拟文档/GMO比如难题RDF图结构匹配/I-Sub编辑距离的字符串匹配/PBM分治的大本体匹配

实体匹配：Dedupe

指定谓词集合和相似度函数

训练Blocking：通过Red-Blue set cover 找到最优谓词集合来分块

实体匹配：Limes

基于度量空间的实体匹配发现框架

实体匹配：Silk

Tai_Park

发布了66 篇原创文章 · 获赞 28 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_36329973/article/details/81805769

6 知识融合

知识融合

task6 模型融合

task6-模型融合

知识融合：知识推理

知识图谱——知识融合

知识图谱：知识融合

知识总结(6)：驱动

6大继承知识

css知识回顾（6）

基础知识6

ES6知识

知识图谱入门 (六) 知识融合

知识图谱之知识融合

天池学习赛：工业蒸汽量预测6——模型融合

ES6 小知识

ES6 知识拓展

python 知识点6

js的知识点6

ES6 知识总结

ES6知识汇总

java基础知识6

python基础知识6

ES6知识总结

6. 数论准备知识

Python基础知识-6

知识点小结~6

面试知识-es6

ES6_class知识

ES6知识整合

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)