知识图谱·概念与技术--第1章学习笔记--知识图谱概述--大数据知识工程
记录章末思考题答案
互联网与大数据应用催生了知识图谱
传统知识工程难以适应互联网时代的大规模开放性应用的需求。
互联网应用的特点如下
- 规模巨大
如搜索引擎 - 精度要求相对不高
返回相似的结果 - 知识推理简单
如搜索”刘德华“推荐他的歌曲和电影
但对如”姚明老婆的婆婆的儿子有多高“这类复杂推理问题无能为力
大数据时代给知识图谱的发展带来了新机遇
- 数据、算力和模型的飞速发展使得大规模自动化知识获取成为可能
数据、算力和模型三者的结合可以摆脱对专家系统的依赖。
面向应用、数据驱动。
由专家定义设计模式(Schema),由数据驱动的方式实现实例级别的海量知识获取。 - 众包技术使得知识的规模化验证成为可能
训练知识抽取模型时可以通过众包获取标注样本,从而构建基于监督学习的抽取模型。 - 高质量的用户生成内容提供了高质量知识库来源
高质量的用户生成内容(User Generated Content, UGC),包括百科、社区、论坛、问答平台等,可以作用各领域知识获取的高质量种子样本,使得构建有效的知识抽取模型成为可能,同时避免了从零开始构建一个领域知识图谱。