版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_17677907/article/details/88016845
西门子项目
背景介绍
数据来源:工程文档
目标:从描述燃机的工程文档中总结实体(Component、Engine),构建知识图谱。基于知识图谱来做智能问答。
工作流:
技术文档 -> 图数据库(neo4j) CoreNLP DeepDive
搜索问题 -> 分类模板 -> 图数据库 -> 返回结果
重点:
实体识别 (Bi-LSTM CRF)
分类器 (Naive Bayes)
实体消歧
关系抽取
按照模板进行分类。
类比于简单的搜索引擎
工业知识图谱,
基于spark的朴素贝叶斯分类
电影模型
用到什么技术
- neo4j
- 实体识别
- cypher
- 自然语言处理
- 搜索引擎技术
- spark
- 关系识别
- 实体消歧