1-通用对话系统-阿里大文娱-李亚楠

整理自2019AI科学前沿大会分会场2-自然语言处理,如有侵权,请联系作者删除。

图片下载链接: https://pan.baidu.com/s/1M_n9OX3H6U7AujsYFIpHOw 提取码: iz2x 

1-通用对话系统-阿里大文娱-李亚楠

对于对话系统的理解,我们想象中是像经常在电影里看到的比如贾维斯等的,但是回归到现实世界中,有时候会觉得对话系统有些智障。本次的分享主要以技术报告的形式,我们先看看对话系统的发展过程,上个世纪60年代,出现了Elisa(对话机器人),甚至后来用于心理咨询师等等。我们从工业界、搜索引擎的角度出发来看,第一代互联网的出现时因为信息量增多,杨致远和他的舍友通过手动编辑的方式,也就是当时的Yahoo,后来有发展到了Google网页搜索阶段,再后来web搜索。

大致经历了中国雅虎搜索、阿里云搜索、神马搜索、UC头条、夸克。

也就是说,我们需要一个跨平台多终端的智能助手,主要分为三个方面:业务产品:UC浏览器、UC头条等;技术设施:搜索、推荐、智能交互;内容生态:阿里的大鱼号、知识图谱、用户画像、非结构化的网页生态等等。

通用对话平台的结构框架如下:核心是对话系统SDS

对话系统中的五个组成部分:自动语音识别(ASR),自然语言理解(NLU),对话管理(DM),自然语言生成(NLG)和文本到语音合成(TTS)。

 

迁移学习主要有半监督和监督两种方式。数据量大,会采用小样本学习的方法。

对话管理(DM)的目的是在有着不同知识的不同领域中通过使用NLP的方法进行流畅地表达,涉及到众多领域,同时聊天也有很多技术,如聊天术等等的,如何将他们统一起来,进行灵活地处理,是一个难点,同时也需要注意到它的可扩展性,不能说稍有变动就重头来过,因此提出了这个业务与引擎分离的思想,业务就是上层的一些机构和分支,DST层就是引擎层。

 

 

 

 

 

除了检索式对话系统,还有生成式的对话系统,生成式的对话系统的概念,是当前的一个学术热点,但是目前应用不成书,准确率低。

 

目前对话系统在古诗生成、对联生成等方面做的较好,但是在简单的日常对话上表现欠佳。

 

Q:对知识图谱的查询是否会消耗大量的时间,知识图谱的存储。

答:知识图谱的建立经过很长时间,大概三四年,需要一个慢慢积累的过程,尤其是长尾数据。知识图谱存在于图数据库中,对它做关系抽取、验证,时间是挑战之一,如果规模大,那么相应的灵活性相应地较小,目前只用于处理一些比较简单的问题,如一轮推理。

猜你喜欢

转载自blog.csdn.net/m0_37442062/article/details/89244432
今日推荐