AEIA2018 | 科大讯飞刘俊峰:人工智能建设美好的世界

640?wx_fmt=gif


7月4日,在广州举办的“2018年中国汽车智能计算平台大会”上,科大讯飞股份有限公司副总裁、科大讯飞智能汽车事业部总经理刘俊峰发表了题为“人工智能赋予汽车的全新交互体验”的演讲。他在演讲中表示,我们正处在汽车智能化升级的时代,而语音将会成为智能网联非常核心的一部分。他强调,真正的下一代智慧智能汽车,除了传统的内外饰、动力系统以及品牌,它的交互以及它的智能网联属性将会成为一个车企品牌非常重要的组成部分。


640?wx_fmt=jpeg

科大讯飞股份有限公司副总裁、科大讯飞智能汽车事业部总经理刘俊峰


以下是演讲全文:


尊敬的主持人,各位新老朋友下午好,特别荣幸在这样的一个炎炎夏日和大家进行交流。凡是有去过科大讯飞的人都有看到我们的产品模仿了很多主持人以及明星的声音,这些都是科大讯飞这么多年语音处理核心技术的应用推广。


科大讯飞成立于1999年,从前线研发到现在,已经有19年了。在这19年里,我们一直坚持用技术创新来创造人工智能未来的美好世界。讯飞从2008年上市到去年市值突破了1000亿,现在公司有12000人,在广州地区的团队有900人。科大讯飞在语音技术、人工智能的感知方面获得了很多国际奖项,包含全球所有语音相关的全类奖项,我们都是全球第一。


讯飞去年也获得了很多荣誉:


6月,MIT发布全球50大最聪明企业榜单,科大讯飞首次上榜名列全球第六,在同期上榜的中国公司中位居第一;


7月,国务院发布了《新一代人工智能发展规划》,这是首部国家层面的人工智能发展规划。并公布了首批国家新一代人工智能开放创新平台,依托科大讯飞建设智能语音国家新一代人工智能开放创新平台;


此外,科大讯飞还牵头承担了科技部首个中国人工智能的重大项目“类人答题机器人”。讯飞作为该项目的总牵头单位,正式启动了讯飞的超脑计划:以语音和语音为入口的“认知革命”,研发基于人类神经网络的认知智能系统。


首先谈一下语音合成,大家听到刚才模拟的声音,还有不断更新利用DNN算法不断优化的TTS合成语音系统,大家可以下载一些听歌的音乐软件,这里面的TTS合成语音平台都是云平台到播音。现在机器的水平已经可以突破常人,平稳稳定在4.3分,可以带情感,实际上经常接到一些骚扰电话的时候你不知道对面是机器人。现在我们还在突破自己的极限,用智能客服打给另外一个智能客服,让他们俩聊天,他们俩可以聊个几分钟,这个突破了我们对于日常生活场景的认知。


语音识别和真人听写。2015年11月的发布会,前面做彩排的效果,我激动得泪流满面,因为这就是期待多年的成果。它能够做到实时停歇,实时修改。基于语意,它能够将听到的声音转写,并且可以结合前后你说的场景把出现的错字改掉。根据我们的数据统计,如果是正确的普通话,语音识别的正确率可以达到97%,远远超过现场速记的水平。我们也在比赛中对比过,对于一级的速记员可能达到80%的准确率,用讯飞的听写系统可以达到95%。


下一个要说的机器阅读理解。机器阅读理解是让机器看完一篇文章以后把这里面的知识体系和知识网络抽离出来,然后变成一个知识图谱,专业机器人的对话逻辑主要是依靠机器图谱。我们构建了这样一套系统就能够使机器跟我持续交流下去,并且能够对于一个问题进行深度的交流。另外,图像识别和理解技术,我们也获得了全球第一。去年10月,我们第一次参加由奔驰发起的,自动驾驶领域最权威的国际测试——Cityscapes,我们拿了第一,第二名是谷歌的DATASET。科大讯飞借鉴了已在教育图文阅卷中成功应用的复杂版面分析技术,并结合道路场景解析的特殊问题进行算法迁移,构建了一套具有丰富上下文信息的多层次图像语义分割方案。真正构建了从语音到图象,从显示到交互。


讯飞语音云开放平台,对外发布之后,到现在已经有了17亿以上累计终端的激活量,包括手机、电视等很多的设备、软件以及行业应用。第三方创业团队已经上线的APP总数超过60万,基本上每个月5~6万的增长,平均每天使用的次数突破了40亿次。大家用的讯飞语音输入法每天都在更新。讯飞语音云开放平台是讯飞平台+赛道推动人工智能战略的落地。这个赛道包含汽车、教育、医疗、公检法、智慧城市、消费者等产品。讯飞翻译机可以离线或者在线进行实时翻译。2014—2015年我们把中英和英中全球第一的翻译名词拿到自己手上。


然后再谈谈汽车。我们正处在汽车智能化升级的时代,这里我只讲语音。语音会成为智能网联非常核心的一部分,真正的下一代汽车,智慧智能汽车除了传统的内外饰、动力系统以及品牌,我认为它的交互以及它的智能网联属性将会成为一个车企品牌非常重要的组成部分。它的交互风格,这里面可能涉及到面向车主的年龄差异、职位差异以及喜好差异。服务的特性有可能表现在每天推送的内容,以及各种生态链接的特色。我一直认为,不是天下所有的系统、所有的硬件都一样,所以车厂在构建自己系统时要体现自己的差异化。


人机交互革命,这是一场汽车产业的配合戏。对于智能化的体验和对于数据的使用和服务的连接,人性化交互是必须要考虑的。随着辅助驾驶和自动驾驶的发展。车辆的交互,人机交互以及软件服务应该是怎么样?应该是每个界面都是系统性、立体性的。这个时候语音是很重要的,他的服务以及软件的模型必须是一个立体思考的过程。


这里面我们提到的交互是希望以语音为核心综合交互的方式:一是简单,一句话就能达到目的;二是智能,更懂你的服务关怀;三是安全,快速响应,解放用户的双手;四是要人性,交互更自然流程。我认为这四点都是每个好的语音交互必须同时具备的。


我们对于汽车发展方向的定位:一是智能,让前端的车,车内的交互更加智能化;二是精益,精益生产是广告模式,精益代表可以进一步降低成本提高效率,让车厂和用户更智能,广告投放一线到底。这才是好的联网系统,而不是联网只为了信息娱乐导航目的而去的平台系统。


智能语音核心技术方面,2012年,我们真正在国内进行了第一台量产的合作产品。从江淮到长安,走到现在。每年技术的变革、技术的演化都带给汽车行业前端语音发展带来了变化。包括我们提供了云和端的系统,提供了车上可以能够规避绝大多数噪音影响的系统。也包括英文“云+端”语音识别的一套解决方案,到现在云端可以在同一个架构上设计它的交互逻辑,并且支持语意,可以场景化激活。每次都要在算法、技术、整合产业资源等上面有很大的突破,才能达到现在这样的水准。现在讯飞可以在汽车里面提供全链条的语音解决方案,从声音进到声音出。


下一代,面向未来的产品布局。我们要提供一体化以及服务数据一体化的解决方案,这个方案里面我们有5个车厂的身份,而且这五个车厂已经正式开始量产了。飞鱼2.0我们做的就是交互一定要好,从颜、听、看、连、懂人、动车、懂行,面向未来的汽车智能交互系统,并且外部场景连接要有外部的停车、加油以及智慧家庭、情感情怀、状态感知、情绪感知、智能化、虚拟司机。这个系统不是只有联网或者是高配车才需要,所以一定要做到便宜。首先成本便宜,第二是使用便宜,使用过程当中用户的成本也便宜。所以整个发展路线我们现在就是这样设定的。只不过里面有更细的颗粒化,每一项技术和新功能、新服务都是从底层的算法到创新不断的发展。


人工智能,让车企和用户友好连接。人工智能和客服,就是用一个机器人打给另外一个机器人,可以使原来400或者是一些呼叫中心的平台全部用机检,而不用人。第二天就可以看到机器人的分析报告给小组长就可以知道投诉量是怎么样?这个是讯飞从创建到现在一直在推广的系统。然后还有就是智联,我们连接所有是开放的,这种连接可以和每个设备连接。


我们现在并不是抢夺某一个车场的数据,数据是车厂和用户的,我们帮助我们和伙伴解决数据处理的问题。这个过程中,其实大家相互的讨论不是我强你不强,不是你没有数据我有数据这样的态度。而是大家把心打开,一方面有经验一方面有技术,一方面还有这样的数据。比如,我们用刚才机器人阅读技术解决车内的语音交互系统可以在汽车专业知识,尤其是在车与汽车专业品牌上有一个交流和交互。用这种方式真正让人工智能把交互变强。


这15年来也是非常感谢合作伙伴对于我们的信任和支持。人工智能建设美好的世界!谢谢大家!


END


640?wx_fmt=jpeg

猜你喜欢

转载自blog.csdn.net/lrs62520kv/article/details/81090760