百度输入法开启AI时代,突破方言、中英文混合识别难题

电脑在我国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,于是产生了汉字输入法。汉字输入法发展至今主流的方式大致可以分为,笔画、拼音、五笔、手写、语音、云输入法。

12287978-91946250f224073a.png

当前国内输入法存在很多问题

虽然汉字输入法经历了从无到有,从难到易,从简单到智能的发展过程,但是就目前来看,各大输入法依旧不够完善,还存在很多的问题。

首先,在线语音领域的Attention模型(注意力模型)没有突破。众所周知,Attention模型(注意力模型)在语音领域有着非常重要的作用,它关系到在线语音的效率和准确率。近年来各大输入法用的都是传统的Attention模型(注意力模型),而传统的Attention模型大都是基于整句的建模,语音都上传到服务器后,才能开始声学打分计算和解码,这样势必引入较长的用户等待时间,影响用户体验,同时也没办法完成实时语音交互的任务。各大输入法也意识到了传统Attention模型(注意力模型)的缺陷,在不断的进行改善,但都目前为止并没有太大的突破。

其次,很多输入法在离线语音上也存在很大的问题。市面上现有的很多输入法都号称自己的语音输入法在离线状态的时候也能使用。但是,实际操作使用之后会发现离线语音的效率和质量远远不及在线语音。根据众多网友反应的情况来看,离线语音时常会出现翻译不准确、没有断句等问题。也就是说离线语音非常容易产生歧义,从而导致沟通不畅。

最后,国内众多输入法在混合语音输入技术上也还比较落后,用户不能实现真正的“自由说”。京比特试验了一下,目前国内的输入法的语音输入多半只支持普通话,地方性语言则不能准确的识别出来。而中英夹杂、普通话夹杂方言、英语夹杂方言等这些混合性的语言更是不能够识别出来。

当前,国内的主要输入法有百度、搜狗、科大讯飞、QQ等几大输入法。当然这些输入法也意识到了自身存在的这些问题,并且一直在努力的改进,但到目前取得的成效并不大,甚至整个输入法行业语音领域都陷入了困境之中。

12287978-b2d979e1d122e7f2.png

百度输入法突破了输入法行业里的困境

近日,在百度输入法举行了“AI·新输入 全感官输入2.0”发布会,百度在发布会上公布了百输入法在输入法语音领域取得的多项重大突破。不少行业人士认为,百度此次发布的几项突破性的项目对整个语音领域来说有着非常重要的意义,打破了输入法行业语音领域当前的困境。

首先,就上文中提到的在线语音领域来说,百度输入法在传统的Attention模型(注意力模型)进行了升级,打造出了流式多级的截断注意力模型(SMLTA),它极大的减少了用户的等待时间,很好的解决了传统的Attention模型(注意力模型)在识别过程中时延性问题。不仅如此,流式多级的截断注意力模型(SMLTA)还在线语音识别精度提升了15%,超越行业最高水平15%。

其次,百度输入法在离线语音上也有很大的突破。百度输入法一直就非常重视离线语音领域的发展,去年百度语音就发布Deep Peak 2模型,该模型的主要作用之一就是提升百度输法离线语音的准确率。在此次发布会上百度输入法再一次深化了Deep Peak 2模型,让离线语音的准确率再次有了大幅度的提升。据悉,目前百度输入法离线语音输入相对准确率已高于行业平均水平35%,在没有网络的情况之下百度语音输入法也能够流畅的使用。

最后,百度输入法混合语音输入方面也领先于行业。目前百度语音已经能够识别 6种方言了,也就是说百度输入法的语音技术能够识别出方言也能够支持普通话与方言之间的切换。同时,百度输入法的语音技术也支持普通话和英语之间的切换。据悉,百度输入法已经成为了成为在完全不影响中文语音输入准确率的情况下,唯一实现高精准的中英文混合语音识输入。

在京比特看来,百度输入法在突破的输入法行业的困境的同时,也突破了我们对于输入法的认知。我们对于输入法的概念就是键盘、手机,而百度输入法此次发布的“AI·新输入 全感官输入2.0”输入法却不在完全依赖键盘和手机,语言、表情、动作都成为了百度输入法的一种输入方式。

12287978-1d360c0a0359fa30.png

百度AI技术正在驱动百度输入法的发展

百度输入法在突破行业困境的同时也获得了大量用户的认可。根据京比特查询的资料来看,截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。百度输入法不仅在国内发展迅速发展,在国外的输入法市场上也非常具有竞争力。相关资料显示,“百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作”。可见不管是在技术上还是市场上,百度输入法都取得了不菲的成绩。

如今的百度输入法俨然已经成为了业界的佼佼者。京比特认为,百度输入法取得技术与市场的双丰收,在很大程度上都得益于百度的AI技术。百度高级副总裁王海峰也表示:“输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更“聪明”。”

百度输入法是在2010年推出的,推出后不久就得到了百度AI的大力赋能,可以说百度输入法是百度将AI应用于自动驾驶汽车领域之后又一个重要的领域。在2018年1月百度发布度输入法8.0版本的时候,百度输法方面就宣布AI能力将大力赋能感官输入。而从此次发布会上的消息来看,百度输入法在感官输入方面已经取得了不小的成就,凌空手写就是其取得的成就之一。可见AI技术已经成为了驱动百度输入法发展的主要动力之一了。

百度是国内较早致力于发展AI科技的企业之一,在AI领域的投入也非常大,过去几年百度投入了数千亿美金进行了人工智能的研发,AI 能力也得到了国际上知名机构和媒体的认可,相信在百度强大AI能力的赋能之下,百度输入法将更具竞争力。

猜你喜欢

转载自blog.csdn.net/weixin_34417183/article/details/87583541