人工智能在语音和图像处理方面，主要有哪些突破？

人工智能在语音方面的突破

小米电视日前推出主打”高性价比”的全球首款人工智能语音电视小米电视4A，只需一个语音按键，便可实现关键词搜索、热度排行、开启应用游戏等10类语音交互功能。无独有偶，长虹近期推出CHiQ人工智能电视新品Q5N和OLED电视新品Q5A系列，主打的功能还是语音控制。

实际上，在市面上海尔、TCL等已经推出了所谓的可进行语音搜索的人工智能电视。小米电视最重磅的功能是支持人工智能语音控制，号称老人孩子都能使用，可以用很自然的语言对电视进行声控。

智能语音正在向着私人助理机器人方向快速发展，在大数据、人工智能、机器学习等技术的支撑下，可为每个人量身定制自己的个性化私人助理。

私人助理会根据用户的行为和使用习惯，帮助用户网上购物、安排出行、调整设备、智能提醒、聊天解闷。

私人助理可以提供越来越多的线下生活服务，如订餐厅、订外卖、购买电影票、医院预约等操作。

人工智能在图像处理方面的突破

过不了多久，所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。举个栗子，SmileVector 是一个推特机器人，

可以生成任何明星照片微笑的动图，如果输入一张人脸图片，它可以通过深度学习神经网络生成它们微笑的表情。

虽然这些图片也许并不完美，但它们完全是自动生成的，这是人工智能在图像处理领域的又一进步。

也许不久之后，图片、声音和视频造假都将变得容易。想象一下，假如新版本的 Photoshop 可以像用 Word 编辑文字一样轻松编辑图片，

你还会相信自己的眼睛吗？

Smile Vector 只是新技术的冰山一角，我们很难对现代人工智能多媒体处理技术做出全面的概述，但我们能够找出其中一些有意思的应用。

例如：从一张 2D 图片中创建 3D 面部模型；使用人类「模型」实时改变视频中人物的面部表情；改变图片中的光源和阴影；

为无声视频自动生成声音；在总统选举直播中让特朗普变成秃头；用视频剪辑「复活」朋友等等。这些事例只是其中的一小部分。

人工智能、大数据、云计算和物联网的未来发展值得重视，均为前沿产业，多智时代专注于人工智能和大数据的入门和科谱，在此为你推荐几篇优质好文：
人工智能快速发展的今天，语音识别现在发展到什么阶段了？
http://www.duozhishidai.com/article-2278-1.html
智能语音技术，主要面临哪些挑战？
http://www.duozhishidai.com/article-1927-1.html
语音的识别过程主要分哪几步，常用的识别方法是什么？
http://www.duozhishidai.com/article-1739-1.html
图像识别技术是什么？从实战告诉你答案
http://www.duozhishidai.com/article-15750-1.html
图像识别经历了哪几个阶段，主要应用在哪些领域？
http://www.duozhishidai.com/article-6461-1.html