人工智能在语音和图像处理方面,主要有哪些突破?

人工智能在语音方面的突破

小米电视日前推出主打”高性价比”的全球首款人工智能语音电视小米电视4A,只需一个语音按键,便可实现关键词搜索、热度排行、开启应用游戏等10类语音交互功能。无独有偶,长虹近期推出CHiQ人工智能电视新品Q5N和OLED电视新品Q5A系列,主打的功能还是语音控制。

实际上,在市面上海尔、TCL等已经推出了所谓的可进行语音搜索的人工智能电视。小米电视最重磅的功能是支持人工智能语音控制,号称老人孩子都能使用,可以用很自然的语言对电视进行声控。

智能语音正在向着私人助理机器人方向快速发展,在大数据、人工智能、机器学习等技术的支撑下,可为每个人量身定制自己的个性化私人助理。

私人助理会根据用户的行为和使用习惯,帮助用户网上购物、安排出行、调整设备、智能提醒、聊天解闷。

私人助理可以提供越来越多的线下生活服务,如订餐厅、订外卖、购买电影票、医院预约等操作。

人工智能在图像处理方面的突破

过不了多久,所有人都可以通过人工智能对一张图片或是对视频进行复杂的处理。举个栗子,SmileVector 是一个推特机器人,

可以生成任何明星照片微笑的动图,如果输入一张人脸图片,它可以通过深度学习神经网络生成它们微笑的表情。

虽然这些图片也许并不完美,但它们完全是自动生成的,这是人工智能在图像处理领域的又一进步。

也许不久之后,图片、声音和视频造假都将变得容易。想象一下,假如新版本的 Photoshop 可以像用 Word 编辑文字一样轻松编辑图片,

你还会相信自己的眼睛吗?

Smile Vector 只是新技术的冰山一角,我们很难对现代人工智能多媒体处理技术做出全面的概述,但我们能够找出其中一些有意思的应用。

例如:从一张 2D 图片中创建 3D 面部模型;使用人类「模型」实时改变视频中人物的面部表情;改变图片中的光源和阴影;

为无声视频自动生成声音;在总统选举直播中让特朗普变成秃头;用视频剪辑「复活」朋友等等。这些事例只是其中的一小部分。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
人工智能快速发展的今天,语音识别现在发展到什么阶段了?
http://www.duozhishidai.com/article-2278-1.html
智能语音技术,主要面临哪些挑战?
http://www.duozhishidai.com/article-1927-1.html
语音的识别过程主要分哪几步,常用的识别方法是什么?
http://www.duozhishidai.com/article-1739-1.html
图像识别技术是什么?从实战告诉你答案
http://www.duozhishidai.com/article-15750-1.html
图像识别经历了哪几个阶段,主要应用在哪些领域?
http://www.duozhishidai.com/article-6461-1.html


多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

猜你喜欢

转载自blog.csdn.net/weixin_43346716/article/details/89364604