谷歌AI版“你画我猜”背后是什么样的原理?

我们先看看这个小程序是什么,打开微信小程序搜索页面,搜索“猜画小歌”,打开这个小程序,点击开始作画。小程序会先出题,告诉你画什么,20秒倒计时,你画完内容,然后谷歌AI去猜,如果猜的答案和题目匹配,则通过,进入下一题,否则失败。乍一看,怎么像是在考我的绘画能力呢,哈哈。


第一道题,让我画帆船,惜败...


再来一遍,钻戒,惨败...


Google AI


谷歌总是善于用人民群众喜闻乐见的方式“秀晒炫”自己的AI能力,这是来自 Google AI 的一款有趣的社交微信小程序,用户可以在有限的时间内进行速写涂鸦,在每一轮体验中,用户需要在规定时间内勾勒出一幅日常用品的图画(比如狗、钟表或鞋子),人工智能则需要在时间结束前猜出图画中的物体。


640?wx_fmt=jpeg


如果你画的东西在20秒内被谷歌人工智能猜中,则过关,反之游戏结束,还有排行榜来统计你的闯关数在好友中的排名,这也是微信小游戏一贯的社交板块。

640?wx_fmt=gif

如上图,游戏操作简单,接下来就是和AI达成默契进行“你画我猜”,如果多轮猜中,你就会进行连续的游戏解锁,然后登上朋友圈排行榜巅峰,考验各位“灵魂画手”的时候到了。

640?wx_fmt=jpeg



640?wx_fmt=jpeg


当然,也有哭着喊着让大家给评评理的,人工智能没有猜出来的这些画作,到底是谁的错?

“猜画小歌”的背后是超5000万个手绘素描数据群

猜画小歌由来自 Google AI 的神经网络驱动,该网络源自超过5000万个手绘素描的数据群,在此前谷歌推出的类似游戏《Quick, Draw!》之中,对于这个神经网络有着较多的介绍,如果你对猜画小歌很感兴趣,也可以谷歌搜索Quick, Draw!在PC端进行游戏。

640?wx_fmt=jpeg


如下图,谷歌所有出的猜画题,其实已经有着大量的手绘素描的数据群,你这边一边画,另一边神经网络进行快速比对。

640?wx_fmt=jpeg


我们点击香蕉,可以看到无数各式各样的手绘香蕉出现在你面前。


640?wx_fmt=jpeg


下面是关于脸的数据,看着各式各样的脸还挺有趣,值得一提的是,在谷歌的手绘素描的数据群之中,笔画的前后顺序都是纪录在内的,鼠标移动到任意一个脸上面,就会自动出现画图过程。

640?wx_fmt=jpeg


看到这里你是不是想说,看来人工智能也不过如此,只是在数据的基础上进行比对就好了,并不是神奇到不借助外力直接猜中我画的是什么。

在某种程度上,可以这么说,但又不准确,其实AI还进行了大量复杂的工作,谷歌对于“猜画小歌”的解释当中这样说道:计算机一直以来都是聪明的,现在有了AI以后,计算机可以用一种自然的,更接近人类的方式去理解这个世界,其中一个令人兴奋的新进展就是计算机视觉技术,它能让计算机直接理解输入的视觉信息,并由此“看到”这个世界。

谷歌说,这一技术既能在视频通话中识别出你的朋友以便加上对应的标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。而且,得益于“神经网络”技术,一些看起来极其困难的事情,计算机也能处理得非常好:比如,通过粗糙的草图就能识别出是什么物体。现在,计算机已经能“看到”你随意涂鸦出的一团长着耳朵的墨迹可能是一只熊猫。

玩“猜画小歌”有什么技巧?

  1.  不要拖泥带水,简洁最重要。因为程序只能接受大约200个左右的输入点,如果画很多细节,反而认不出来。

  2. 如果第一次画的没有识别出来,迅速擦掉重画,不要希望AI会后期力挽狂澜。从sketch-rnn模型可以看出,画画的路径转换为latent vector,前期的数据比重很重要。

  3. 最后一招:谷歌公开了所有类别的训练样本,大家可能上这个网站(https://github.com/googlecreativelab/quickdraw-dataset)下载,看看每个类别“正确”的画法。

为什么要在中国推小程序?


因为谷歌的网页版猜画小歌,由于大家都知道的原因,没有中国的数据。这次利用微信小程序刚好收集一下中国的数据。有人还做了不同国家画画的差别,比如日本人画圆是顺时针的,而绝大多数国家是逆时针的,原因是日文中的圆的顺时针写的。韩国和俄罗斯用户脑中,最直觉性的椅子图像是侧放的,而美国、德国、巴西、南非都是正面放置的。后续基于这个大样本,还能分析出很多好玩的东西。


什么是“神经网络”技术?

神经网络(Neural Network,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。


神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗的讲就是具备学习功能。典型的神经网络具有以下三个部分:结构(Architecture);激励函数(Activity Rule);学习规则(Learning Rule)。

不知道如何学习AI,关注公众号回复深度学习获取视频教学内容


640?wx_fmt=png

640?wx_fmt=png


推荐阅读


技术:jenkins和docker实现自动化构建部署

技术:设计图都不会画,还想做”架构师“?

技术:玩转linux 这些命令就够了 

技术:Kafka、RabbitMQ、RocketMQ等消息中间件的对比

技术:玩转linux 这些命令就够了

技术:30分钟如何学会使用Shiro 


工具:如何通过技术手段 “干掉” 视频APP里讨厌广告?

工具:通过技术手段 “干掉” 视频APP里讨厌的广告之(腾讯视频)


博主11年java开发经验,现从事智能语音工作的研发,关注微信公众号与博主进行技术交流!更过干货资源等你来拿!

640?wx_fmt=jpeg


640?wx_fmt=png


猜你喜欢

转载自blog.csdn.net/mxw2552261/article/details/82505383
今日推荐