@程序员 腾讯云计算机视觉应用干货,不容错过!

640?wx_fmt=gif

2019年4月13日,由腾讯云云+社区主办的“计算机视觉的原理及最佳实践”技术沙龙活动成功举办,来自各行各业的数百位开发者到场与多位腾讯云人工智能技术专家进行了深入交流与探讨,同时战略合作伙伴英特尔也对本次活动提供了大力支持。


640?wx_fmt=jpeg

沙龙现场座无虚席



640?wx_fmt=png

揭秘人脸识别系统落地传统行业



一直以来,“AI in All”都是腾讯在人工智能领域发展的“硬思想”,正所谓研发AI技术并不是关起门来服务自身的产品,而是将越发完善的技术对外开放助力开发者甚至全行业,并与实际应用相结合,如此新技术的价值才能得到最大程度的彰显与发挥。


基于这种思想,会上腾讯云资深技术专家范锦为与会开发者带来了有关“腾讯云人脸识别系统在传统行业的应用与落地”的主题分享。


作为第一位进行技术分享的嘉宾,范锦的主题演讲首要侧重于介绍人脸识别技术在交通、零售、安防等传统行业领域的实际应用,并着力探讨在技术落地实践中所遇到的诸多挑战以及对应的解决方案。


范锦提出“从技术角度来总结一个完整的人脸识别系统会包括哪些层面?”的问题。他表示,首先需要一个离线的算法模型训练层,来针对海量人脸库进行训练,随后会生成一个特征模型来使用。此外,作为计算机系统会需要一个图像采集的输入层,可以是来源于摄像头的视频流或者原始照片等。


“接下来比较关键的是识别层。通过离线训练得到的模型结合输入图片进行一系列预处理以及人脸检测、特征提取等一波密集操作,最后生成特征向量。”范锦补充道。


据了解,人脸识别技术目前最主流的应用场景可以分为两种,一种是人脸比对,简单说就是输入两张图片来比较两人的相似程度;第二种则是人脸检索,也就是输入一张图片后,如何快速在海量图库中找到与其相似度最高的一张或者若干张人脸照片。


640?wx_fmt=jpeg

腾讯云资深技术专家 范锦


范锦总结,腾讯云的人脸识别技术总结来看可以分为几种:一种是人脸检测与分析,例如五官定位、人脸比对,包括静态活力检测这一类无状态的API;另一种则是像人员库、人脸搜索、人脸验证等需要状态存储的API。


举个例子,人们经常提及的人脸检测与分析,实际上就是用户通过输入一张人脸照片,随后就能快速检测出人脸位置以及面部属性,比方说性别、年龄大致区间、光线质量以及美丽程度等信息。不同于人脸检测与分析,五官定位会从更细粒度的维度,提供例如眉毛、眼睛、鼻子等具体的信息。


范锦介绍说,关于静态活检的功能,大家听起来相对较陌生。概括来讲,主要作用是当输入一张照片之后快速判断图片是自拍还是翻拍,这一点可以在验证考勤真实程度时派上用场。


“从人脸识别公有云的大致架构出发,用户的客户端或者SDK会通过腾讯云API进行就近接入,在内部各节点之间的通信过程中主要使用腾讯云自研RPC框架来完成各个服务之间的均衡调度以及数据传输。在数据层面,主要是将用户数据拆分为三块,分别为特征数据库、逻辑数据库以及用户输入的原数据库,根据各自职能的不同分别存储在不同的数据库中。”他描述道。关于这一点,腾讯云也自研了一套组件来支持不同数据的分布式存储,不但满足了在线系统的快速对应,又能保证数据落地后的最终一致性。


谈及人脸识别技术的具体应用,范锦表示,安防领域具备区别传统或者现代互联网行业的显著差异。需要明确的一点,安防要求完整的私有化部署,这就需要切身实地到公安系统的机房进行规划实施;此外针对一些特殊功用,例如追逃、暴恐识别等,需要针对性开发平台以及应用两个层面,便于公安机关人员通过视频流的实时监控以及摄像头的快速管理完成后续工作。


区别于传统安防,新零售领域也有自己的特殊效用。“比方说,某个运动品牌的门店,通过采集数据发现,店中销售额与女性占比存在百分之十的差异,这意味着是不是还有潜在空间可以发掘呢?可以调整陈列的摆放、更加突出某一类产品以及整体的色系改变来吸引女性用户光顾。果然试运营之后效果提升明显,40%的销售额就这样实现了。”范锦对开发者们说。



640?wx_fmt=png

构建图像识别系统,究竟有何好方法?



据悉,早在2015年,使用深度学习构建的计算机系统在ImageNet 2012分类任务中就已经做到超越人类的视觉能力,随着人们对计算机视觉技术的越发了解,“是否任意一种图像识别任务都可以通过深度学习方法,采取端到端的方式来达成解决?如何搭建一套有效并稳定的图像识别系统?”等诸多问题渐渐提上了技术开发人员的日程。


冀永楠作为本次沙龙的第二位分享嘉宾就针对以上疑问进行了场主题为“浅谈构建图像识别系统的方法”的技术演讲。


分享内容涵盖了图像识别技术的发展历史以及深度学习在图像中应用并结合腾讯云图像识别产品来讲解构建图像识别应用的方法等诸多干货。更重要的是,还现场讲解并举例说明了如何通过使用腾讯云API搭建属于自己的图像识别应用等技术实践细节,开发者们都是受益匪浅。


“究竟,人们广泛热议的计算机视觉到底是用来做什么的?其实就是通过一些方法将现实存在的东西转化为图像,进而通过分析图像来得到想要的结果。”这是冀永楠的简要定义。


通常,习以为常的图像就是人类的照片,在技术层面通过物体识别、对象检测、对象追踪、语义分割,甚至还有三维重建以及知识问答等组合,来完成人脸识别的诸多任务。


早在2000年没有深度学习的时间里,图像的处理方法无外乎通过图像滤波器,被大致分为空间滤波器、频率滤波器、傅里叶、小波滤波器等,比较底层。


如果探讨中层的方法无非就是涉及到各种Feature,通过Feature加分类器的手段,经过图片的小片截取再放到分类器中加以证明是否为想要目标。冀永楠补充道,“当时的分割方式就是采用一个函数来限制它的变化方法,得到的结果都是比较规整的,可以使用level-set函数来表述,也可以用其他类型。”


640?wx_fmt=jpeg

腾讯云资深技术专家 冀永楠


谈及深度学习在图像中的应用,他总结道,最前端是底层便几何的特征层面,越到后端会出现一些比较高的层级特征,到最后的全连接,后面会接一些分类或者检测的结构。实际应用中,经常是深度学习的方法和传统方法相结合。以华星光电的应用为例,在一个高自动化的TFT-LCD屏幕生产系统中,涉及到的人力非常少,唯一用到人工的部分可能就是检查产出是否存在缺陷,例如黑点、光斑等。通过图像应用的解决方案代替这部分人工可能就是计算机视觉技术为工业生产领域带来的重大进步吧!


分享过后,现场开发者还针对“机器视觉和计算机视觉、图像分类所表现出的差异性”以及“目标检测是否已达到一个稳定水平”等诸多问题展开了深入探讨。



640?wx_fmt=png

数据数字化,华图在线网化教育培训



目前教育行业都在试图通过互联网及大数据分析等技术手段,为每个人制定更具针对性的学习计划,以更高效的方式提高个人的专业水平。具体来说,通过文字识别技术,将每位学员在线下培训过程中的数据进行数字化,结合线上自产数据绘制个人画像,再进行提升计划制定。对此,华图在线高级产品经理陈琪颇具一番见解。


“将教育互联网化,确实能高效提升教学效率。”尽管一对一教育方式是大部分机构普遍采用的,也是对学员专业能力提升最有效的方法之一,但其自身对企业的师资力量有一定门槛的要求;相比之下,题库模式以及直播/录播教学等方式也存在这样或者那样的局限性 。”陈琪明确道。


640?wx_fmt=jpeg

华图在线高级产品经理  陈琪


为什么要使用OCR,也就是文字识别呢?据介绍,本质上还是聚焦于线上以及线下教学相结合的趋向。对于学员来说,线下的教材必然包含很多知识点、题注以及练习题等内容,通过扫描具体的的知识点就可以在系统中调出具体的解析并呈现出来,这对于知识的理解也会越发深刻。



640?wx_fmt=png

从军装照小应用看人脸融合技术



当年一个军装照小应用,没想到居然火爆了整个朋友圈?!想必你也参与其中了。对于此,腾讯云高级研发工程师卓伟在“腾讯云人脸融合技术构建”的分享中谈到,我们应该怎样给军装照小应用背后的人脸融合下个定义呢?


简单说就是“换脸”。将自己的照片与底图照片进行换脸操作;技术上则会涉及到有关人脸识别的相关算法,例如通过人脸检测和配准的算法以及深度学习引擎,提取用户面部特征,并且针对照片进行人脸方向的检测,随后基于此完成特征融合并最终生成照片,达到既像模特又像自己的状态。


据悉,目前人脸融合技术主要应用在偏娱乐化方向,例如活动营销、游戏或者影视中角色扮演的打造等,朋友圈内的个性化形象扮演最为突出。


640?wx_fmt=jpeg

腾讯云高级研发工程师 卓伟


开发出一个好玩儿的应用之后,应该怎样做才能吸引大家去玩儿呢?类似于军装照的小应用如何做到支撑高并发流量呢?


“关于这个问题,我们可以选择使用静态应用加速和负载均衡,还有云上CVM和对象存储,为什么推荐采用云上架构?首先接入应用的用户可能来自全国各地,采用云上架构可以高效保障用户的就近接入,此处借助了云服务商的全球能力以及数据中心能力等;另外像军装照这种流量变动较大的应用,借助云的弹性伸缩能力可以更好控制成本并在此基础上灵活扩缩容。”他详细说道。


具体来说,关于用户的H5后台,其所有请求均会接入到API层面,这也是腾讯云统一的接入,这个过程会完成鉴权或者限频、负载均衡等;待数据处理完成后,就会将所有请求投入到业务逻辑层面进行融合,进而调用底层算法。


在算法层面,卓伟强调,通过腾讯云的机器学习平台,只需要不断投递图片以及相关数据就可以完成自动训练,这也是数据反哺算法。在SDK方面,开发者基本写很少量的代码就可以成功接入,只需要将业务参数信息传递进来即可。


“当然如果大家还是不想写代码的话,可以生成一个接入代码,只需要在可视化的窗口中填入参数,代码就可以生成了,随后完成封装函数即可实现接入。所以在小程序或者手机端H5中,都可以很快实现现有工具的接入工作,还可以顺带完成工具调测。”他解释说。



640?wx_fmt=png

解析人脸核身赋能行业应用



最后,在“人脸核身技术原理与行业应用”的分享中,腾讯云高级产品经理周吉成选择从应用场景出发,深入分析了人脸核身技术的现状、应用情况和最佳实践;并通过实际案例介绍了人脸识别技术在运营商、金融、政府等方面的应用。


640?wx_fmt=jpeg

腾讯云高级产品经理 周吉成


活体检测算法,最早被称为动作交互,一直是腾讯领先的技术之一。从起初的摇头眨眼判断活体到后来在微众银行开户应用中提出的数字加唇语分析,再发展到基于手机的“极光守卫”,即利用手机屏幕红蓝光映射到脸上录视频,再用该视频进行活体检测的判断。安全性高是其显著特征,而且适配于很多主流手机,这一点类似于iPhone X的Face ID,由于可以及时获取人脸的立体信息,所以保证活体的可靠性很高。


周吉成提出,iPhone X的Face ID这种技术方式效率很高,但好多安卓手机并没有这个设备,为了将此技术更加广泛使用,腾讯优图实验室研发了一套算法,通过打光,检测漫反射现象中脸部的立体信息,进而模拟红外或者双摄像头的机制,安全性很高。


一直以来,人们可能觉得目前的人脸比对、人脸融合已经发展的很成熟了,但现实中还远没有达到很智能的水平。由于采集的数据源来源不同,以及设备的远近程度差异,尽管最后环节的算法比对都没有太大问题,但正确率还有很多亟待进步的空间。


640?wx_fmt=jpeg

640?wx_fmt=jpeg

开发者们热情高涨


640?wx_fmt=jpeg

640?wx_fmt=jpeg

现场提问互动的开发者


此外,本次沙龙活动现场还进行了Hackathon —— 腾讯云图像识别API接入小竞赛的尝试。据了解,本次Hackathon不限创意类型,参赛须使用腾讯云视觉产品(限于智能鉴黄、图片标签、文字识别、人脸识别、人脸融合、人脸核身等)进行相关开发,让开发者能够通过实际操作熟悉和了解腾讯云AI技术能力。


640?wx_fmt=jpeg


值得一提的是,本期沙龙的Workshop环节更是吸引了很多开发者参与。通过一个小程序的案例,利用腾讯云AI平台人脸融合API去开发一款简单的人脸融合Demo,只需要上传自己的照片即可实现类似“军装照”图片融合功能。


本期云+社区技术沙龙主要聚焦在“计算机视觉”领域,通过近距离的分享交流让更多开发者了解和认识了腾讯云AI技术能力,也让现场的开发者对AI技术和实际应用有了进一步的认知。未来,腾讯云云+社区还将携手开发者,一起打造技术影响力,助力产业数字化转型升级。

欢迎关注公众号:云加社区,获取更多技术沙龙活动,分享技术干货,携手开发者一起探索技术的魅力。

 
  

System.out.println("点个在看吧!");
console.log("点个看吧!");
print("点个看吧!");
printf("点个看吧!\n");
cout << "点个看吧!" << endl;
Console.WriteLine("点个看吧!");
Response.Write("点个看吧!");
alert("点个看吧!")
echo "点个看吧!"

640?wx_fmt=png 你点的每个“在看”,我都认真当成了喜欢

猜你喜欢

转载自blog.csdn.net/csdnnews/article/details/89411124