这个周完成了在公司的实习,从青岛智能智造数据有限公司离职了。本周主要的工作任务是代码交接和将之前我的人脸识别的代码部署到个人电脑上,并搭建相应的环境和测试,已完成。
本周还进行了人脸识别公共数据集的收集,结果如下:
1. casia-facev5:
CASIA-FaceV5亚洲人脸数据集有500人、每个人5张图片,共2500张图片,图片大小为640*480。数据的格式比较符合我现在想做的方向,但是每人的照片太少了只有5张。链接:https://pan.baidu.com/s/1ia6LdbXv7LOAr9XirntUsg ,提取码:BXW2。
2. CMUVASC & PIE Face dataset
该数据集中包含了来自68个人的40000张照片,其中又包括了每个人的13种姿态条件,43种光照条件和4种表情下的照片,官网是http://vasc.ri.cmu.edu/idb/html/face/index.html,但是失效了。我从网上收集的资源和描述的不统一,虽然每个图片都用名字来做annotation,但每个人的照片数量都很少,照片的综合没有四万张,而且照片是黑白的,部分照片可能是多目标,用不了:
3.FERET
200人,每人7张,已分类,灰度图,80x80像素。 第1幅为标准无变化图像,第2、5幅为大幅度姿态变化图像,第3、4幅为小幅度姿态变化图像。拿来做训练集(比对库)正好,但是没有测试集。
链接:https://pan.baidu.com/s/1o9Y8v9rcdHn9763Z3HnVqA 提取码:v7pt
4.CAS-PEAL
CAS-PEAL是中科院计算技术研究所在2003年完成的包含1040位志愿者的工99450幅人脸图片的数据库。该数据库涵盖了姿态、表情、装饰、光照、背景、距离和时间等特征的变化,是一个十分符合我预期的数据集,要划分训练集和测试集,
下载链接:https://pan.baidu.com/s/1KZtOk-sfNkxnNQfNsTgTrQ提取码:jbp6
5.CASIA-WebFace
CASIA-WebFace作者编写了一个爬虫软件,取爬取IMDb上的照片以及名称并保存下来,每个人的照片个数不一样
6. AFLW
annotation的脏数据比较多,虽然每个人可能有多个照片,但是不能通过标签文件区分开来。
7.GENKI4K
笑脸数据集,文件损坏,照片打不开
8.The Japanese Female Facial Expression (JAFFE) Database
213张图像,10个人。每个人为一组,每一组都含有7种表情,每种表情大概有3,4张样图。可以通过照片命名来当作annotation
链接:https://pan.baidu.com/s/1hrICsVq 密码:klve
9.FDDB
Face Detection Data Set and Benchmark,是由马萨诸塞大学计算机系维护的一套公开数据库,为来自全世界的研究者提供一个标准的人脸检测评测平台。它是全世界最具权威的人脸检测评测平台之一,包含2845张图片,共有5171个人脸作为测试集。下载地址:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
10.JAFFE
该数据库是由10位日本女性在实验环境下根据指示做出各种表情。整个数据库一共有213张图像,10个人,全部都是女性,每个人做出7种表情。
11. Person identification in TV series
人脸照片均来自于两部电视剧《吸血鬼猎人巴菲》和《生活大爆炸》,标签是mat格式的文件,照片是videvens格式文件,使用起来比较麻烦。
https://cvhci.anthropomatik.kit.edu/~baeuml/downloads/CVPR2013_PersonID_data_v1.1.tar.bz2
11.个人制作的数据集
对比库如下
测试集是从监控摄像头下获取的人脸图像,如下:
总结
目前The Japanese Female Facial Expression (JAFFE) Database、CASIA-WebFace、CAS-PEAL、和个人制作的数据集是可以使用的,其中最符合预期的就是CAS-PEAL