(1) Youtube Face
http://www.cs.tau.ac.il/~wolf/ytfaces/,
http://www.msn.com/zh-cn?pc=EUPP_
用户名wolftau 密码wtal997
人数:1595
图像数:未知,共3425个视频(最长6,070帧,最短48帧)
Video |
1 |
2 |
3 |
4
扫描二维码关注公众号,回复:
5837162 查看本文章
|
5 |
6 |
Subject |
591 |
471 |
307 |
167 |
51 |
8 |
Frame_images_DB.tar.gz
从Youtube上下载的视频,剪切成帧
路径:subject_name\video_number\video_number.frame.jpg
对于每个人,对应一个subject_name.labeled_faces.txt文件,文件中的格式为:
Filename,[ignore],x,y,width,height,[ignore],[ignore]
其中,x,y是人脸图像的中心坐标,width和height是图像的宽度和高度,例如,
$head -3Richard_Gere.labeled_faces.txt
Richard_Gere\3\3.618.jpg,0,262,165,132,132,0.0,1
aligned_images_DB.tar.gz
(5.4GB,md5sum:915accad71cd59c8d14399686e0c91f9)
相比Frame_images_DB.tar.gz中的图像,做了以下预处理:
(a) 人脸检测,用2.2倍大小的boundingbox,将图像从原图中剪切出来
(b) 对齐
路径:subject_name\video_number\aligned_detect_video_number.frame.jpg
Descriptors_DB.tar.gz
(7.9GB, md5sum: cb25c4099f14c10e6c88a4bc1e6bb1a9)
图像帧的带有descriptor的mat文件
路径:subject_name\mat files
每个video对应两个文件:aligned_video_1.mat和video_1.mat
分别是对齐的和非对齐的版本,此外,一帧图像带有多个descriptor(不同的特征描述),例如,一个80帧的video,
VID_DESCS_FPLBP: |
[560x80 double] |
VID_DESCS_LBP: |
[1770x80 double] |
VID_DESCS_CSLBP: |
[480x80 double] |
VID_DESCS_FILENAMES: |
{1x80 cell} |
Meta_data.tar.gz
(132MB,md5sum)
包含meta_和_split.mat文件,用于访问descriptor数据。Split将整个数据集分成了10个独立的split。
Split中的每个三元组的格式为(index1,index2, is_same_person),其中index1和index2是maxt_names结构中的标记。总共5000对,等分成10个独立的split,其中2500对相同,2500对不同。
video_labels: |
[1x3425 double] |
video_names: |
{3425x1 cell |
mat_names: |
{3425x1 cell} |
Splits: |
[500x3x10 double] |
Headpose_DB.tar.gz (5.8MB,md5sum: 05efac9e4ae1a9ed28c2ed09bdbdd137)
对于数据集中的每一帧人脸图像,带有3种不同旋转角度的头部姿态
路径:headorient_apirun_subject_name_video_number.mat
每个mat文件的结构为:headpose:[3x60 double]
Sources.tar.gz
(5.6MB,md5sum: a965855464902af63dd44f16471025ab)
用于benchmark测试及实现以上所有方法。详见README文件。
(2) LFW (Labeling Faces Wild)
http://vis-www.cs.umass.edu/lfw/#deepfunnel-anchor
人数:5749,图像数:13,000,from web
其中,1680人有超过2张图片
包括4种图像:
lwf
deepfunneling
funneling
lwf-a用商业人脸对齐软件处理后的图像
超像素(super-pixels)包括:
lwfsuperpixels
lfwfunneled superpixels
lfwdeep funneld superpixels
其中,view1文件夹,是推荐的用于train/test的独立的、随机产生的split,可用于10-fold交叉验证,以避免过拟合。
view1中文件如下:
此外,view2用于benchmark对比,view2中文件如下:
(3) CelebFaces(A)
http://personal.ie.cuhk.edu.hk/~ys014/projects/Faceness/Faceness.html
在DeepID2中,将CelebFaces分成CelebFaces+A(8192个人)和CelebFaces+B(1985个人)。因此CelebFaces(A)中应有8192个人。CelebFaces是私有的样本库,共202,599幅图像。
另外,Large-scale CelebFaces Attributes (CelebA) Dataset文件夹包含
(4) MegaFace
http://megaface.cs.washington.edu/dataset/download.html
Username:[email protected]
Password: svyA~oAf.e
(5) CASIA WebFace
http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
人数:10575,图像数:494,414。公有。
目前,需要打印协议,签字、发送给作者,才能得到下载需要的用户名和密码。
人脸识别数据集说明及其下载
提供了对人脸识别数据集(1)Youtube Face(2)LFW (LabelingFaces Wild)(3)CelebFaces(A)(4)MegaFace(5)CASIA WebFace的说明,及提供了下载方式