各大人脸识别库的介绍

（1） Youtube Face

http://www.cs.tau.ac.il/~wolf/ytfaces/，

http://www.msn.com/zh-cn?pc=EUPP_

用户名wolftau 密码wtal997

人数：1595

图像数：未知，共3425个视频（最长6,070帧，最短48帧）

Video	1	2	3	4 扫描二维码关注公众号，回复： 5837162 查看本文章	5	6
Subject	591	471	307	167	51	8

Frame_images_DB.tar.gz

从Youtube上下载的视频，剪切成帧

路径：subject_name\video_number\video_number.frame.jpg

对于每个人，对应一个subject_name.labeled_faces.txt文件，文件中的格式为：

Filename,[ignore],x,y,width,height,[ignore],[ignore]

其中，x,y是人脸图像的中心坐标，width和height是图像的宽度和高度，例如，

$head -3Richard_Gere.labeled_faces.txt

Richard_Gere\3\3.618.jpg,0,262,165,132,132,0.0,1

aligned_images_DB.tar.gz

(5.4GB,md5sum:915accad71cd59c8d14399686e0c91f9)

相比Frame_images_DB.tar.gz中的图像，做了以下预处理：

(a) 人脸检测，用2.2倍大小的boundingbox，将图像从原图中剪切出来

(b) 对齐

路径：subject_name\video_number\aligned_detect_video_number.frame.jpg

Descriptors_DB.tar.gz

(7.9GB, md5sum: cb25c4099f14c10e6c88a4bc1e6bb1a9)

图像帧的带有descriptor的mat文件

路径：subject_name\mat files

每个video对应两个文件：aligned_video_1.mat和video_1.mat

分别是对齐的和非对齐的版本，此外，一帧图像带有多个descriptor（不同的特征描述），例如，一个80帧的video，

VID_DESCS_FPLBP:	[560x80 double]
VID_DESCS_LBP:	[1770x80 double]
VID_DESCS_CSLBP:	[480x80 double]
VID_DESCS_FILENAMES:	{1x80 cell}

Meta_data.tar.gz

(132MB,md5sum)

包含meta_和_split.mat文件，用于访问descriptor数据。Split将整个数据集分成了10个独立的split。

Split中的每个三元组的格式为(index1,index2, is_same_person)，其中index1和index2是maxt_names结构中的标记。总共5000对，等分成10个独立的split，其中2500对相同，2500对不同。

video_labels:	[1x3425 double]
video_names:	{3425x1 cell
mat_names:	{3425x1 cell}
Splits:	[500x3x10 double]

Headpose_DB.tar.gz (5.8MB,md5sum: 05efac9e4ae1a9ed28c2ed09bdbdd137)

对于数据集中的每一帧人脸图像，带有3种不同旋转角度的头部姿态

路径：headorient_apirun_subject_name_video_number.mat

每个mat文件的结构为：headpose:[3x60 double]

Sources.tar.gz

(5.6MB,md5sum: a965855464902af63dd44f16471025ab)

用于benchmark测试及实现以上所有方法。详见README文件。

（2） LFW (Labeling Faces Wild)

http://vis-www.cs.umass.edu/lfw/#deepfunnel-anchor

人数：5749，图像数：13,000，from web

其中，1680人有超过2张图片

包括4种图像：

lwf

deepfunneling

funneling

lwf-a用商业人脸对齐软件处理后的图像

超像素(super-pixels)包括：

lwfsuperpixels

lfwfunneled superpixels

lfwdeep funneld superpixels

其中，view1文件夹，是推荐的用于train/test的独立的、随机产生的split，可用于10-fold交叉验证，以避免过拟合。

view1中文件如下：

此外，view2用于benchmark对比，view2中文件如下：

（3） CelebFaces(A)

http://personal.ie.cuhk.edu.hk/~ys014/projects/Faceness/Faceness.html

在DeepID2中，将CelebFaces分成CelebFaces+A(8192个人)和CelebFaces+B(1985个人)。因此CelebFaces(A)中应有8192个人。CelebFaces是私有的样本库，共202,599幅图像。

另外，Large-scale CelebFaces Attributes (CelebA) Dataset文件夹包含

（4） MegaFace

http://megaface.cs.washington.edu/dataset/download.html

Username:[email protected]
Password: svyA~oAf.e

（5） CASIA WebFace

http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html

人数：10575，图像数：494,414。公有。

目前，需要打印协议，签字、发送给作者，才能得到下载需要的用户名和密码。

人脸识别数据集说明及其下载

提供了对人脸识别数据集（1）Youtube Face（2）LFW (LabelingFaces Wild)（3）CelebFaces(A)（4）MegaFace（5）CASIA WebFace的说明，及提供了下载方式

各大人脸识别库的介绍

猜你喜欢