官方网址:
https://data.vision.ee.ethz.ch/cvl/gfanelli/head_pose/head_forest.html#db
数据库具体解释:
数据库包含使用Kinect传感器获取的24个序列。20人(其中一些人被记录了两次——6名女性和14名男性)坐在传感器前,以大约一米的距离转动头部。
数据是为了估计(而不是跟踪),这就是为什么有些帧丢失的原因:这就是自动注释失败的地方。如果您进行跟踪,也要记住这一点,当您将结果与本文中报告的结果进行比较时,因为它们指的是逐帧估计实验。
对于每个序列,对应的.obj文件表示该特定人员的中性面的头模板。
在每个文件夹中,有两个.cal文件包含深度和彩色相机的校准信息,例如深度相机的内置相机矩阵以及到RGB相机的全局旋转和平移。此信息可用于对齐RGB和深度数据。请注意,每个序列的校准不同。
对于每个帧,将提供包含颜色和深度数据的a rgb.png和a Depth.bin文件。深度已经被分割(使用距离上的阈值删除背景),二进制文件被压缩(提供了一个示例C代码来显示如何将深度数据读写到内存中)。
.txt和pose.bin文件包含地面实况信息,即3D中头部中心的位置和头部旋转。.txt文件将旋转编码为一个矩阵,.bin文件包含6个表示头部中心坐标的浮点数,后跟pith、yaw和roll角度。
下表显示了受试者(m/fxx)和序列号之间的对应关系。
01 -F01
02—F02
03 -F03
04—F04
05 -F05
06 -F06
07 -01
08~02
09 -03
10—M04
11 -05
12 - M06
13—M07
14—M08
15 -F03
16 -09
17—M10
18 -F05
19—M11
20—M12
21—F02
22 -01
23—M13
24—M14