虽然这个数据集是开源的http://www.robots.ox.ac.uk/~vgg/data/voxceleb/,但是需要申请,下面讲一下如何申请以及它所包含的内容;
- 打开网址http://www.robots.ox.ac.uk/~vgg/data/voxceleb/,找到download
- 然后开始点击voxceleb1或者voxceleb2或者Models中的任何一个(j举例:这里点击就第一个voxceleb1):得到http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html,然后找到截图中的部分
- 点击this form ,按照要求填写内容就好。
- 然后去自己邮箱查看用户名和密码;
- 然后输入下载在windows系统里,最后上传服务器。(我尝试了wget --username=***** --password=*** http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html 花了一下午时间 告诉我域名解析不对 我不知道如何修改)
- 数据集介绍
1.deepspeaker-pytorch实验:https://github.com/qqueing/DeepSpeaker-pytorch;
2.也可以在kaldi中使用此数据集进行声纹识别,可能需要一两周时间出结果;