【Image captioning】基于Defense of Grid Features for Visual Question Answering代码生成自定义数据集的网格特征

基于In Defense of Grid Features for Visual Question Answering代码生成自定义数据集的网格特征

作者:安静到无声 个人主页

参考代码:facebookresearch/grid-feats-vqa: Grid features pre-training code for visual question answering (github.com)

原作者加载coco源图片和相对应的instances_val2014.json文件,再通过运算生成对应的网格特征;为了简单起见,我们可以将自定义的数据集伪装成coco的格式,再生成网格特征。

以coco数据集的验证集为例,instances_val2014包含的键值如下:

 

猜你喜欢

转载自blog.csdn.net/lihuanyu520/article/details/132701707