关于MSCOCO_text数据集的探索

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shouhuxianjian/article/details/73178209

最近需要做图片中文本识别的项目,然后为了快速验证模型,所以找到了mscoco-text数据集,网站1上是这么说的:

这里写图片描述

官网是这么说的:
这里写图片描述

然而,我下下来之后:
1 - 先导入:
这里写图片描述

2 - 其中key为’imgToAnns’是图片序号对应的注释序号,却是这样的:
这里写图片描述

这里写图片描述

然后,其中具体的图片中文字并不是完全标记出来的,比如某张图片中其实一共至少4处文字,其实就标记了一处,更有甚者有的图片单词都是只标记了一半。虽然没错一共是有145862个文字例子存在:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/shouhuxianjian/article/details/73178209