【Image Cpationing PyTorch Implementation】数据预处理 - 代码天地

【Image Cpationing PyTorch Implementation】数据预处理

其他 2019-07-27 13:24:50 阅读次数: 0

数据集

MSCOCO Dataset，Flickr8k，Flickr30k

需要指出的是Flick8k_text/Flickr8k.token.txt 中共有8092*5=40460条描述，但是Flickr8k_Datasets 中只有8091张图片，原因在于Flickr8k.token.txt 的line 6731 处有问题

2258277193_586949ec62.jpg.1#0 people waiting for the subway
2258277193_586949ec62.jpg.1#1 Some people looking out windows in a large building .
2258277193_586949ec62.jpg.1#2 Three people are waiting on a train platform .
2258277193_586949ec62.jpg.1#3 Three people standing at a station .
2258277193_586949ec62.jpg.1#4 two woman and one man standing near train tracks .

当然实际上我们并不需要用到Flickr8k_text ，这里采用的是Andrej Karpathy's training, validation, and test splits. 提供了划分好的json文件，里面保存了每张图的caption，以dataset_flickr8k.json 为例，利用如下代码读取json文件

import json
with open('dataset_flickr8k.json','r') as j:
    data = json.load(j)

得到data字典，可以查看结构为

#data有两个键值，data['images'],data['dataset']
#data['dataset']: 'flickr8k' 表明该json文件是属于哪个数据库
#data['images']是一个列表，长度为8000，说明只用到了8000张图片
#列表中每个元素是一个字典，其keys为[sentids', 'imgid', 'sentences', 'split', 'filename']
#sentids:[0,1,2,3,4]表示4句描述的id
#imgid:0 表示图片id
#sentences是一个列表，每个元素是一个字典{'tokens':[word]}，也就是把一句话变成多个词的列表
#split:'train'表示是训练集的
#filename:'xxx.jpg'表示图片文件名

猜你喜欢

转载自www.cnblogs.com/doragd/p/11254571.html

【Image Cpationing PyTorch Implementation】数据预处理

PIL Image与tensor在PyTorch图像预处理时的转换

【PyTorch】：数据预处理

pytorch数据预处理

【Pytorch】数据预处理

PyTorch学习之数据增强（image transformations）

pytorch数据预处理错误

【colab pytorch】数据预处理

PyTorch----数据预处理

【pytorch】图像数据预处理

pytorch image to tensor

pytorch加载数据与预处理数据

Pytorch数据读取与预处理实现与探索

ch02-PyTorch数据预处理

PyTorch图像预处理

Pytorch 文本预处理

Pytorch快速入门---pytorch中的数据操作和预处理

图像处理（1）：PyTorch垃圾分类数据预处理

图像处理（1）：PyTorch垃圾分类数据预处理

Tensorflow 和 Pytorch 图像处理辅助工具scikit-image

Pytorch数据操作和数据预处理

如何自动生成图片用于测试 pytorch（No image? No need image）

Pytorch框架实现Pix2Pix(Image-to-image)

Pytorch入门学习：数据加载和预处理的通用方法

[Pytorch框架] 2.1.4 数据的加载和预处理

PyTorch基础（四）-----数据加载和预处理

pytorch中数据预处理模块：transforms详解

tensorflow中的image预处理操作函数

使用pytorch测试单张图片（test single image with pytorch）

深度之眼Pytorch打卡（十）：Pytorch数据预处理——数据统一与数据增强（上）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)