文件格式之lmdb - 代码天地

文件格式之lmdb

其他 2018-06-22 18:11:40 阅读次数: 3

LMDB：是一种极大减少IO开销的数据管理方式，特别是对于样本多，但是都是小样本的情况特别合适。该数据格式采用的是一种字典的格式。

对于训练神经网络，数据类型复杂多样，有二进制文件，文本文件，编码后的图像文件和JPEG或PNG等等

使用caffe对数据进行处理时，需要将图片转化为lmdb格式的。

求助百度百科，无词条，求助wikipedia,成功，地址.
lmdb 是Lightning Memory-Mapped Database的缩写。
LMDB示例文件为
这里写图片描述
它包含一个数据文件和一个锁文件。

python 操作

参考教程1,教程2和教程3
python module 为lmdb
直接通过pip进行安装

pip install lmdb

1

读 LMDB

import caffe
import lmdb
import numpy as np
import cv2
from caffe.proto import caffe_pb2

lmdb_env = lmdb.open('lmdb_data')
lmdb_txn = lmdb_env.begin()
lmdb_cursor = lmdb_txn.cursor()
datum = caffe_pb2.Datum()

for key, value in lmdb_cursor:
    datum.ParseFromString(value)

    label = datum.label
    data = caffe.io.datum_to_array(datum)

    #CxHxW to HxWxC in cv2
    image = np.transpose(data, (1,2,0))
    cv2.imshow('cv2', image)
    cv2.waitKey(1)
    print('{},{}'.format(key, label))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

写

import lmdb
import numpy as np
import cv2
import caffe
from caffe.proto import caffe_pb2

#basic setting
lmdb_file = 'lmdb_data'
batch_size = 256

# create the lmdb file
lmdb_env = lmdb.open(lmdb_file, map_size=int(1e12))
lmdb_txn = lmdb_env.begin(write=True)
datum = caffe_pb2.Datum()

item_id = -1
for x in range(1000):
    item_id += 1

    #prepare the data and label
    data = np.ones((3,64,64), np.uint8) * (item_id%128 + 64) #CxHxW array, uint8 or float
    label = item_id%128 + 64

    # save in datum
    datum = caffe.io.array_to_datum(data, label)
    keystr = '{:0>8d}'.format(item_id)
    lmdb_txn.put( keystr, datum.SerializeToString() )

    # write batch
    if(item_id + 1) % batch_size == 0:
        lmdb_txn.commit()
        lmdb_txn = lmdb_env.begin(write=True)
        print (item_id + 1)

# write last batch
if (item_id+1) % batch_size != 0:
    lmdb_txn.commit()
    print 'last batch'
    print (item_id + 1)

猜你喜欢

转载自blog.csdn.net/touch_dream/article/details/80527187

文件格式之lmdb

python生成lmdb格式的文件

生成lmdb格式文件

原始图片制作LMDB格式文件

深度学习---之lmdb文件的制作

Python读写LMDB文件

LMDB文件的python读取

Python合并lmdb文件

caffe学习之convert_imageset：图片格式转lmdb/leveld格式

caffe专题三为图像加标签，转换为可执行文件.lmdb格式

caffe总结（十二）使用lmdb格式文件用于回归（regression）

Caffe 图片数据转化为 lmdb 格式以及均值文件的计算

caffe总结（十二）使用lmdb格式文件用于图像回归（regression）

caffe python读取lmdb文件

python读写LMDB文件的方法

读取LMDB文件的样本数量

【caffe】读取lmdb文件中的内容

【caffe】caffe中通过图像生成lmdb格式的数据

（转）Cifar10 bin转lmdb格式

调用caffe脚本将图片转换为了lmdb格式

CAFFE之将图片转化为lmdb格式脚本【直接运行版】（内含生成train.txt和test.txt)

图像数据转换成db（leveldb/lmdb)文件

caffe专题二图像生成lmdb文件-sh实现

caffe数据文件lmdb训练神器digits

使用Caffe的convert_imageset生成lmdb文件

Caffe学习笔记13:使用Python合并lmdb文件

Caffe：查看并可视化 LMDB 文件

【PyTorch】PyTorch使用LMDB数据库加速文件读取

Caffe入门：读写LMDB文件的方法(python实现)

caffe将图像数据转换成lmdb文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)