python读写LMDB文件的方法

原文:https://www.jb51.net/article/142985.htm

LMDB的全称是Lightning Memory-Mapped Database(快如闪电的内存映射数据库),它的文件结构简单,包含一个数据文件和一个锁文件:

LMDB文件可以同时由多个进程打开,具有极高的数据存取速度,访问简单,不需要运行单独的数据库管理进程,只要在访问数据的代码里引用LMDB库,访问时给文件路径即可。

让系统访问大量小文件的开销很大,而LMDB使用内存映射的方式访问文件,使得文件内寻址的开销非常小,使用指针运算就能实现。数据库单文件还能减少数据集复制/传输过程的开销。

在python中使用lmdb: linux中,可以使用指令‘pip install lmdb' 安装lmdb包。

1. 生成一个空的lmdb数据库文件

1 # -*- coding: utf-8 -*- 
2 import lmdb 
3   
4 # 如果train文件夹下没有data.mbd或lock.mdb文件,则会生成一个空的,如果有,不会覆盖 
5 # map_size定义最大储存容量,单位是kb,以下定义1TB容量 
6 env = lmdb.open("./train",map_size=1099511627776) 
7 env.close()

 2. LMDB数据的添加、修改、删除

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 # map_size定义最大储存容量,单位是kb,以下定义1TB容量 
 5 env = lmdb.open("./train", map_size=1099511627776) 
 6   
 7 txn = env.begin(write=True) 
 8   
 9 # 添加数据和键值 
10 txn.put(key = '1', value = 'aaa') 
11 txn.put(key = '2', value = 'bbb') 
12 txn.put(key = '3', value = 'ccc') 
13   
14 # 通过键值删除数据 
15 txn.delete(key = '1') 
16   
17 # 修改数据 
18 txn.put(key = '3', value = 'ddd') 
19   
20 # 通过commit()函数提交更改 
21 txn.commit() 
22 env.close()

3. 查询lmdb数据库内容

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 env = lmdb.open("./train") 
 5   
 6 # 参数write设置为True才可以写入 
 7 txn = env.begin(write=True) 
 8 ############################################添加、修改、删除数据 
 9   
10 # 添加数据和键值 
11 txn.put(key = '1', value = 'aaa') 
12 txn.put(key = '2', value = 'bbb') 
13 txn.put(key = '3', value = 'ccc') 
14   
15 # 通过键值删除数据 
16 txn.delete(key = '1') 
17   
18 # 修改数据 
19 txn.put(key = '3', value = 'ddd') 
20   
21 # 通过commit()函数提交更改 
22 txn.commit() 
23 ############################################查询lmdb数据 
24 txn = env.begin() 
25   
26 # get函数通过键值查询数据 
27 print txn.get(str(2)) 
28   
29 # 通过cursor()遍历所有数据和键值 
30 for key, value in txn.cursor(): 
31   print (key, value) 
32     
33 ############################################ 
34   
35 env.close()

4. 读取已有.mdb文件内容

 1 # -*- coding: utf-8 -*- 
 2 import lmdb 
 3   
 4 env_db = lmdb.Environment('trainC') 
 5 # env_db = lmdb.open("./trainC") 
 6   
 7 txn = env_db.begin() 
 8   
 9 # get函数通过键值查询数据,如果要查询的键值没有对应数据,则输出None 
10 print txn.get(str(200)) 
11   
12 for key, value in txn.cursor(): #遍历 
13   print (key, value) 
14   
15 env_db.close()

猜你喜欢

转载自www.cnblogs.com/KAKAFEIcoffee/p/11958959.html