Python读写LMDB文件

LMDB的全称是Lightning Memory-Mapped Database(快如闪电的内存映射数据库),它的文件结构简单,包含一个数据文件和一个锁文件:



LMDB文件可以同时由多个进程打开,具有极高的数据存取速度,访问简单,不需要运行单独的数据库管理进程,只要在访问数据的代码里引用LMDB库,访问时给文件路径即可。

让系统访问大量小文件的开销很大,而LMDB使用内存映射的方式访问文件,使得文件内寻址的开销非常小,使用指针运算就能实现。数据库单文件还能减少数据集复制/传输过程的开销。

在python中使用lmdb: linux中,可以使用指令‘pip install lmdb’ 安装lmdb包。


1. 生成一个空的lmdb数据库文件

[python] view plain copy
  1. # -*- coding: utf-8 -*-  
  2. import lmdb  
  3.   
  4. # 如果train文件夹下没有data.mbd或lock.mdb文件,则会生成一个空的,如果有,不会覆盖  
  5. # map_size定义最大储存容量,单位是kb,以下定义1TB容量  
  6. env = lmdb.open("./train",map_size=1099511627776)  
  7. env.close()  

2. LMDB数据的添加、修改、删除

[python] view plain copy
  1. # -*- coding: utf-8 -*-  
  2. import lmdb  
  3.   
  4. # map_size定义最大储存容量,单位是kb,以下定义1TB容量  
  5. env = lmdb.open("./train", map_size=1099511627776)  
  6.   
  7. txn = env.begin(write=True)  
  8.   
  9. # 添加数据和键值  
  10. txn.put(key = '1', value = 'aaa')  
  11. txn.put(key = '2', value = 'bbb')  
  12. txn.put(key = '3', value = 'ccc')  
  13.   
  14. # 通过键值删除数据  
  15. txn.delete(key = '1')  
  16.   
  17. # 修改数据  
  18. txn.put(key = '3', value = 'ddd')  
  19.   
  20. # 通过commit()函数提交更改  
  21. txn.commit()  
  22. env.close()  

3. 查询lmdb数据库内容

[python] view plain copy
  1. # -*- coding: utf-8 -*-  
  2. import lmdb  
  3.   
  4. env = lmdb.open("./train")  
  5.   
  6. # 参数write设置为True才可以写入  
  7. txn = env.begin(write=True)  
  8. ############################################添加、修改、删除数据  
  9.   
  10. # 添加数据和键值  
  11. txn.put(key = '1', value = 'aaa')  
  12. txn.put(key = '2', value = 'bbb')  
  13. txn.put(key = '3', value = 'ccc')  
  14.   
  15. # 通过键值删除数据  
  16. txn.delete(key = '1')  
  17.   
  18. # 修改数据  
  19. txn.put(key = '3', value = 'ddd')  
  20.   
  21. # 通过commit()函数提交更改  
  22. txn.commit()  
  23. ############################################查询lmdb数据  
  24. txn = env.begin()  
  25.   
  26. # get函数通过键值查询数据  
  27. print txn.get(str(2))  
  28.   
  29. # 通过cursor()遍历所有数据和键值  
  30. for key, value in txn.cursor():  
  31.     print (key, value)  
  32.       
  33. ############################################  
  34.   
  35.   
  36. env.close()  

4. 读取已有.mdb文件内容

[python] view plain copy
  1. # -*- coding: utf-8 -*-  
  2. import lmdb  
  3.   
  4. env_db = lmdb.Environment('trainC')  
  5. # env_db = lmdb.open("./trainC")  
  6.   
  7. txn = env_db.begin()  
  8.   
  9. # get函数通过键值查询数据,如果要查询的键值没有对应数据,则输出None  
  10. print txn.get(str(200))  
  11.   
  12. for key, value in txn.cursor():  #遍历  
  13.     print (key, value)  
  14.   
  15. env_db.close() 

猜你喜欢

转载自blog.csdn.net/touch_dream/article/details/80527341