第八章：数据压缩与归档-zlib:GNU zlib压缩-处理内存中的数据 - 代码天地

第八章：数据压缩与归档-zlib:GNU zlib压缩-处理内存中的数据

其他 2019-04-13 10:51:19 阅读次数: 0

第八章数据压缩与归档
8.1 zlib:GNU zlib压缩
zlib模块为GNU项目zlib压缩库中的很多函数提供了底层接口。

8.1.1 处理内存中的数据
使用zlib最简单的方法要求把所有将要压缩或解压缩的数据存放在内存中：

import zlib
import binascii

original_data = b'This is the original text.'
print('Original     :',len(original_data),original_data)

compressed = zlib.compress(original_data)
print('Compressed   :',len(compressed),
      binascii.hexlify(compressed))

decompressed = zlib.decompress(compressed)
print('Decompressed :',len(decompressed),decompressed)

compress()和decompress()函数都取一个字节序列参数，并且返回一个字节序列。
运行结果：
在这里插入图片描述
从前面的例子可以看到，少量数据的压缩版本可能比未压缩的版本还要大。具体的结果取决于输入数据，不过观察小数据集的压缩开销很有意思。

import zlib

original_data = b'This is the original text.'

template = '{:>15}  {:>15}'
print(template.format('len(data)','len(compressed)'))
print(template.format('-' * 15,'-' * 15))

for i in range(5):
    data = original_data * i
    compressed = zlib.compress(data)
    highlight = '*' if len(data) < len(compressed) else ''
    print(template.format(len(data),len(compressed)),highlight)

输出中的*突出显示了哪些行的压缩数据比未压缩版本占用的内存更多。
运行结果：
在这里插入图片描述
zlib支持不同的压缩级别，允许在计算成本和空间缩减量之间有所平衡。默认压缩级zlib.Z_DEFAULT_COMPRESSION为-1，这对应着一个硬编码值，表示性能和压缩结果之间的一个折中。当前这对应级别6。

import zlib

input_data = b'Some repeated text.\n' * 1024
template = '{:>5}  {:>5}'

print(template.format('Level','Size'))
print(template.format('-----','----'))


for i in range(0,10):
    data = zlib.compress(input_data,i)
    print(template.format(i,len(data)))

压缩级别为0意味着根本没有压缩。级别9要求的计算最多，同时会生成最小的输出。如下面的例子所示，对于一个给定的输入，可能多个压缩级别得到的空间缩减量是一样的。
运行结果：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43193719/article/details/89099463

第八章：数据压缩与归档-zlib:GNU zlib压缩-处理内存中的数据

第八章：数据压缩与归档-zlib:GNU zlib压缩-校验和

第八章：数据压缩与归档-zlib:GNU zlib压缩-混合内容流

第八章：数据压缩与归档-zlib:GNU zlib压缩-增量压缩与解压缩

第八章：数据压缩与归档-gzip:读写GNU zip文件-处理流

第八章：数据压缩与归档-tarfile:tar归档访问-处理压缩归档

第八章：数据压缩与归档-gzip:读写GNU zip文件-读压缩数据

第八章：数据压缩与归档-gzip:读写GNU zip文件-写压缩文件

第八章：数据压缩与归档-tarfile:tar归档访问-追加到归档

第八章：数据压缩与归档-tarfile:tar归档访问-创建新归档

第八章：数据压缩与归档-tarfile:tar归档访问-从归档抽取文件

第八章：数据压缩与归档-zipfile:ZIP归档访问-创建新归档

第八章：数据压缩与归档-zipfile:ZIP归档访问-测试ZIP文件

第八章：数据压缩与归档-tarfile:tar归档访问-测试tar文件

第八章：数据压缩与归档-zipfile:ZIP归档访问-从归档抽取归档文件

第八章：数据压缩与归档-zipfile:ZIP归档访问-从归档读取元数据

第八章：数据压缩与归档-tarfile:tar归档访问-从归档读取元数据

第八章：数据压缩与归档-tarfile:tar归档访问-使用候选归档成员名

第八章：数据压缩与归档-bz2:bzip2压缩-压缩网络数据

第八章：数据压缩与归档-bz2:bzip2压缩-读压缩文件

第八章：数据压缩与归档-bz2:bzip2压缩-写压缩文件

第八章：数据压缩与归档-tarfile:tar归档访问-从非文件源写数据

第八章：数据压缩与归档-bz2:bzip2压缩-读取Unicode数据

第八章：数据压缩与归档-bz2:bzip2压缩-混合内容流

第八章：数据压缩与归档-bz2:bzip2压缩-内存中的一次性操作

第八章：数据压缩与归档-bz2:bzip2压缩-增量压缩和解压缩

第八章-数据提取

3.10 第八章：文档的压缩与打包

第八章、Python数据类型

数据库应用第八章：索引

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)