Hive 压缩比较 - 代码天地

Hive 压缩比较

数据库 2018-05-31 04:15:08 阅读次数: 0

set hive.exec.compress.intermediate=false;
set mapred.output.compress=false;

create table a as select * from dimdate;
Table default.a stats: [numFiles=1, numRows=1188, totalSize=90068, rawDataSize=88880]
Job 0: Map: 1   Cumulative CPU: 1.88 sec   HDFS Read: 6083 HDFS Write: 90138 SUCCESS

通过 hdfs dfs -cat /filepath 查看a 是否被压缩

可以看出没压缩的时候 a表有 1个文件 1188行 9k的大小裸数据大小8k

再看压缩的

set hive.exec.compress.intermediate=true;
set mapred.map.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set hive.exec.compress.output=true;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

create table a_gz as select * from dimdate;
Table default.a_gz stats: [numFiles=1, numRows=1188, totalSize=11316, rawDataSize=88880]
MapReduce Jobs Launched:
Job 0: Map: 1   Cumulative CPU: 1.31 sec   HDFS Read: 6083 HDFS Write: 11389 SUCCESS

压缩后大小变成了1k,而去 write的数据也从9k变成了1k

因为是压缩文件就不能用 dfs -cat 了

所以要用 zact +filepath

压不压还是区别蛮大的.但是对于自带压缩的文件格式,比如orc

hive.exec.compress.output 是true或者是false 都是一样的因为orc 默认是zilb压缩

猜你喜欢

转载自tobyqiu.iteye.com/blog/2069033

Hive 压缩比较

zlib和gzip的压缩比较

Hive | hive使用压缩

hive的压缩

Hive压缩

WinRar和7-zip压缩比较

19种音频格式介绍及音质压缩比的比较

Hive（十）Hive 压缩与优化

Hive格式各种格式下不同压缩算法的比较

hive文件类型与压缩

hive的map结果压缩

hive压缩（2）

Hive 压缩和存储

Hive压缩方式设置

Hive数据压缩

Hive进阶（1）—— 压缩

hive 文件压缩

Hive函数&压缩

Hive中的压缩

hive压缩类型测试

Hive --数据压缩

Hive的压缩与存储

hive数据存储与压缩

Hive压缩方法的选择

Hive压缩和存储

Hive_Hive 中的数据压缩

Hive(29):hive/hadoop的压缩格式选择

Impala与Hive的比较

Pig 和 Hive的比较

Pig、HBase、Hive 的比较

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)