Hive性能优化的任务配置 - 代码天地

Hive性能优化的任务配置

其他 2020-03-07 11:39:13 阅读次数: 0

Hive有些参数是可以配置的，针对不同的任务，可以做不同的任务配置，加上这几个配置，对任务执行有很大的影响，能快速提升执行速度。

1、reduce的个数控制

如果处理大量的数据，比如几百GB，但是只有默认的50个reducer，那么时间会发现全部耗费在reduce阶段的copy数据阶段；

这时候如果能人工干预，增大reducer个数，就会实现多节点数据复制，不会让copy阶段的网卡速度成为瓶颈；

reduce的个数控制主要有两个set属性：

set hive.exec.reducers.bytes.per.reducer=1000000000;
set mapreduce.job.reduces=3000;

第一个参数设置每个reduce节点处理1GB数据，但是我发现有时候没有生效；所以第二个参数也可以设置下，这里设置使用3000个节点处理reduce，我这边是生效了。

2、map和reduce的并发数控制

或者称为：同时执行map和reduce的数目控制

SET mapred.job.map.capacity = 1000;
SET mapred.job.reduce.capacity = 1000;

这两个参数，设置并发度为1000；如果不设置，默认的是50或者100，那么你自己设置了第一步的reduce个数控制，把reduce个数提到3000，可是每次最多执行50个，也会发现是瓶颈。

通过几组参数，会发现个数、并发度都很高，真正实现的是大数据量高并行度的处理，当然这也要求集群有足够的资源，不然卡在资源瓶颈上还是无法告诉并行执行。

蚂蚁学Python

发布了242 篇原创文章 · 获赞 13 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/peishuai1987/article/details/89947213

Hive性能优化的任务配置

优化hive的性能配置

hive参数配置及任务优化

Hive 任务优化 tips

Hive性能优化（全面）

HIVE 性能优化

Hive性能优化

Hive性能优化大全

Hive函数及性能优化

flink任务性能优化

Hive性能优化总结(四)

Hive应用性能优化

Hive（八）之性能优化

Hive性能优化之表数据优化

Hive性能优化之表设计优化

Nginx配置性能优化

TOMCAT 配置及性能优化

Apache 性能配置优化

Mysql配置性能优化

nginx 配置性能优化

hive大小表join优化性能

hive大小表join性能优化

Linux下Hive性能优化(个人用)

全面总结Hive性能优化（二）

全面总结Hive性能优化（一）

7.Hive性能优化及Hive3新特性

spark sql任务性能优化(基础)

Hive性能优化简介（顺便介绍了性能工具--ANALYZE）

CDH常用优化配置_Hive配置

Hive 任务限制同时运行的任务数量的配置

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)