Hive SQL查询结果写入指定hdfs路径 - 代码天地

Hive SQL查询结果写入指定hdfs路径

其他 2018-11-01 11:31:38 阅读次数: 0

版权声明：本文为博主原创文章，转载请注明原博客地址。 https://blog.csdn.net/u012210441/article/details/80599259

将hive查询结果写入指定hdfs路径下：

set mapred.reduce.tasks = 1;
insert overwrite directory '/xx/xx/'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'
select cols...
from tableName
where conditions...
distribute by rand();

设置task数 set mapred.reduce.tasks = 1; 结果数据平均分区（分区数等于task数）distribute by rand();此时结果保存在一个文件中。结果数据每行以“~”分隔 ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'。

如果结果数据不大（需要保存在一个或较少的几个文件）但计算量较大，tasks=1运行较慢，可以将结果先写入一张中间hive表，再调度tasks=1的任务将中间表中数据写入指定路径。

猜你喜欢

转载自blog.csdn.net/u012210441/article/details/80599259

Hive SQL查询结果写入指定hdfs路径

hive 新建表，写入查询结果

Hive——Hive查询

hive SQL查询结果添加行号

hive查询结果保存

hive查询导出到hdfs，hive，file

将hive模糊查询结果写入分区表中

hive 查询结果转为parquet格式存入hdfs中

Hive的查询

Hive查询

Hive 查询

hive sql查询总结

hive sql查询

Hive SQL

【hive】去重表数据、将hive查询结果保存到本地或者hdfs

Hive基础七---Hive查询

Hive（六）之 Hive查询

Hive之——Hive SQL优化

Hive读取Flume正在写入的HDFS

hive-sql查询结果保留两位小数

hcatalog读取hive数据并写入hive

Hive查看table在HDFS上的存储路径

【Hive进阶】-- Hive SQL、Spark SQL和 Hive on Spark SQL

Flink写入Hive

spark写入hive表

HDFS、hbase、Hive、Pig

hive 与 hdfs 文件的关系

hive,查询后写入表中

hive的map结果压缩

Flink SQL 连接Hive并写入/读取数据

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)