Hive使用（转载） - 代码天地

Hive使用（转载）

其他 2019-07-06 00:26:00 阅读次数: 0

导入将本地数据导入hive

load data local inpath ‘/root/tes.txt’ into table 数据库.表;

将hdfs集群导入到hive

load data inpath ‘hdfs://node01:9000/user/tes.txt’ into table 数据库.表;

HIve分区表（静态分区，动态分区）

静态分区：

必须在表定义时指定对应的partition字段-----分区字段一定不能与表中字段重复

1.单分区建表
在这里插入图片描述

单分区的表添加数据

在这里插入图片描述

类似多分区：

create table hour(id int, content string) partitioned by (dt int, hour int);

分区在hdfs中查看的时候是一文件夹的形式存在的。多分区的存在形式就会类似/dt/hour的文件夹

增加多分区是

alter table hour add partition(dt=10,hour=40);

删除分区的是

alter table tablename drop partition (sex=‘boy’)

动态分区:在数据多了之后会自动进行简单的分区

需要现在/conf/hive-site.xml添加配置

在这里插入图片描述

配置完成之后

在这里插入图片描述

动态分区之后添加数据的也可以使用

from a //已经存在的表格并且要有数据
insert overwrite table b partiton (age,sex) overwrite 是在表里覆盖数据 into是追加数据
select * distribute by age,sex

Hive分桶表

在上面的分桶表也已经将分桶开启了，在这就可以直接使用了

创建分桶表
在这里插入图片描述

添加数据

insert into table b select id,name from a

按照分桶来找出桶里面的数据

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

作者：十五亿少女的心
来源：CSDN
原文：https://blog.csdn.net/sksea99/article/details/93121479
版权声明：本文为博主原创文章，转载请附上博文链接！

猜你喜欢

转载自blog.csdn.net/sincere_love/article/details/93135636

Hive使用（转载）

（hive）hive优化（转载）

[转载]Hive日期函数

Hive：窗口函数(转载)

SparkSQL & Spark on Hive & Hive on Spark[转载]

Hive | hive使用压缩

Hive Hbase区别转载整理

HIVE和HBASE区别（转载）

【转载】Impala和Hive的区别

Hive中的数据倾斜（转载）

【转载】Hive笔记整理（二）

【转载】Hive笔记整理（三）

【转载】Hive笔记整理（一）

【转载】hive与hbase的联系与区别

Hive和HBase的区别（转载）

spark集成外部hive（转载）

hive常用的日期函数(转载)

hive的使用

Hive使用

Hive(11):Hive常用函数大全一览（转载）

【转载】Hive安装手册

转载 Hive几种数据导出方式

如何获取hive建表语句（转载）

转载：hive 的四种排序

hive中解析json数组[转载chenzechao]

Spark SQL连接Hive(源码分析)--转载

hive深入使用

hive中使用rcfile

hive查询使用详解

Hive JOIN使用详解

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)