使用hive查询数据(上手篇)
准备查询工具:命令行或可视化工具皆可,可视化工具一般都要收费。
1.命令行进入hive查询界面
hive
没有可视化工具就要自己找库和表了
2.查看所有数据库
show databases;
记得加分号,分号表示语句结束,数据库才回去执行命令,习惯了mysql的用法会经常忘记分号。
第一行OK表示查询结束,执行完成。中间的两个 default 和 report 是我这里的数据库,default数据库是hive安装后自带的,最后一行是查询耗时和查询结果行数。
3.选择数据库
use [数据库名];
我这里使用report数据库
显示ok 表示切换数据库成功
4.查看当前库中包含的数据库表
show tables;
5.查看数据库表结构
desc [表名];
红框以上是表中的字段,红框中是hive的分区,相当于数据库的索引。
6.开始查询
语句使用方式与sql类似。使用简单查询时无需其他节点配合,使用复杂查询(sum count distinct)等时需要工作节点进行计算实现(即map reduce)。