Hive 的所有跟数据相关的概念

db: myhive,   table: student     元数据:hivedb


1、Hive的元数据
指的是 myhive 和 student等等的库和表的相关的各种定义信息
该元数据都是存储在mysql中的

myhive是hive中的一个数据库的概念,其实就是HDFS上的一个文件夹,跟mysql没有多大的关系
myhive是hive中的一个数据库,那么就会在元数据库hivedb当中的DBS表中存储一个记录
这一条记录就是myhive这个hive中数据的相关描述信息

其实,hive中创建一个库,就相当于是在hivedb中DBS中插入一条记录, 并且在HDFS上建立相应的目录

其实,hive中创建一个表,就相当于在hivedb中TBLS表中插入一条记录,并且在HDFS上项目的库目录下创建一个子目录


一个hive数据数据仓库就依赖于一个RDBMS中的一个数据库,一个数据库实例对应于一个Hive数据仓库


存储于该hive数据仓库中的所有数据的描述信息,都统统存储在元数据库hivedb中

myhive 和  hivedb的区别:

myhive是hive中的数据库: 用来存储真实数据
hivedb是mysql中的数据库: 用来多个类似myhive库的真实数据的描述数据


2、Hive的原数据
3、Hive的源数据

存储在hive数据仓库中的真实数据  student.txt

元数据 : 一定指跟 hivedb相关,跟mysql相关
数据: HDFS上的对应表的目录下的文件


HDFS上的数据和元数据

数据:block块
元数据:描述和管理这些block信息的数据, 由namenode管理

猜你喜欢

转载自blog.csdn.net/weixin_42330675/article/details/82772171