Hbase知识点总结(一)

Hbase在常见的大数据系统架构中也是必不可少的一环,作为分布式数据库,hbase中的数据不会被一台单机服务器管理,而是会被划分成若干个region范围,每个region会交给一台regionserver服务器管理,因此它可以提供数据的实时的随机读写。下面我们从最基础开始,进行Hbase的总结归纳。

1、Hbase的概念及特征

首先Hbase是一个列存储的NoSQL数据库,可以提供数据的实时随机读写,这里顺便提一句,NoSQL的含义是Not Only SQL。

Hbase与其它关系型数据库比较:

HBASE与mysql、oralce、db2、sqlserver等关系型数据库不同,它是一个NoSQL数据库(非关系型数据库)
(1)Hbase的表模型与关系型数据库的表模型不同:
(2)Hbase的表没有固定的字段定义;
(3)Hbase的表中每行存储的都是一些key-value对
(4)Hbase的表中有列族的划分,用户可以指定将哪些kv插入哪个列族
(5)Hbase的表在物理存储上,是按照列族来分割的,不同列族的数据一定存储在不同的文件中
(6)Hbase的表中的每一行都固定有一个行键,而且每一行的行键在表中不能重复
(7)Hbase中的数据,包含行键,包含key,包含value,都是byte[ ]类型,hbase不负责为用户维护数据类型
(8)HBASE对事务的支持很差

Hbase与其它NoSQL数据库比较:

HBASE相比于其他nosql数据库(mongodb、redis、cassendra、hazelcast)的特点:
Hbase的表数据存储在HDFS文件系统中

从而,hbase具备如下特性:存储容量可以线性扩展; 数据存储的安全性可靠性极高!


2、Hbase的应用场景

Hbase非常适合需对数据进行随机读操作或者随机写操作、大数据上高并发操作,比如每秒对PB级数据进行上千次操作以及读写访问均是非常简单的操作。

比如淘宝指数是Hbase在淘宝的一个典型应用。交易历史纪录查询很适合用Hbase作为底层数据库:

3、Hbase启动及常用命令

简单的安装部署方式,很容易在网络上查找到,因此不做总结,本节我们重点总结一下启动等常用命令。

3.1、启动集群

bin/start-hbase.sh
启动完后,还可以在集群中找任意一台机器启动一个备用的master:
bin/hbase-daemon.sh start master

新启动的这个master会处于backup状态

3.2、启动命令行客户端基本操作

bin/hbase shell
Hbase> list     // 查看表
Hbase> status   // 查看集群状态
Hbase> version  // 查看集群版本



猜你喜欢

转载自blog.csdn.net/qq_26803795/article/details/80796204