HBase对比HDFS

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u013817676/article/details/82020668

什么是HDFS(Hadoop分布式文件系统):HDFS允许以分布式和冗余方式存储大量数据。

HDFS组件
• NameNode
• DataNode
NameNode:NameNode可以被视为系统的管理者。它维护系统文件树以及系统中存在的所有文件和目录的元数据。其中“命名空间镜像(Namespace image)”和“编辑日志”用于存储元数据信息。 Namenode包含所有数据节点的数据块信息,但是,它不会持久存储数据节点数据块位置信息。系统启动时,每次从数据节点重建此信息。
DataNode:是集群中的从属者,提供实际存储。它主要负责为客户提供读写请求服务。

HDFS架构:
这里写图片描述
什么是Hbase: Hbase是一个可以运行在Hadoop集群上的NoSQL数据库。
Hbase组件
• Hbase Master
• Region Server
• Region
• Zookeeper
Hbase的架构图如下图所示:
这里写图片描述

Hbase与HDFS对比
这里写图片描述
总结一下:什么时候选用Hbase,什么场景使用HDFS进行存储?
1. 对于经常需要修改原有的数据的场景使用Hbase进行存储;
2. 对于性能要求不高且只需要支持单条数据查询或者小批量数据进行查询,两者均可;
3. 对于需要经常进行全表扫描进行大批量的查询的选择HDFS;

听说Hbase在进行大量全表扫描查询的时候会出现GC问题,不知道在cache回收的时候如何解决大量的GC问题,求解答。

猜你喜欢

转载自blog.csdn.net/u013817676/article/details/82020668