Hbase、Kudu和ClickHouse 对比

前言

        Hadoop生态圈的技术繁多。HDFS一直用来保存底层数据,地位牢固。

  • Hbase作为一款Nosql也是Hadoop生态圈的核心组件,它海量的存储能力,优秀的随机读写能力,能够处理一些HDFS不足的地方。
  • Clickhouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。能够使用SQL查询实时生成分析数据报告。它同样拥有优秀的数据存储能力。
  • Apache Kudu是Cloudera Manager公司16年发布的新型分布式存储系统,结合CDH和Impala使用可以同时解决随机读写和sql化数据分析的问题。分别弥补HDFS静态存储和Hbase Nosql的不足。

既然可选的技术路线有这么多,本文将从安装部署、架构组成、基本操作等方面横向对比一下Hbase、Kudu和Clickhouse。

最后从下面几个维度来对比一下Hbase、Kudu和Clickhouse。

Hbase Kudu Clickhouse
数据存储 Zookeeper保存元数据,数据写入HDFS(非结构化数据) master保存元数据,数据及副本存储在tserver(强类型数据) Zookeeper保存元数据,数据存储在本地,且会压缩
查询 查询比较麻烦,Phoenix集成之后比较好点 查询比较麻烦,集成Impala之后表现优秀 高效的查询能力
数据读写 支持随机读写,删除。更新操作是插入一条新timestamp的数据 支持读写,删除,更新 支持读写,但不能删除和更新
维护 需要同时维护HDFS、Zookeeper和Hbase(甚至于Phoenix) CDH版本维护简单,Apache版需要单独维护,额外还有Impala 额外维护Zookeeper

所以Hbase更适合非结构化的数

猜你喜欢

转载自blog.csdn.net/qq_22473611/article/details/119576436
今日推荐