大数据-数据仓库

Impala


Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。

已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。

相比之下,Impala的最大特点也是最大卖点就是它的快速。

Hive

ods层,

dwd层:明细数据层。

dws层:汇总数据层。

app层:应用层。

同步工具:。

bi层:业务层。

猜你喜欢

转载自www.cnblogs.com/wangwangfei/p/12603540.html