kylin的实现原理 - 代码天地

kylin的实现原理

其他 2020-06-20 22:24:51 阅读次数: 0

摘自https://blog.bcmeng.com/post/kylin-cube.html#kylin%E7%9A%84%E9%A2%84%E8%AE%A1%E7%AE%97%E6%98%AF%E5%A6%82%E4%BD%95%E5%AE%9E%E7%8E%B0%E7%9A%84

kylin 预计算实现过程：将hive数据源的数据依据制定的计算逻辑将指定好的维度计算为指标，将所有可能的计算结果（cube）存储到HBase。（确定是所有吗？）
cube和cuboid，cube就是一个数据源的所有计算结果，cuboid就是每一种维度组合，并包含计算的指标，cube的计算过程是逐层计算的，首先计算Base cuboid，然后计算维度数依次减少，逐层向下计算每层的cuboid。
cuboid转换为HBase的rowkey存储，
- 　　cuboid的维度会映射为HBase的rowkey，其中维度会被kylin进行字典编码以节省存储资源，而其指标会映射为HBase的value。
- 在计算cuboid过程中，会将Hive表的数据转化为HBase的KV形式。Rowkey的具体格式是cuboid id + 具体的维度值（最新的Rowkey中为了并发查询还加入了ShardKey，是最新的吗），cuboid为8位
- 所有的cuboid计算完成后，会将cuboid转化为HBase的KeyValue格式生成HBase的HFile，最后将HFile load进cube对应的HBase表中。
SQL查询怎样转成HBase的查询操作
- 　　
```
1 select year, sum(price)
2 from table
3 where city = "beijing"
4 group by year
```
  这个SQL涉及维度year和city，所以其对应的cuboid是00000011，又因为city的值是确定的beijing,所以在Scan HBase时就会Scan Rowkey以00000011开头且city的值是beijing的行，取到对应指标sum(price)的值，返回给用户。

猜你喜欢

转载自www.cnblogs.com/dretrtg/p/13170556.html

kylin的实现原理

Kylin的工作原理

Kylin原理详解

kylin的cube的原理

Apache Kylin Cube 构建原理

Kylin工作原理、体系架构

Kylin之Cube构建原理

Apache Kylin 原理介绍与新架构分享（Kylin On Parquet）

kylin

Apache Kylin 入门 2 - 原理与架构

kylin streaming原理介绍与特点浅析

Python调用kylin接口实现业务

上海沙龙回顾 | Apache Kylin 原理介绍与新架构分享（Kylin On Parquet）

Kylin快速入门系列(3) | Cube构建原理

Kylin(二)：Cube构建原理和优化、BI工具集成

关于kylin中cube计算的代码自实现

kylin --Kylin Cube优化

Kyin学习笔记（一）-----Kylin安装、入门案例和原理介绍

Kylin实践

Kylin安装

简介Kylin

kylin介绍

Kylin的搭建

Kylin cubo

Apache Kylin

Kylin简介

麒麟Kylin

搭建kylin

kylin笔记

Kylin使用

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)