架构图
需要回答的问题
数据怎么进入系统
实时数据,离线数据直接创建任务发送到Overlord (外部系统传输数据到Druid)
数据怎么存储
离线(非实时部分)数据:存储到深度存储,数据元信息写入元数据库,由coordinator将数据加载到historical
实时数据:存在middle的堆内/堆外内存中
数据怎么查询,为什么能实时查询
有broker节点转发查询到 historical 和 middle, 完成查询(即:支持离线和实时数据查询)
查询为什么很快(很多方面)
coordinator定时任务会均衡数据在historical的分布,查询分散到由很多historical处理,所有historical都处理好了之后再在broker做排序归并
- 查询简化图