HBase实战 | HBase在B站Saber平台的实践

Saber平台建设之路

标准化指标输出,通用指标模型设计

  • HBase表存储指标明细数据

  • RowKey设计准则:

    • rowkey=指标列+时间列+存储粒度

    • 指标列:提供灵活的拼装规则,主要由指标ID+维度1+维度2...而针对移动端APP埋点上报的流数据质量,则可划分为:指标ID、维度枚举值、流数据ID、客户端版本号。PS:而维度枚举值的取值范围为(长度为2):01.一致性,02.完整性,03.唯一性,04.准确性,05.规范性,06到99.自定义。

    • 时间列:该列采用默认格式,即“YYYYMMDD”

    • 存储粒度:该列采用枚举值,1:天粒度,2:小时粒度,3:分钟粒度。


  • 列族设计

    • 列族根据存储粒度来进行列族的划分,例如针对天粒度的则只有一个列,针对小时粒度则有24列,针对分钟粒度则有1440列。

      扫描二维码关注公众号,回复: 13025173 查看本文章

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片


图片图片

图片

图片

图片

图片

图片

图片

图片

图片

图片



猜你喜欢

转载自blog.51cto.com/15060465/2676945