HBase计数器和简单scan操作

计数器

  • count"表名":hbase就会将这个表对应的所有数据扫描一遍,得到最终的记录条数(性能消耗大慎用 )
  • 执行HBase提供的基于MR的RowCount的程序,(用于做大数据的查询)
    • 启动yarn集群
    • 启动mr-historyserver
  • scan扫描
    • 全表扫描:scan"表名"(慎用,效率很低)
    • 先定只显示多少条:scan"表名", {limit => 5}
    • 指定查询几个列: scan “表名” , {limit => 5 , columns => [ ]}
    • 根据ROWKEY来查询:scan “表名” ,{limit => 5 , columns => [ ], 'ROWKEY '}

scan操作

需求一:查询订单所有数据

scan “ORDER_INFO”, {FORMATTER => ‘toString’}

需求二: 查询订单数据(只显示3条)

scan “ORDER_INFO”, {FORMATTER => ‘toString’, LIMIT => 3}

需求三:只查询订单状态以及支付方式,并且只展示3条数据

scan “ORDER_INFO”, {FORMATTER => ‘toString’, LIMIT => 3, COLUMNS => [‘C1:STATUS’, ‘C1:PAYWAY’]}

需求四:使用scan来根据rowkey查询数据,也是查询指定列的数据

scan ‘表名’, {ROWPREFIXFILTER => ‘rowkey’}

scan “ORDER_INFO”, {ROWPREFIXFILTER => ‘02602f66-adc7-40d4-8485-76b5632b5b53’,FORMATTER => ‘toString’, LIMIT => 3, COLUMNS => [‘C1:STATUS’, ‘C1:PAYWAY’]}

猜你喜欢

转载自blog.csdn.net/chenlujun98/article/details/121445174