计数器
- count"表名":hbase就会将这个表对应的所有数据扫描一遍,得到最终的记录条数(性能消耗大慎用 )
- 执行HBase提供的基于MR的RowCount的程序,(用于做大数据的查询)
- 启动yarn集群
- 启动mr-historyserver
- scan扫描
- 全表扫描:scan"表名"(慎用,效率很低)
- 先定只显示多少条:scan"表名", {limit => 5}
- 指定查询几个列: scan “表名” , {limit => 5 , columns => [ ]}
- 根据ROWKEY来查询:scan “表名” ,{limit => 5 , columns => [ ], 'ROWKEY '}
scan操作
需求一:查询订单所有数据
scan “ORDER_INFO”, {FORMATTER => ‘toString’}
需求二: 查询订单数据(只显示3条)
scan “ORDER_INFO”, {FORMATTER => ‘toString’, LIMIT => 3}
需求三:只查询订单状态以及支付方式,并且只展示3条数据
scan “ORDER_INFO”, {FORMATTER => ‘toString’, LIMIT => 3, COLUMNS => [‘C1:STATUS’, ‘C1:PAYWAY’]}
需求四:使用scan来根据rowkey查询数据,也是查询指定列的数据
scan ‘表名’, {ROWPREFIXFILTER => ‘rowkey’}
scan “ORDER_INFO”, {ROWPREFIXFILTER => ‘02602f66-adc7-40d4-8485-76b5632b5b53’,FORMATTER => ‘toString’, LIMIT => 3, COLUMNS => [‘C1:STATUS’, ‘C1:PAYWAY’]}