레디 스 HyperLogLog 사용

첫째, 개념
1은 2.8.9 릴리스의 레디 스는 HyperLogLog 구조를 추가합니다.
입력 음량이나 소자의 수가 매우 많은 경우, 계산에 필요한 공간은 고정 된 염기는 항상, 및 매우 작은 : HyperLogLog 기수 통계적 알고리즘에 사용되는 레디 스 2, HyperLogLog 이점이 있다는 것이다.
레디 스되는 3, 각각의 키는 단지 HyperLogLog 12킬로바이트의 메모리를 필요 약 2 ^ 64 개의 상이한 기본 요소를 산출 할 수있다. 이 때, 계산베이스의 세트보다 콘트라스트의 메모리 소자의보다 비용.
단 HyperLogLog베이스 입력 요소 자체를 기억하지 않고, 입력 요소에 따라 계산하기 때문에도 4 그러나, 이는 HyperLogLog만큼 각 리턴 입력 요소 세트와 같지 않다.

중요도 란
이러한 데이터 세트 {1,3,5,7,5,7,8}, 데이터 세트 {1,3,5,7,8}의 카디널리티베이스 (요소를 반복하지 않음) 5 . 카디널리티 예측 오차 허용 범위, 빠른 계산베이스 내에있다.

두, HyperLogLog 관련 명령

  • 명령 이름 : pfadd
  • 구문 : pfadd 핵심 요소 [요소 ...]
  • 특징 :
    • 내부의 지정된 HyperLogLog에 요소의 수를 추가합니다.
    • 이 명령의 부작용으로, 내부 HyperLogLog 다른 고유의 요소 추정값 (즉, 세트의 카디널리티)를 반영하기 위해 업데이트 될 수있다.
  • 반환 값 :
    • 정수 응답 : 내부 저장 HyperLogLog가 변경 될 가능성이있는 경우,는, 1 반환, 그렇지 않으면 0을 반환합니다.

 

  • 명령 이름 : pfcount
  • 구문 : pfcount 키 [키 ...]
  • 특징 :
    • 같은 pfcount 명령 키를 작동하면 키가 존재하지 않는 경우, 약 저수지에 기본 HyperLogLog 지정된 키를 돌려, 0이 반환됩니다.
    • 다수의 키에 pfcount 명령 작용 대략 HyperLogLog베이스의 모든 주어진 세트를 리턴 할 때,베이스는 대략 계산 될 임시 HyperLogLog HyperLogLog 결합 모두 주어진다.
  • 반환 값 :
    • 정수 응답 : HyperLogLog 주어진 포함 고유 요소 대략적.

 

  • 명령 이름 : pfmerge
  • 语法 : pfmerge의 destkey의 sourcekey [sourcekey ......]
  • 특징 :
    • 합쳐진 복수 HyperLogLog는 (병합) 결합 된 모든 표시 HyperLogLog 세트 입력 (관찰 세트) 및 세트의 기지국에 HyperLogLog, HyperLogLog에 가깝다.
  • 반환 값 :
    • OK 반환

추천

출처www.cnblogs.com/lxhyty/p/11511449.html