Microsoft: 벡터 검색 및 벡터 데이터베이스

승

벡터는 미래의 데이터 표현입니다.

여기에 이미지 설명 삽입

벡터 검색

여기에 이미지 설명 삽입

방법

여기에 이미지 설명 삽입

거리 계산 횟수 줄이기

여기에 이미지 설명 삽입

  • 해싱
  • 공간 파티션 트리
  • 이웃 그래프

SPTAG

여기에 이미지 설명 삽입
혼합 kd 트리 및 이웃 그래프
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입

변화

큰 일반 벡터 검색

여기에 이미지 설명 삽입

  • 메모리
  • 확장 가능

여기에 이미지 설명 삽입

  • 역지수

  • 압축을 위한 글로벌 양자화

  • top1의 재현율은 상대적으로 낮음

  • 그래프 기반 이웃 그래프

스판

여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
역지수의 문제점:

  • 불균형 클러스터링 방법
  • 낮은 적용 범위

여기에 이미지 설명 삽입

  • 겹치는 클러스터, 서로 다른 방향으로 복제
  • 쿼리 상태 정리, 쿼리 거리에 상대적으로 가까운 쿼리에 대한 조회 테이블

여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입

여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입
여기에 이미지 설명 삽입

참고

추천

출처blog.csdn.net/uncle_ll/article/details/131999286