微软:向量搜索和向量数据库

w'er

向量是未来的数据表示

在这里插入图片描述

向量搜索

在这里插入图片描述

方法

在这里插入图片描述

减少距离计算次数

在这里插入图片描述

  • 哈希法
  • 空间划分树
  • 近邻图

SPTAG

在这里插入图片描述
混合了kd树和近邻图
在这里插入图片描述
在这里插入图片描述

Change

大规律向量搜索

在这里插入图片描述

  • 内存
  • 可扩展

在这里插入图片描述

  • 倒排索引

  • 全局量化进行压缩

  • top1的召回率比较低

  • 基于图的近邻图

SPANN

在这里插入图片描述
在这里插入图片描述
倒排索引中的问题:

  • 不平衡的聚类方法
  • 低覆盖率

在这里插入图片描述

  • 有重叠的聚类,不同方向的复制
  • 查询状态剪枝,离查询距离比较近的查询倒查表

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考

猜你喜欢

转载自blog.csdn.net/uncle_ll/article/details/131999286
今日推荐