向量索引

更新于 2026年6月9日草稿约 5 分钟阅读

向量索引

概述

向量索引（Vector Index）是将高维向量数据进行高效存储和相似性检索的数据结构，是 rag|RAG（检索增强生成）系统的核心基础设施。2026 年中，向量索引正从”功能可用”阶段进入”性能极致优化”阶段，量化压缩、硬件加速和新型索引结构成为竞争焦点。

工作原理

flowchart LR
    Query[查询文本] --> Embed[Embedding 模型]
    Embed --> QueryVec[查询向量]
    QueryVec --> Index[向量索引]
    Corpus[语料库文本] --> Embed2[Embedding 模型]
    Embed2 --> Index
    Index --> ANN[近似最近邻检索]
    ANN --> TopK[Top-K 结果]
    TopK --> Rerank[重排序]
    Rerank --> Output[返回上下文]

核心挑战在于：高维向量空间中的精确最近邻检索计算成本极高，向量索引通过空间划分、量化压缩或图结构来加速近似最近邻（ANN）搜索，在检索速度和召回率之间取得平衡。

关键变体

变体	年份	代表项目	核心改进
倒排文件索引	2011	IVF (Faiss)	将向量空间聚类，先定位粗粒度区域再细搜
乘积量化	2013	PQ (Faiss)	将向量拆分为子向量分别量化，大幅降低存储
层级可导航小世界图	2016	HNSW	构建多层图结构，检索复杂度接近对数级
标量量化	2020	SQ (Faiss)	用 1-2 字节表示每个维度，进一步压缩
TurboQuant	2026	turbovec	基于 TurboQuant 的新型量化路径，可能在速度和内存上有数量级优势

来源引用

日期	报告	关键发现
2026-06-09	GitHub Trending	turbovec +1,729★/日，TurboQuant 边缘 RAG 部署趋势
2026-06-08	GitHub Trending	turbovec +1,554★/日，TurboQuant 量化向量索引

向量索引

向量索引

概述

工作原理

关键变体

最新进展

相关概念

相关实体

来源引用