RAG新SOTA诞生！5亿数据秒级检索，SAG如何颠覆大模型底座

type

status

date

slug

summary

传统RAG与GraphRAG的痛点：为什么我们需要新范式

在实际应用中，用户提出的问题往往不是单一知识点能回答的。例如，要弄清楚“某条产品路线受到了谁的影响”，可能需要串联起“A公司收购B公司”、“B公司 CTO 加入 C项目”以及“C项目影响该路线”等多条线索。

传统的向量检索 RAG（Vector-based RAG）只会机械地寻找语义最相似的文本片段，无法理清这些片段背后的逻辑关系。这导致大模型在面对需要多跳推理的复杂任务时，很容易给出似是而非的错误答案。

为了修正这一局限，以微软 GraphRAG 为代表的知识图谱方案应运而生。GraphRAG 通过提取实体和关系构建全局知识图谱，在全局理解和主题总结上表现出色。然而，在工业落地中，GraphRAG 面临着极高的计算与维护成本。抽三元组、合并实体、构建全局图以及生成社区摘要，每一步都消耗大量的算力和 Token。更致命的是，面对实时更新的动态数据，频繁重建全局图谱几乎是不可能完成的任务。另一条路线 HippoRAG 2 虽然引入了类海马体的关联检索，但在全局图上运行 PageRank 等排序算法的工程开销依然让实际落地举步维艰。

揭秘SAG：用超边结构与SQL重构大模型数据底座

针对上述挑战，SAG 方案另辟蹊径。它的核心思路非常巧妙：在离线阶段不急于构建复杂的全局知识图谱，而是将原始文本整理成“事项（Event）+ 实体（Entity）”的轻量化数据库结构。

传统图谱倾向于将信息拆解为“主体-关系-客体”的三元组，这种强行拆分容易丢失上下文的完整性。而 SAG 采用的是类似于“超边（Many-to-Many Hyperedge）”的结构： * 一个事项（Event）代表一个完整的事件或文本块（Chunk），它可以连接多个实体（Entity）。 * 一个实体也可以同时出现在多个不同的事项中。

这些结构化数据被写入 SQL 数据库和向量索引中。当查询请求到达时，系统不再需要去全局图谱上运行复杂的图排序算法，而是直接通过 SQL 的 Join 操作，围绕当前问题动态串联起一张局部的线索网。这种设计极大地降低了计算复杂度，让系统能够随着数据的增加而轻松实现线性扩展。

语义与结构双通道：SAG的在线检索机制

在检索阶段，SAG 采用了“结构路径”与“语义路径”并行的双通道机制：

结构路径：系统首先利用大模型从用户的查询中提取核心实体。接着，通过 SQL 查询找出与这些实体相关的事项卡（Event）。如果当前事项卡无法完全回答问题，系统会继续提取该事项中的其他实体，通过 SQL 反查关联的事项，从而实现“顺藤摸瓜”的多跳推理。

语义路径：与此同时，SAG 并没有抛弃传统的向量检索。它会利用 Query 的向量表示，直接在 Chunk 索引中寻找语义相似的文本。

最终，系统将这两条路径召回的候选证据进行合并，利用轻量级重排（Reranker）或大模型进行二次筛选，过滤掉不相关的噪声，最后将最精准的证据链提供给大模型生成答案。这种机制不仅保证了回答的准确性，还赋予了 RAG 极强的“可追溯性”——用户可以清晰地看到每一条结论背后的原始证据卡片和推导路径。

刷新多跳问答SOTA：5亿数据秒级响应的硬核表现

在学术界和工业界的双重检验下，SAG 展现出了惊人的性能。在 HotpotQA、2WikiMultiHopQA 以及最难的 MuSiQue 等经典多跳问答数据集的评测中，SAG 的表现全面超越了前代强力方案 HippoRAG 2。

实验数据显示，在 MuSiQue 测试集上，SAG 的 Recall@5 达到了 80.0%，而 HippoRAG 2 仅为 65.1%，SAG 直接领先了近 15 个百分点。消融实验也证实，SAG 的性能提升主要得益于其独特的“事项+实体”超边结构以及动态 SQL 扩展机制，而非单纯依赖更强的 Embedding 模型。

更令人振奋的是其工业落地能力。SAG 已经在约 5 亿条数据规模的真实生产环境中成功部署，且在线检索延迟始终保持在秒级以内。由于每个文本块（Chunk）在离线处理时都是独立的并发单元，新数据流入时无需重算全局关系，只需增量写入 SQL 和向量索引即可。这使得 SAG 成为目前极少数既能刷新 SOTA，又能真正支撑大规模工业级应用的 RAG 方案。

迈向Agent长期记忆的未来

SAG 的成功不仅在于它解决了一次检索的准确性与效率问题，更在于它为大模型 Agent 的长期记忆（Agent Memory）提供了一种全新的数据组织范式。在未来的 AGI 时代，Agent 不仅需要检索外部知识，更需要记录用户的偏好变化、任务的执行状态以及历史上下文的演进。SAG 这种“动态构建局部线索网”的模式，完美契合了这一需求。

从传统向量检索到 GraphRAG，再到如今跑进秒级的 SAG，大模型数据基础设施正在经历快速的迭代。如果您希望获取更多关于大模型、ChatGPT、Claude 以及前沿 AI 变现的深度技术解析，请锁定 AIGC.bar。这是一个为您提供一站式 AI 资讯与智能工具的专业 AI 门户，助您在人工智能浪潮中时刻保持领先。