RAG新SOTA诞生!5亿数据秒级检索,SAG如何颠覆大模型底座

type
status
date
slug
summary
tags
category
icon
password
网址
前阵子,Anthropic 的 Claude Code 意外泄露了数十万行源码,引发了整个人工智能圈的瞩目。业内人士在拆解代码后发现,AI Agent 的智能不仅取决于底座大模型(LLM)的智商,更取决于其外围的上下文组织、工具调用和任务循环系统,即所谓的 Agent Harness。而在这一系统中,连接大模型与外部世界的数据桥梁——RAG(检索增强生成)技术,正迎来一场深刻的变革。
传统的 RAG 技术在处理复杂的多跳推理时常常捉襟见肘,甚至在某些专业领域(如医疗临床文本生成)中会导致大模型幻觉率飙升。为了解决这一痛点,广州智跃深空(Zleap AI)推出了全新的 SAG(SQL-Retrieval Augmented Generation)技术,不仅在多个权威多跳问答数据集中刷新 SOTA,更在 5 亿条数据的生产环境中实现了秒级检索。如果你想持续跟踪最新的人工智能前沿动态与大模型技术突破,欢迎访问专业的 AI 资讯与 AI 新闻门户 AIGC.bar

传统RAG与GraphRAG的痛点:为什么我们需要新范式

在实际应用中,用户提出的问题往往不是单一知识点能回答的。例如,要弄清楚“某条产品路线受到了谁的影响”,可能需要串联起“A公司收购B公司”、“B公司 CTO 加入 C项目”以及“C项目影响该路线”等多条线索。
传统的向量检索 RAG(Vector-based RAG)只会机械地寻找语义最相似的文本片段,无法理清这些片段背后的逻辑关系。这导致大模型在面对需要多跳推理的复杂任务时,很容易给出似是而非的错误答案。
为了修正这一局限,以微软 GraphRAG 为代表的知识图谱方案应运而生。GraphRAG 通过提取实体和关系构建全局知识图谱,在全局理解和主题总结上表现出色。然而,在工业落地中,GraphRAG 面临着极高的计算与维护成本。抽三元组、合并实体、构建全局图以及生成社区摘要,每一步都消耗大量的算力和 Token。更致命的是,面对实时更新的动态数据,频繁重建全局图谱几乎是不可能完成的任务。另一条路线 HippoRAG 2 虽然引入了类海马体的关联检索,但在全局图上运行 PageRank 等排序算法的工程开销依然让实际落地举步维艰。

揭秘SAG:用超边结构与SQL重构大模型数据底座

针对上述挑战,SAG 方案另辟蹊径。它的核心思路非常巧妙:在离线阶段不急于构建复杂的全局知识图谱,而是将原始文本整理成“事项(Event)+ 实体(Entity)”的轻量化数据库结构。
传统图谱倾向于将信息拆解为“主体-关系-客体”的三元组,这种强行拆分容易丢失上下文的完整性。而 SAG 采用的是类似于“超边(Many-to-Many Hyperedge)”的结构: * 一个事项(Event)代表一个完整的事件或文本块(Chunk),它可以连接多个实体(Entity)。 * 一个实体也可以同时出现在多个不同的事项中。
这些结构化数据被写入 SQL 数据库和向量索引中。当查询请求到达时,系统不再需要去全局图谱上运行复杂的图排序算法,而是直接通过 SQL 的 Join 操作,围绕当前问题动态串联起一张局部的线索网。这种设计极大地降低了计算复杂度,让系统能够随着数据的增加而轻松实现线性扩展。

语义与结构双通道:SAG的在线检索机制

在检索阶段,SAG 采用了“结构路径”与“语义路径”并行的双通道机制:
  1. 结构路径:系统首先利用大模型从用户的查询中提取核心实体。接着,通过 SQL 查询找出与这些实体相关的事项卡(Event)。如果当前事项卡无法完全回答问题,系统会继续提取该事项中的其他实体,通过 SQL 反查关联的事项,从而实现“顺藤摸瓜”的多跳推理。
  1. 语义路径:与此同时,SAG 并没有抛弃传统的向量检索。它会利用 Query 的向量表示,直接在 Chunk 索引中寻找语义相似的文本。
最终,系统将这两条路径召回的候选证据进行合并,利用轻量级重排(Reranker)或大模型进行二次筛选,过滤掉不相关的噪声,最后将最精准的证据链提供给大模型生成答案。这种机制不仅保证了回答的准确性,还赋予了 RAG 极强的“可追溯性”——用户可以清晰地看到每一条结论背后的原始证据卡片和推导路径。

刷新多跳问答SOTA:5亿数据秒级响应的硬核表现

在学术界和工业界的双重检验下,SAG 展现出了惊人的性能。在 HotpotQA、2WikiMultiHopQA 以及最难的 MuSiQue 等经典多跳问答数据集的评测中,SAG 的表现全面超越了前代强力方案 HippoRAG 2。
实验数据显示,在 MuSiQue 测试集上,SAG 的 Recall@5 达到了 80.0%,而 HippoRAG 2 仅为 65.1%,SAG 直接领先了近 15 个百分点。消融实验也证实,SAG 的性能提升主要得益于其独特的“事项+实体”超边结构以及动态 SQL 扩展机制,而非单纯依赖更强的 Embedding 模型。
更令人振奋的是其工业落地能力。SAG 已经在约 5 亿条数据规模的真实生产环境中成功部署,且在线检索延迟始终保持在秒级以内。由于每个文本块(Chunk)在离线处理时都是独立的并发单元,新数据流入时无需重算全局关系,只需增量写入 SQL 和向量索引即可。这使得 SAG 成为目前极少数既能刷新 SOTA,又能真正支撑大规模工业级应用的 RAG 方案。

迈向Agent长期记忆的未来

SAG 的成功不仅在于它解决了一次检索的准确性与效率问题,更在于它为大模型 Agent 的长期记忆(Agent Memory)提供了一种全新的数据组织范式。在未来的 AGI 时代,Agent 不仅需要检索外部知识,更需要记录用户的偏好变化、任务的执行状态以及历史上下文的演进。SAG 这种“动态构建局部线索网”的模式,完美契合了这一需求。
从传统向量检索到 GraphRAG,再到如今跑进秒级的 SAG,大模型数据基础设施正在经历快速的迭代。如果您希望获取更多关于大模型、ChatGPT、Claude 以及前沿 AI 变现的深度技术解析,请锁定 AIGC.bar。这是一个为您提供一站式 AI 资讯与智能工具的专业 AI 门户,助您在人工智能浪潮中时刻保持领先。
Loading...

没有找到文章