Agent时代来临，为什么传统开源数据库不够用了？

type

status

date

slug

summary

什么是Episodic Workload？Agent时代的第三类负载

在过去二十年的数据库黄金时代，容量规划主要围绕两种经典的负载形状展开：

OLTP（联机事务处理）：请求持续、小而密。核心是扛住峰值QPS，保障SLA。

OLAP（联机分析处理）：主要是批量大查询。追求的是整体吞吐和单位成本，允许排队和降级。

然而，AI Agent带来的负载既不属于OLTP，也不属于OLAP。它被称为 Episodic Workload（插性负载）。

当用户与Agent交互时，可能会在几秒到几分钟内扇出成多次向量检索、记忆（Memory）读写、元数据过滤、工具调用及上下文拼接。随后，一切瞬间归零——下一次访问可能在十秒后，也可能在三个月后。

这种负载具有以下四个颠覆性的特征：

交互式延迟敏感：请求方在线等待，无法接受分钟级的冷启动延迟。

与历史弱相关：一个用户的记忆库可能三个月没被访问，但下一秒一旦被唤醒，系统必须立刻提供资源。历史的低频并不等于未来不需要资源。

天然多租户且冷热极端分明：云端Agent平台承载着海量用户，但任一时刻只有极少数数据是热的。传统固定资源池为冷数据常驻算力的做法，会造成极大的资金浪费。

长期分布未知：系统无法预判哪个Agent会突然变热，哪个会一直沉睡。

如果采用传统开源数据库的做法，为了随时响应任意用户的查询，必须将所有数据常驻在本地磁盘并配备足额的算力待命。这会导致企业面临高昂的账单——可能99%的资金都在为几乎从不被访问的冷数据买单。

传统开源数据库的致命短板：缺失的资源调度维度

传统的分布式数据库，无论是HBase、MongoDB还是Milvus，其调度逻辑本质上都是“数据分片+负载均衡”。它们的目标是在给定的机器资源池里，把分片摆放得更均匀。

然而，这套范式共享了一个隐含的前提：资源池的大小是外部输入的，而不是数据库内核的决策变量。

数据库内核自己不会去申请机器，也不会因为某个分片变冷就自动释放机器。这是因为开源数据库为了追求“普世性”和通用性，必须忽略底层的资源异构与计费差异，无法将资源管理作为内核的第一等公民。

但在Episodic Workload下，固定资源池的负载均衡做得再好，也无法解决节点大部分时间空转的浪费问题。问题不再是“已有资源怎么摊得更均匀”，而是“资源此刻该不该存在”。这正是传统开源数据库无法跨越的鸿沟。

Vector Lakebase的四个关键架构决策

为了解决这一痛点，基于开源Milvus进化而来的Vector Lakebase（在云上被称为Kite）应运而生。它集成了数据管理、任务调度以及资源分配，做出了四个关键的架构决策：

1. 存算分离，接受秒级冷启动

为了将存储成本降到最低，Vector Lakebase将固化的分片统一持久化至对象存储（如S3），查询节点仅做无状态计算。虽然这会带来秒级的冷启动代价，但在AI Workload下，RAG查询和上下文召回的P99延迟预算通常在几百毫秒到几秒之间，这为“数据在S3，查询时按需拉起”的模型提供了合理的生存空间。

2. 云核一体，控制面全局池化

Vector Lakebase让控制面（Coordinator）同时承担数据面路由和资源调度。当路由发现目标资源组是冷的时候，可以当场触发拉起，在毫秒级内完成调度决策。同时，控制面全局池化，避免了每个租户独占控制面导致的成本随租户数线性增长的问题。

3. 多租户算力隔离与三层缓存分级

针对不同活跃度的Agent，数据在内核中被划分为三种状态：

COLD：数据只在对象存储里，无常驻算力，存储成本极低（约$0.02/GB·月）。

WARM：数据缓存在共享节点的本地SSD上，多租户共享算力，查询时mmap进内存（约$0.08/GB·月）。

HOT：租户独占算力，索引常驻内存，支撑持续高QPS（约$3~5/GB·月）。

这种三层分级让企业能够以极低的成本同时服务数千个低频Agent和少数核心高频业务。

4. 计算资源按功能独立伸缩

写入是IO密集型，索引构建是CPU密集型，在线查询是内存密集型。Vector Lakebase将写入节点（StreamNode）、查询节点（QueryNode）和索引构建节点（IndexNode）彻底剥离，各自根据对应的访问模式独立伸缩，避免了任务之间的资源抢占。

结语

在迈向AGI的道路上，AI Agent的兴起不仅改变了应用层的开发范式，也对底层的基础设施提出了全新的挑战。传统的开源数据库因缺乏资源维度的调度能力，在面对Episodic Workload时显得捉襟见肘。而以Vector Lakebase为代表的云原生向量数据库，通过存算分离与极致的弹性资源管理，正在成为大模型时代不可或缺的技术底座。

想要获取更多关于人工智能、大模型技术演进及AI日报行业动态，请持续关注AI门户 AIGC.bar，带您走在AI技术与变现的最前沿。