揭秘OpenClaw烧钱真相：源码级省钱技巧与低价API优化

type

status

date

slug

summary

默认顶配模型：昂贵的开箱体验

OpenClaw开箱默认使用的是Anthropic的顶配模型（如Claude 3 Opus系列）。虽然这保证了初次使用的惊艳效果，但对于日常开发和常规任务来说，这绝对不是最具性价比的选择。

在实际的Agentic场景（如Agent编排、文件操作、网页生成等）中，并非所有任务都需要如此庞大的参数量。通过测试发现，一些轻量级模型（如Gemini Flash或低阶的GPT系列）在特定场景下的表现与顶配模型相差无几，但价格却只有前者的几分之一甚至几十分之一。

优化建议： 不要“一个模型走天下”。建议在配置中实施分层调度策略： * 复杂Agentic任务：使用高级别的gpt API或顶级Claude API，确保逻辑推理的准确性。 * 高性价比主力：日常对话、文件操作等，切换至gemini API或中阶模型，大幅削减输入成本。 * 轻量级兜底：纯问答、摘要提取，使用极致性价比的微型模型。通过合理的大模型API直连调度，你可以在不牺牲核心体验的前提下，将整体成本降低数倍。

隐形的“内部思考”：看不见的Token消耗

在OpenClaw的源码中，模型对“Thinking（思考）”的默认值往往取决于模型本身的设定。以Claude系列为例，默认开启的是自适应深度思考。

这意味着在模型正式输出回答之前，会产生大量的内部推理Token。这些Token虽然对用户不可见（不会显示在对话框中），但却是按照Output（输出）的昂贵价格计费的。对于一个复杂任务，一次自适应思考可能悄悄消耗几千甚至上万个Token。在多轮ReAct（推理与行动）循环中，这部分费用甚至能占到总成本的近一半。

优化建议： 如果你认为当前任务不需要极其复杂的深度推理，或者你希望严格控制预算，建议在配置中显式将Thinking参数设置为low或off。避免自适应机制在简单任务上过度消耗你的低价API服务额度。

ReAct循环与上下文滚雪球

ReAct（Reasoning + Acting）是现代AI Agent的核心。但在OpenClaw中，每一次工具调用（Tool Call）都是一次完整的API请求，并且会携带截至当前的全部历史记录。

这意味着，即使你只输入了极短的指令，随着AI不断调用工具、获取结果、再思考，输入（Input）的Token量会像滚雪球一样迅速膨胀。虽然OpenClaw在源码中设置了防护机制（如防止工具结果撑爆上下文、检测死循环、清理历史Thinking块等），但庞大的上下文依然是成本重灾区。

优化建议： 合理评估你的使用场景。如果主要用于文本润色或简单问答，应尽量精简系统提示词和历史记录。此外，选择支持长上下文缓存（Prompt Caching）的Claude API或Grok api供应商，可以有效缓解这一问题。

缓存失效陷阱：动态注入的系统提示词

现代大模型通常支持KV Cache（上下文缓存）来降低长文本的API成本。但缓存命中的前提是前置文本保持绝对静态。

在OpenClaw的源码演进中，曾出现过将精确的当前时间（甚至具体到分钟）直接拼接到System Prompt中的情况，这导致缓存秒级失效。虽然官方后来修复了这个问题（改为只注入时区），但依然存在另一个隐患：Workspace文件内容的直接注入。

OpenClaw会将项目中的引导文件（如AGENTS.md等）完整拼接到系统提示词中。只要你修改了这些文件，缓存就会全部失效。

优化建议： 尽量保持核心系统文件的稳定，避免频繁修改注入到系统提示词中的静态文件内容。对于动态信息，应通过工具调用或用户消息（User Message）传递，以最大化利用国内中转API的缓存优惠。

昂贵的“心跳”：AI静默期的持续扣费

OpenClaw被设计为一个7×24小时待命的Agent。为了实现这一点，它内置了“心跳机制”：即使你没有发送任何消息，系统也会每隔一段时间（例如30分钟）唤醒AI，读取特定的任务文件（如HEARTBEAT.md），看看是否有后台任务需要处理。

每一次唤醒，都是一次携带完整上下文的真实API调用！如果全天候运行，一天可能会产生数十次无效的顶配模型调用，仅仅这一项，每个月就能烧掉数百美元。

优化建议： 如果你不需要AI在后台主动执行任务，最直接的方法是在配置中彻底关闭心跳机制。如果必须使用，请确保在工作区根目录建立一个只有标题的空HEARTBEAT.md文件。源码中对“无实质内容”的文件有跳过调用的优化逻辑，但如果文件直接不存在，AI反而会每次都发起调用来“确认”状态。

历史压缩与子Agent的二次收费

当对话历史过长时，OpenClaw会自动触发Compaction（历史压缩）机制。表面上看这是为了节省后续的Token，但源码显示，其内部在生成摘要时，强制使用了最高级别的推理（reasoning: "high"），且最多可能触发3次甚至因重试达到9次完整的API调用。压缩一次上下文的成本可能高达数美元。

此外，当处理复杂任务启动Subagent（子Agent）时，每个子Agent都是独立的实例，拥有自己的上下文和Thinking机制。由于子Agent不继承父级的Thinking配置，它们往往会回退到模型的默认自适应（最贵）状态，导致成本成倍增加。

总结与展望

OpenClaw作为一个前沿的AI框架，其强大的自动化能力毋庸置疑，但这种“不计成本”的默认工程设计，确实给开发者带来了巨大的经济压力。

要真正用好这款工具，你需要深入理解其底层的API调用逻辑：关闭不必要的心跳、限制隐形思考、优化长上下文管理，并合理配置多模型回退策略。更重要的是，选择一个稳定且高性价比的API接入点。通过使用优质的国内中转API和低价API服务，你可以以极低的成本享受到大模型API直连的畅快体验，让你的“龙虾”真正成为得力助手，而不是吞噬钱包的黑洞。