提示工程已过时？Karpathy力挺「上下文工程」，解锁LLM新纪元

type

status

date

slug

summary

## 什么是上下文工程？告别单一提示词的时代

长期以来，我们习惯于将「提示词」理解为我们向 ChatGPT 或其他大模型发出的单一指令字符串。然而，「上下文工程」彻底颠覆了这一狭隘认知。

它不再是精心雕琢一句完美的指令，而是一门设计和构建动态系统的学科。这个系统的核心目标是：在调用大模型之前，为其精准地、动态地构建一个包含所有必要信息的“上下文环境”。

一个完整的上下文，远不止用户的提问，它是一个丰富的信息集合，可以包括：

系统指令 (System Prompt)：定义模型角色的高级指令，包括行为准则、输出格式和特定规则。

用户即时提示 (User Prompt)：用户当前需要解决的具体任务或问题。

对话历史 (Short-term Memory)：当前对话的完整记录，帮助模型理解语境。

长期记忆 (Long-term Memory)：跨越多次对话沉淀的知识，如用户偏好、项目历史等。

检索增强生成 (RAG)：从外部数据库、文档或API中实时检索的相关信息，为模型提供最新知识。

可用工具 (Tools)：模型可以调用的功能定义，如发送邮件、查询库存、预订会议等。

结构化输出 (Structured Output)：对模型响应格式的强制要求，如输出为JSON。

简而言之，提示工程是在“钓鱼”，而上下文工程则是在为模型打造一个信息完备、工具齐全的“海洋生态系统”，让它能自主地“捕猎”。

## 科学与艺术的结合：Karpathy的深度解析

Andrej Karpathy 指出，将复杂的 LLM 应用轻蔑地称为“ChatGPT的套壳”是大错特错的。其核心正在于这门精深且巧妙的「上下文工程」。

说它是科学，因为它需要系统性地运用多种技术来精准填充模型的上下文窗口。这包括任务拆解、少样本示例（Few-shot Learning）、RAG检索、多模态数据融合、信息压缩等。信息太少，模型性能不佳；信息太多或无关，则会增加成本并导致模型“分心”，性能同样会下降。这背后是对信息论、系统架构和模型能力的精密计算。

说它是艺术，则因为它需要开发者对大模型的“脾性”有深刻的直觉和理解。如何以最简洁有效的方式呈现信息？何时提供工具而非直接给出答案？这些决策往往依赖于开发者的经验和创造力，是一种引导和激发模型潜能的艺术。

## AI智能体成败的关键：从“粗糙”到“惊艳”的飞跃

「上下文工程」的价值在 AI 智能体（AI Agent）的构建中体现得淋漓尽致。决定一个智能体是表现平平还是效果惊艳的，往往不是代码的复杂程度，而是上下文的质量。

想象一个AI助理处理“明天有空碰个头吗？”这个简单的请求。

粗糙的演示（低质量上下文）：AI只看到这句话，它缺乏你的日程、与对方的关系等任何背景信息。它的回复可能是机械且无用的：“感谢您的消息。我明天可以。请问您想约在什么时间？”

惊艳的智能体（高质量上下文）：在调用 LLM 之前，系统通过上下文工程，为其提供了：

日历信息：显示你明天日程已满。

历史邮件：判断出对方是重要合作伙伴，应使用非正式但专业的语气。

联系人数据：识别对方身份。

可用工具：send_invite（发送会议邀请）和 send_email（发送邮件）。

于是，AI生成了这样的回复：“嘿，Jim！我明天日程完全排满了，会议一个接一个。周四上午我有空，你看方便吗？我已经先发了一个日历邀请过去，如果时间不合适我们可以再调整。”

这里的“魔法”并非源于模型本身变得更聪明，而是因为它获得了完成任务所需的、恰到好处的上下文。智能体的失败，本质上是上下文的失败。

## 结论：拥抱新范式，迈向AGI

从「提示工程」到「上下文工程」的演进，绝非文字游戏。它标志着 人工智能 行业从关注“如何与模型对话”的战术层面，跃迁至“如何为模型构建一个智能工作环境”的战略层面。

这门新兴的学科要求开发者具备跨职能的能力，深入理解业务逻辑，并精心编排信息与工具的流动。它将是实现 AI变现、构建真正强大可靠的AI应用的核心竞争力。正如一位网友所言，“记忆”才是通往通用人工智能（AGI）拼图的最后一块，而上下文工程，正是为AI构建有效“工作记忆”的关键所在。

想要获取更多前沿的 AI新闻 和深度解读，欢迎访问AI门户 AIGC.bar，与我们一同探索AI的无限可能。