提示工程已过时?Karpathy力挺「上下文工程」,解锁LLM新纪元
type
status
date
slug
summary
tags
category
icon
password
网址
在人工智能(AI)技术浪潮中,概念的更迭速度超乎想象。曾被奉为与大模型(LLM)交互圣经的「提示工程」(Prompt Engineering),如今正迅速被一个更宏大、更深刻的理念所取代——「上下文工程」(Context Engineering)。这一转变不仅获得了 AI 大神 Andrej Karpathy 的亲自站台,更被视为开启 AI 智能体元年的关键钥匙。这究竟是一次简单的术语升级,还是标志着 AI 应用开发范式的根本性变革?想要紧跟最前沿的 AI资讯,就必须深入理解这一趋势。
## 什么是上下文工程?告别单一提示词的时代
长期以来,我们习惯于将「提示词」理解为我们向 ChatGPT 或其他大模型发出的单一指令字符串。然而,「上下文工程」彻底颠覆了这一狭隘认知。
它不再是精心雕琢一句完美的指令,而是一门设计和构建动态系统的学科。这个系统的核心目标是:在调用大模型之前,为其精准地、动态地构建一个包含所有必要信息的“上下文环境”。
一个完整的上下文,远不止用户的提问,它是一个丰富的信息集合,可以包括:
- 系统指令 (System Prompt):定义模型角色的高级指令,包括行为准则、输出格式和特定规则。
- 用户即时提示 (User Prompt):用户当前需要解决的具体任务或问题。
- 对话历史 (Short-term Memory):当前对话的完整记录,帮助模型理解语境。
- 长期记忆 (Long-term Memory):跨越多次对话沉淀的知识,如用户偏好、项目历史等。
- 检索增强生成 (RAG):从外部数据库、文档或API中实时检索的相关信息,为模型提供最新知识。
- 可用工具 (Tools):模型可以调用的功能定义,如发送邮件、查询库存、预订会议等。
- 结构化输出 (Structured Output):对模型响应格式的强制要求,如输出为JSON。
简而言之,提示工程是在“钓鱼”,而上下文工程则是在为模型打造一个信息完备、工具齐全的“海洋生态系统”,让它能自主地“捕猎”。
## 科学与艺术的结合:Karpathy的深度解析
Andrej Karpathy 指出,将复杂的 LLM 应用轻蔑地称为“ChatGPT的套壳”是大错特错的。其核心正在于这门精深且巧妙的「上下文工程」。
说它是科学,因为它需要系统性地运用多种技术来精准填充模型的上下文窗口。这包括任务拆解、少样本示例(Few-shot Learning)、RAG检索、多模态数据融合、信息压缩等。信息太少,模型性能不佳;信息太多或无关,则会增加成本并导致模型“分心”,性能同样会下降。这背后是对信息论、系统架构和模型能力的精密计算。
说它是艺术,则因为它需要开发者对大模型的“脾性”有深刻的直觉和理解。如何以最简洁有效的方式呈现信息?何时提供工具而非直接给出答案?这些决策往往依赖于开发者的经验和创造力,是一种引导和激发模型潜能的艺术。
## AI智能体成败的关键:从“粗糙”到“惊艳”的飞跃
「上下文工程」的价值在 AI 智能体(AI Agent)的构建中体现得淋漓尽致。决定一个智能体是表现平平还是效果惊艳的,往往不是代码的复杂程度,而是上下文的质量。
想象一个AI助理处理“明天有空碰个头吗?”这个简单的请求。
- 粗糙的演示(低质量上下文):AI只看到这句话,它缺乏你的日程、与对方的关系等任何背景信息。它的回复可能是机械且无用的:“感谢您的消息。我明天可以。请问您想约在什么时间?”
- 惊艳的智能体(高质量上下文):在调用 LLM 之前,系统通过上下文工程,为其提供了:
- 日历信息:显示你明天日程已满。
- 历史邮件:判断出对方是重要合作伙伴,应使用非正式但专业的语气。
- 联系人数据:识别对方身份。
- 可用工具:
send_invite
(发送会议邀请)和send_email
(发送邮件)。
于是,AI生成了这样的回复:“嘿,Jim!我明天日程完全排满了,会议一个接一个。周四上午我有空,你看方便吗?我已经先发了一个日历邀请过去,如果时间不合适我们可以再调整。”
这里的“魔法”并非源于模型本身变得更聪明,而是因为它获得了完成任务所需的、恰到好处的上下文。智能体的失败,本质上是上下文的失败。
## 结论:拥抱新范式,迈向AGI
从「提示工程」到「上下文工程」的演进,绝非文字游戏。它标志着 人工智能 行业从关注“如何与模型对话”的战术层面,跃迁至“如何为模型构建一个智能工作环境”的战略层面。
这门新兴的学科要求开发者具备跨职能的能力,深入理解业务逻辑,并精心编排信息与工具的流动。它将是实现 AI变现、构建真正强大可靠的AI应用的核心竞争力。正如一位网友所言,“记忆”才是通往通用人工智能(AGI)拼图的最后一块,而上下文工程,正是为AI构建有效“工作记忆”的关键所在。
想要获取更多前沿的 AI新闻 和深度解读,欢迎访问AI门户 AIGC.bar,与我们一同探索AI的无限可能。
Loading...