ChatGPT核心贡献者姜旭归国,重塑具身智能Scaling新纪元
type
status
date
slug
summary
tags
category
icon
password
网址

2024年,中国AI领域迎来一位重量级人物的回归——前OpenAI核心贡献者姜旭(Roger Jiang)。他曾深度参与了GPT系列模型从底层训练到RLHF对齐算法的关键演进,是GPT-4技术报告的核心贡献者之一,也是奠定ChatGPT指令遵循能力基础的InstructGPT主要作者。如今,姜旭选择在中国深圳创立亮源新创(Light Origins),将目光投向了极具潜力的具身智能(Embodied Intelligence)领域,并誓言将大语言模型(LLM)的“Scaling”理念带入这个全新的赛道。
姜旭的AI之旅:从OpenAI到具身智能的战略转型
姜旭在OpenAI的四年(2019-2023)是AI飞速发展的关键时期。他经历了从GPT-3的初步探索到GPT-4的惊艳亮相,横跨了底层基础设施、大规模预训练、以及至关重要的RLHF(Reinforcement Learning from Human Feedback)对齐算法等全栈式工作。这段经历不仅让他深刻理解了AI模型“Scaling”的本质——即通过规模化数据和计算来提升模型能力,也让他见证了技术从研究实验室走向颠覆性产品的全过程。
然而,在ChatGPT引爆全球后,姜旭敏锐地察觉到大模型领域正逐渐进入一个“共识化”的阶段。技术路线日益清晰,更多的问题转变为工程和资源的比拼。他更倾向于投身于那些尚未被充分解决、行业尚未形成共识的“开创新范式”的领域。在他看来,当前的具身智能领域,恰似2019年之前的大模型,充满了巨大的探索空间和颠覆潜力。
具身智能的Scaling困境与姜旭的创新解法
当前行业在发展具身智能时,普遍重视遥操数据和真机强化学习。姜旭对此表示认可,但认为这不足以支撑具身基础模型真正走向规模化(Scaling)。他指出,真机数据更适合作为高价值的对齐、验证和闭环迭代数据,而非预训练阶段的主要数据来源。受限于采集成本、场景覆盖和数据多样性,单纯依赖机器人在真实环境中的试错,难以获得类似大语言模型预训练所需的数据密度和广度。
姜旭的核心判断是:具身智能首先需要自己的“预训练”。他认为,行业尚未充分解锁的是互联网尺度的人类运动、空间移动和物理交互数据。就像语言模型从海量文本中学习世界知识和推理结构一样,具身模型也需要从大规模物理世界数据中学习运动先验、空间理解、物体属性(affordance)和交互规律。关键问题不在于“能否多采些真机数据”,而在于“能否找到一套可规模化的具身预训练方法”,将物理世界的行动经验转化为模型能力。
亮源新创:以LLM Scaling理念构建具身基础模型
基于这一理念,姜旭创立的亮源新创(Light Origins)正致力于构建具身基础模型。公司将LLM的Scaling范式迁移到具身智能领域,核心在于模仿和压缩互联网级别的人类行为视频数据。这相当于为具身智能找到了其“文本数据”——即大规模、多样化的人类动作和物理交互的记录。
姜旭将大模型训练的核心路径分为三步:
1. 预训练(知识压缩):从海量数据中学习通用能力。
2. 对齐(知识提取):使模型听从指令,变得“好用”。
3. 推理(深度思考):赋予模型更强的规划和决策能力。
他观察到,当前许多具身智能公司可能在重复NLP(自然语言处理)当年的弯路,过度聚焦于“知识提取”(对齐),而忽略了“知识压缩”(预训练)这一基础且规模化的环节。亮源新创则将重心放在人类行为的压缩上,通过预训练模型,将人类在物理世界中的行动经验“注入”模型。
物理学背景的启示与AI的无限可能
值得一提的是,姜旭的学术背景是物理学。他认为,物理学黄金时代的核心在于发现简单的规律,而当今AI领域,特别是处理海量复杂数据、拟合高度非线性现象,与物理学研究在某种程度上具有共通性。AlphaGo的出现让他意识到深度学习是解决这类科学难题的完美技术,由此坚定了他转向AI的决心。
他认为,语言本身是思考和沟通的基石,而具身智能代表着Physical AGI,是通用人工智能不可或缺的一半。通过将机器人问题转化为多模态模型问题,并利用在大模型领域积累的Scaling经验,他相信具身智能的“Scaling”之路是必然可解的。
姜旭的归国创业,不仅仅是一位顶尖AI人才的回流,更是将大模型领域最成功的Scaling方法论,以前所未有的深度和广度,引入到具身智能这一AI的下一个前沿。这预示着AI将不再局限于数字世界,而是加速走向物理世界,为人类社会带来更深远的影响。他的探索,无疑将为国内具身智能领域带来新的发展动能,并有望推动AI能力的边界向更广阔的物理空间扩展。
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)