自变量王潜专访:从错失图灵奖到打造具身智能界的OpenAI
type
status
date
slug
summary
tags
category
icon
password
网址

在当今的AI新闻和科技浪潮中,具身智能(Embodied AI)正成为继大语言模型之后的下一个兵家必争之地。近期,自变量机器人(Variables Robot)宣布完成10亿元A++轮融资,由字节跳动领投,这一消息迅速引爆了科技圈。而站在风口浪尖的创始人王潜,以其独特的学术背景和激进的技术愿景,成为了业界关注的焦点。
王潜的故事并非典型的硅谷精英创业剧本。从清华电子系到生物医学系,再到南加大的机器人学习博士,甚至中途转行做量化基金,他的路径看似曲折,实则贯穿了对智能本质的追问。本文将深入解读王潜的创业逻辑,探讨他如何从“错过图灵奖”的遗憾中汲取力量,试图在物理世界重现OpenAI式的辉煌,并为关注AGI发展的读者提供深度的行业洞察。
错失图灵奖:技术自信与遗憾的辩证法
王潜的技术自信源于他极早的起步。早在2009年,当大多数人还在研究统计学习时,他便在导师的指引下接触了Geoffrey Hinton的深度学习理论。这种前瞻性视野让他在2014年就摸索到了注意力机制(Attention Mechanism)的门槛——这是后来Transformer架构的核心,也是大模型时代的基石。
他在采访中提到,自己当时发表在NIPS(现NeurIPS)上的论文,提出了将自上而下的注意力机制与自下而上的特征提取统一的框架。这篇论文与DeepMind及ETH团队的工作并列为最早的三篇注意力机制论文之一。然而,由于未能解决乘法算子的收敛问题,且当时未重视残差网络(ResNet)的结合,他与最终定义了现代大模型基础的Transformer架构失之交臂。
王潜将这段经历称为“错过了一个图灵奖级别的工作”。这种遗憾并没有击垮他,反而成为了一种执念和动力。他深刻意识到,技术路线的微小偏差可能导致结果的天壤之别。这种对底层架构的敏感度,直接影响了他后来在具身智能领域对“端到端”模型的坚定选择。
范式转移:GPT-3带来的银弹时刻
为何从量化基金回归AI创业?王潜的答案非常明确:GPT-3的出现。在他看来,GPT-3展示的少样本学习(Few-shot learning)甚至零样本学习能力,是人工智能领域的“银弹”(Silver Bullet)。
在此之前,机器人领域深陷于强化学习的泥潭中——数据需求随任务难度指数级增长,导致通用性极差。王潜敏锐地捕捉到,大语言模型的成功证明了通用模型可以战胜专用模型。他认为,过去大家默认“专用模型最好”的直觉是错误的。
这一认知促使他在2021年决定回归,致力于将LLM(大语言模型)的范式转移应用到机器人领域。他坚信,不需要再等待30年或50年,通过构建通用的具身智能基础模型,机器人行业将迎来类似于NLP(自然语言处理)领域的爆发时刻。这正是他想要做“具身界OpenAI”的理论基石。
坚定拥抱端到端:打破分层模型的桎梏
在自变量机器人成立之初,王潜面临着巨大的质疑。投资人和业界普遍倾向于传统的分层模型,即“感知-规划-控制”的模块化路径。但王潜坚持认为,如果不能在范式上进行根本性变革,创业公司就没有机会。
他指出了分层模型的致命弱点:级联误差。在分层架构中,三维重建的微小瑕疵(如物体表面的毛刺)会在后续的规划和控制环节被无限放大,导致任务失败。而端到端(End-to-End)模型,类似于人类的直觉,可以通过反向传播(backprop)根据最终结果修正初始动作,容忍度更高,更符合物理世界的复杂性。
自变量推出的WALL-A模型,正是这一理念的产物。王潜不仅在模型结构上坚持端到端,还引入了原生的思维链(CoT),让机器人能够像人类一样,理解图纸、评估差距并动手操作。这种对人工智能底层逻辑的重构,是自变量能够获得美团、字节跳动等巨头青睐的关键。
数据为王与硬件的AI定义
在谈及具身智能的Scaling Law(缩放定律)时,王潜提出了一个犀利的观点:如果看不到Scaling Law,那是你的数据太糟糕了。他坚决反对纯虚拟仿真数据(Simulation),认为物理世界的非线性摩擦和随机性是仿真无法完美模拟的。英伟达转向融合数据的事实,也侧面印证了他的判断。
与数据同等重要的是硬件哲学。王潜提出了“AI定义硬件”的观点。他批评了传统机器人硬件设计中“先做完美硬件,再上算法”的思路,认为这会导致硬件与模型训练脱节。例如,许多灵巧手为了追求外形像人手,将电机内置导致手掌厚硬,失去了包裹性,这在实际抓取数据采集中是灾难性的。
王潜认为,中国在供应链和数据成本上拥有巨大优势。虽然美国在AI资讯和算法创新上依然强劲,但在硬件迭代速度和成本控制上,中国具备“快一个数量级”的能力。这为中国具身智能公司在全球AI竞争中提供了弯道超车的可能。
结语:通往AGI的物理拼图
王潜的创业故事,不仅仅是一个技术天才的复出,更是对当前AGI发展路径的一次深刻实践。他试图证明,真正的智能不仅存在于服务器的语言模型中,更需要通过具身实体与物理世界进行交互。
从错失Transformer的遗憾,到如今坚定地在具身智能领域复刻OpenAI的路径,自变量机器人正在探索一条极其艰难但充满希望的道路。对于关注AI新闻和产业发展的观察者来说,王潜和他的自变量机器人,无疑是未来几年最值得关注的样本之一。
想要了解更多关于AI变现、大模型技术进展以及全球人工智能的最新动态,请持续关注专业的AI门户网站 AIGC.BAR,我们将为您带来最前沿的深度解析。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)