国产具身智能新突破:深度机智PhysBrain靠千小时数据实现弯道超车 | AI资讯

type
status
date
slug
summary
tags
category
icon
password
网址
notion image

引言:具身智能的“暗物质”与国产技术的突围

在人工智能(AI)领域,具身智能一直被视为通往通用人工智能(AGI)的最后一公里。然而,长期以来,行业内关于“真机数据”与“仿真数据”孰优孰劣的争论不休。就在硅谷巨头如英伟达(NVIDIA)、Physical Intelligence纷纷加码人类学习路径时,国内初创公司“深度机智”凭借全新的“人类学习”范式,在多个国际基准测试(Benchmark)中取得了SOTA(State-of-the-art)的成绩,甚至在零真机数据的情况下击败了头部巨头。
这一突破的核心在于对“物理常识”的深刻理解。如果说大模型(LLM)是机器的大脑,那么物理常识就是具身智能中的“暗物质”——无处不在却难以捕捉。深度机智通过千小时人类第一视角数据,成功激发了智能涌现,为国产具身智能开辟了一条弯道超车的全新路径。欲了解更多前沿AI资讯,请访问 AI门户

从“通用具身”到“具身通用”:逻辑的彻底重构

目前国内主流的具身智能路线多为“视觉-语言-动作”(VLA)模式,即通过大模型拟合真机轨迹,期望通过堆砌数据达到“通用具身智能”。然而,深度机智创始人陈凯博士指出,这种“端到端拟合轨迹”的做法在底层物理智能不足时效率极低,容易陷入“轨迹拟合”的死胡同,甚至导致大模型出现“灾难性遗忘”,丧失原有的推理能力。
深度机智提出了“具身通用智能”的概念。这一语序的调换意味着:智能是原生的,具身只是表现形式。其核心策略是Understanding first, action next(先理解,后执行)。在这一哲学指导下,机器人首先要像人类一样理解物理世界的运作规律(如力、摩擦、柔度),然后才是在现实中执行任务。这种对大模型技术哲学的重新审视,是其能与硅谷同频共振的关键。

PhysBrain:用人类经验“翻译”物理直觉

为了获取海量的物理常识,深度机智将目光投向了“人类第一视角视频”。人类在日常生活中与物理世界的交互蕴含着极高的信息密度。通过其开发的 Egocentric2Embodiment (E2E) 翻译管道,深度机智将隐性的人类经验转码为机器人可理解的结构化教材。
基于此训练出的具身大脑 PhysBrain,仅使用千小时级的纯人类视频数据,就在泛化性上超过了使用数万小时真机轨迹的行业标杆 Pi0.5。实验证明,PhysBrain 不仅掌握了空间结构,还自发涌现出了自动纠错能力。例如在抓取任务中,当第一次尝试失败时,模型会根据物理直觉调整策略,从“抓取”转为“推拨”,这种灵活性正是人工智能从僵化执行迈向智能应变的标志。

TwinBrainVLA:解决机器人“降智”难题的双脑架构

在VLA领域,一个经典难题是:微调模型学习动作时,往往会破坏其原有的通用理解能力。为了破解这一“左右互搏”的困境,深度机智设计了 TwinBrainVLA 架构。
  • 左脑(冻结的VLM):保持开放世界的通用语义理解能力,确保机器人认识“易碎品”等常识。
  • 右脑(可训练网络):专门处理本体感知和低级动作策略。
通过非对称混合Transformer机制,右脑可以动态查询左脑的知识,而左脑参数不受污染。这种设计确保了机器人在长出“具身肌肉”的同时,依然保有强大的“通用灵魂”,真正实现了知识迁移而不遗忘。

LangForce算法:强迫大脑“读懂指令”再动手

在训练过程中,机器人常会出现“偷懒”现象,即只看画面做动作而忽略语言指令(视觉捷径)。深度机智通过 LangForce 算法,引入了双分支架构和条件互信息最大化机制,强迫模型解释动作与指令之间的逻辑关系。
这种“防偷懒”机制确保了模型必须真正理解提示词(Prompt)中的语义,而不是简单地过拟合训练数据。在不使用任何机器人轨迹进行预训练的情况下,该方法将任务成功率提升了近10个百分点,有力地打破了泛化瓶颈。

结论:Scaling Law 在具身领域的未来展望

当数据策略、异构架构与对齐算法三者汇合时,深度机智的新模型 PhysBrain1.0 在测试中跑出了 79.8% 的成功率,全面超越了国内外一众标杆。这证明了:与其在受限的机器人视角里死磕,不如让模型通过人类视角习得物理世界的“通用语法”。
展望未来,随着人类第一视角数据规模向百万小时量级推进,具身智能的 Scaling Law 或将完全显现。国产具身智能不仅在算法上实现了创新,更在成本结构和规模化门槛上展现了优势。在这个AI新闻日新月异的时代,具身智能的拐点或许比我们想象中更近。
获取更多关于 chatGPTclaude 以及 openai 的深度解析,欢迎持续关注 AI日报,掌握 AGI 时代的最新变现机会与技术动向。
Loading...

没有找到文章