星源智发布首个具身交互世界模型ω-EVA:端侧部署新突破
type
status
date
slug
summary
tags
category
icon
password
网址
在2026年的科技浪潮中,具身智能(Embodied AI)已成为人工智能领域最炙手可热的赛道。从学术界到产业界,越来越多的人达成共识:要让机器人真正融入物理世界,必须赋予它们理解物理规律、空间关系和动态变化的能力。而实现这一目标的核心钥匙,正是“世界模型”。
然而,当前世界模型的技术路线百花齐放,视频生成派、隐空间表征派、数据增强派各执一词,技术瓶颈亟待突破。在刚落幕的2026智源大会上,由智源研究院孵化的新锐初创企业“星源智”发布了全球首个具身交互世界模型——ω-EVA。这一模型的推出,不仅为具身智能的落地提供了全新的差异化解法,也为关注 AI资讯 的行业人士带来了关于 AGI 与大模型演进的全新思考。
传统世界模型的痛点与ω-EVA的“预演-验证-行动”闭环
传统世界模型在实际应用中面临着一个尴尬的困境:“只预测,不参与”。在训练阶段,这些模型努力学习未来的环境状态;但在实际推理和执行动作时,它们却与机器人的动作生成完全剥离。这就导致了一个常见痛点:即便视频生成得再逼真、画质再精美,机器人该撞墙时依然会撞墙,无法做出实时的避障与动作修正。
ω-EVA 的核心创新在于打破了这一壁垒,成功构建了“预演-验证-行动”的闭环机制。
简单来说,当搭载 ω-EVA 的机器人准备执行某个动作前,它会在特征空间(隐空间)中率先进行推演:“如果我施加这个动作,周围的环境会发生什么变化?”随后,机器人会基于推演出的后果反馈,实时修正自己的动作方案。这种将世界模型直接引入决策和动作生成环节的范式,让机器人真正拥有了“动手前先动脑”的能力。在大会现场,星源智通过随机打乱的华容道棋盘展示了这一能力:无论观众如何打乱棋局,机器人都能通过预演当前动作的后果,迅速完成路径规划与动作自我修正。
1.2B轻量化设计:为何端侧部署是具身智能落地的关键
在当下的 人工智能 行业中,英伟达的 Dream Zero 等主流技术路线倾向于通过大规模的视频生成来打造基础模型。这种路线虽然生成能力强大,但对算力的要求极其苛刻,通常需要在庞大的桌面级 GPU 上运行,常规的机器人端侧芯片根本无法满足实时闭环控制的推理频率。
与追求高保真视频生成的路线不同,星源智的 ω-EVA 选择了务实的“隐空间建模”方法。
这一技术路线类似于 JEPA(Joint Embedding Predictive Architecture)的思路,它不纠结于把未来的画面精细地“画出来”,而是将未来压缩成能够修正动作的特征信号。得益于这种设计,ω-EVA 的模型大小仅为 1.2B(12亿参数),在单张 RTX 4090 显卡上即可进行训练,甚至可以直接在机器人的端侧模组上流畅运行。
对于具身智能而言,端侧部署的意义非同寻常。如果机器人过度依赖云端推理,不仅会面临高昂的数据传输带宽成本,更会因为网络延迟而无法满足机器人高频的控制需求(通常需要 10Hz 以上的控制频率)。ω-EVA 证明了,通过隐空间压缩与算法优化,世界模型完全可以在低算力消耗下实现高效的端侧实时决策。
数据效率的革命:变废为宝的交互式学习
在传统的 VLA(Vision-Language-Action)模型开发中,模仿学习对数据质量的要求极高,通常只能利用人类操作成功的轨迹数据。这导致数据采集成本高昂,且利用率极低。
而 ω-EVA 所代表的交互式世界模型,为 大模型 的数据效率带来了一场革命。
在世界模型的训练框架下,即便是失败的尝试和轨迹,也是理解物理世界规律的宝贵财富。失败的数据同样能告诉模型“这样做会导致什么后果”,从而帮助其完善对物理世界的认知。这种特性使数据利用效率大幅提升。据星源智团队介绍,传统模式下 8 小时的数采工作可能只能产出 3 小时的高质量数据,而在世界模型框架下,这一效率可以提升至 6 到 7 小时。数据获取成本的降低,将极大加速具身智能模型的迭代步伐。
场景落地与大厂竞争:星源智的商业化“双轮驱动”
面对华为、字节、腾讯等互联网大厂未来可能全面涌入具身智能赛道的局面,星源智展现出了清晰的差异化战略。具身智能的场景极其分散,物流、工厂、家庭等不同场景有着完全不同的数据壁垒和行业知识,这并非单靠强大的基座大模型就能瞬间垄断的。
星源智采取了“双轮驱动”的商业模式:
- 具身大脑解决方案:打造软硬件一体的解决方案,目前已覆盖 70% 以上的头部具身智能本体公司,并成为英伟达 Jetson Thor 全球最大的出货商之一。
- 产业深度合作:以总承包方的角色,与产业资源方合作,在真实的工商业场景(如物流和工业制造)中边落地、边迭代。
这种“基座模型迭代与真实场景验证同步推进”的策略,避开了实验室环境与真实市场脱节的陷阱,通过在垂直场景中不断积累私有数据,构筑了坚固的竞争护城河。
结语
星源智 ω-EVA 的发布,标志着具身交互世界模型从理论走向端侧实用的重要一步。它不仅向行业证明了“轻量化端侧闭环”的可行性,也为整个具身智能产业的商业化落地探索出了可行路径。正如创始人所言,未来五年的核心竞争点,在于谁能率先把机器人部署到真实场景中持续创造价值。
想要获取更多前沿的 AI新闻 与大模型技术深度解析,欢迎持续关注我们的内容更新,共同见证 AGI 时代的到来。
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)