国产世界模型GigaWorld-1登顶全球第一:超越谷歌英伟达,3D准确度逼近满分 | AI资讯

type
status
date
slug
summary
tags
category
icon
password
网址
notion image

引言:国产AI在物理世界建模领域的“高光时刻”

在人工智能领域,世界模型(World Model)被视为通往通用人工智能(AGI)的关键路径。近日,国产AI界传出重磅消息:由清华系领衔的初创公司“极佳视界”正式发布了其最新力作——GigaWorld-1。这款模型在公认的具身世界模型评测基准WorldArena中,不仅击败了谷歌、英伟达等全球顶尖科技巨头,更以断层式的性能优势登顶全球第一。
作为全球首个综合得分突破60分大关的具身世界模型,GigaWorld-1的出现标志着中国在物理AI(Physical AI)和具身智能基础设施领域已跨入世界领先行列。想要了解更多前沿AI动态,欢迎访问 AI门户 获取每日更新。

核心数据:断层式领先的“试金石”表现

WorldArena是由清华大学、普林斯顿大学、新加坡国立大学等全球8所顶尖高校联合打造的评测体系。它不仅测试感知精度,还对物理规律理解、三维空间认知以及动作预测进行全方位的“压力测试”。
在这一严苛的赛场上,GigaWorld-1展现出了令人惊叹的统治力:
  1. 物理遵循(Physics Adherence):相比第二名提升了16%,能够真实模拟物体碰撞、摩擦等复杂物理交互。
  1. 3D准确度(3D Accuracy):得分逼近满分,这意味着模型生成的视频在几何空间上具有极高的精确性,几乎消除了视觉畸变。
  1. 视觉质量(Visual Quality):在保持物理真实的同时,视觉呈现效果同样遥遥领先,为机器人训练提供了高质量的合成数据。

技术深挖:AC-WM架构与可微分物理引擎的融合

GigaWorld-1之所以能取得如此成绩,源于其独特的AC-WM(Action-Conditioned World Model,动作控制世界模型)架构。
传统的视频生成模型往往缺乏对动作的理解,导致生成的画面虽然华丽但物理逻辑混乱。而极佳视界在GigaWorld-1中引入了显式的动作建模机制,确保了视频生成过程中的几何一致性。更具创新性的是,模型融入了可微分物理引擎,使其能够精准获取机械臂等硬件的物理参数,从而实现对复杂物理过程的真实模拟。
此外,团队利用上万小时的高质量真实机器人操作视频进行训练,极大地增强了模型在开放场景下的泛化能力。目前,该模型的部分代码和数据集已在HuggingFace开源,短时间内下载量便突破16000次,成为AI资讯关注的焦点。

物理AI全栈布局:从“数字沙盒”到“通用大脑”

极佳视界并非只做单一模型,其战略核心在于“世界模型×具身大脑”的双轮驱动。其产品矩阵涵盖了物理AI的全栈需求:
  • GigaWorld(物理世界数字沙盒):作为世界模型平台,它能生成高保真、可控的具身交互数据。实测显示,利用该平台训练的VLA(视觉-语言-动作)模型,在泛化性能上提升了近300%,效率提升达10-100倍。
  • GigaBrain(机器人通用大脑):这是端到端的视觉-语言-动作基础模型。在真机评测中,GigaBrain-0.1已超越了Pi0.5等国际知名模型,位居全球首位。
  • GigaWorld-Policy:实现了世界-动作模型的实时性突破,推理效率与训练效率均提升了10倍,标志着具身智能正式迈入大规模Scaling时代。

团队背景:物理AI领域的“梦之队”

极佳视界的崛起并非偶然,其背后的核心团队集结了中国物理AI领域的顶尖力量。创始人黄冠博士曾任地平线机器人视觉感知负责人,联合创始人朱政则是连续4年入选全球前2%顶尖科学家的智源青年学者。
这种强大的技术背景吸引了资本市场的高度关注。华为旗下的哈勃投资早在2025年便完成了对极佳视界的亿元级战略投资。华为曾预测,世界模型将是2035年十大技术趋势之首,而极佳视界正是其在中国市场挖掘出的最具潜力的标的。近期,公司更是完成了近10亿元的Pre-B轮融资,投资方包括中芯聚源、上海半导体产投基金等一众重磅机构。

结语:开启具身智能的新纪元

从数据引擎到闭环仿真器,再到世界动作模型,极佳视界正在为全球开发者提供坚实的技术基石。GigaWorld-1的成功不仅是名次上的第一,更是国产AI在底层物理逻辑认知上的一次重大飞跃。
随着具身智能技术的不断成熟,我们可以预见,未来机器人将拥有更强大的“大脑”和更精准的“感知”。关注 AGI 领域最新进展,掌握人工智能变现前沿资讯,让我们共同见证物理AI时代的到来。
Loading...

没有找到文章