国产世界模型GigaWorld-1登顶全球第一：超越谷歌英伟达，3D准确度逼近满分 | AI资讯

type

status

date

slug

summary

引言：国产AI在物理世界建模领域的“高光时刻”

在人工智能领域，世界模型（World Model）被视为通往通用人工智能（AGI）的关键路径。近日，国产AI界传出重磅消息：由清华系领衔的初创公司“极佳视界”正式发布了其最新力作——GigaWorld-1。这款模型在公认的具身世界模型评测基准WorldArena中，不仅击败了谷歌、英伟达等全球顶尖科技巨头，更以断层式的性能优势登顶全球第一。

作为全球首个综合得分突破60分大关的具身世界模型，GigaWorld-1的出现标志着中国在物理AI（Physical AI）和具身智能基础设施领域已跨入世界领先行列。想要了解更多前沿AI动态，欢迎访问 AI门户获取每日更新。

核心数据：断层式领先的“试金石”表现

WorldArena是由清华大学、普林斯顿大学、新加坡国立大学等全球8所顶尖高校联合打造的评测体系。它不仅测试感知精度，还对物理规律理解、三维空间认知以及动作预测进行全方位的“压力测试”。

在这一严苛的赛场上，GigaWorld-1展现出了令人惊叹的统治力：

物理遵循（Physics Adherence）：相比第二名提升了16%，能够真实模拟物体碰撞、摩擦等复杂物理交互。

3D准确度（3D Accuracy）：得分逼近满分，这意味着模型生成的视频在几何空间上具有极高的精确性，几乎消除了视觉畸变。

视觉质量（Visual Quality）：在保持物理真实的同时，视觉呈现效果同样遥遥领先，为机器人训练提供了高质量的合成数据。

技术深挖：AC-WM架构与可微分物理引擎的融合

GigaWorld-1之所以能取得如此成绩，源于其独特的AC-WM（Action-Conditioned World Model，动作控制世界模型）架构。

传统的视频生成模型往往缺乏对动作的理解，导致生成的画面虽然华丽但物理逻辑混乱。而极佳视界在GigaWorld-1中引入了显式的动作建模机制，确保了视频生成过程中的几何一致性。更具创新性的是，模型融入了可微分物理引擎，使其能够精准获取机械臂等硬件的物理参数，从而实现对复杂物理过程的真实模拟。

此外，团队利用上万小时的高质量真实机器人操作视频进行训练，极大地增强了模型在开放场景下的泛化能力。目前，该模型的部分代码和数据集已在HuggingFace开源，短时间内下载量便突破16000次，成为AI资讯关注的焦点。

物理AI全栈布局：从“数字沙盒”到“通用大脑”

极佳视界并非只做单一模型，其战略核心在于“世界模型×具身大脑”的双轮驱动。其产品矩阵涵盖了物理AI的全栈需求：

GigaWorld（物理世界数字沙盒）：作为世界模型平台，它能生成高保真、可控的具身交互数据。实测显示，利用该平台训练的VLA（视觉-语言-动作）模型，在泛化性能上提升了近300%，效率提升达10-100倍。

GigaBrain（机器人通用大脑）：这是端到端的视觉-语言-动作基础模型。在真机评测中，GigaBrain-0.1已超越了Pi0.5等国际知名模型，位居全球首位。

GigaWorld-Policy：实现了世界-动作模型的实时性突破，推理效率与训练效率均提升了10倍，标志着具身智能正式迈入大规模Scaling时代。

团队背景：物理AI领域的“梦之队”

极佳视界的崛起并非偶然，其背后的核心团队集结了中国物理AI领域的顶尖力量。创始人黄冠博士曾任地平线机器人视觉感知负责人，联合创始人朱政则是连续4年入选全球前2%顶尖科学家的智源青年学者。

这种强大的技术背景吸引了资本市场的高度关注。华为旗下的哈勃投资早在2025年便完成了对极佳视界的亿元级战略投资。华为曾预测，世界模型将是2035年十大技术趋势之首，而极佳视界正是其在中国市场挖掘出的最具潜力的标的。近期，公司更是完成了近10亿元的Pre-B轮融资，投资方包括中芯聚源、上海半导体产投基金等一众重磅机构。

结语：开启具身智能的新纪元

从数据引擎到闭环仿真器，再到世界动作模型，极佳视界正在为全球开发者提供坚实的技术基石。GigaWorld-1的成功不仅是名次上的第一，更是国产AI在底层物理逻辑认知上的一次重大飞跃。

随着具身智能技术的不断成熟，我们可以预见，未来机器人将拥有更强大的“大脑”和更精准的“感知”。关注 AGI 领域最新进展，掌握人工智能变现前沿资讯，让我们共同见证物理AI时代的到来。