李飞飞AI造世神器Marble开放!一句话重塑3D创意边界

type
status
date
slug
summary
tags
category
icon
password
网址
notion image
随着人工智能(AI)技术的飞速发展,我们已经见证了从文本到图像的革命性突破。如今,这场变革的浪潮正涌向更复杂的维度——三维世界。近期,由AI领域的传奇人物李飞飞教授联合创立的World Labs公司,正式向公众开放了其备受瞩目的3D世界生成模型——Marble。这款被誉为“造世神器”的工具,旨在将3D内容创作的门槛降至前所未有的低点,让任何人都能通过一句话或一张图,构建出完整的虚拟世界。
本文将深入解读Marble的核心功能、颠覆性的工作流程,并探讨其背后更宏大的“空间智能”愿景,分析它将如何影响游戏、影视乃至整个人工智能行业的发展格局。

Marble核心功能拆解:不止于生成

Marble的强大之处在于它构建了一个从创意到成品的完整工具链,远超市场上大多数同类产品。其核心功能可以概括为三个层面:多模态生成、AI原生编辑和无限扩展。
  • 多模态生成:Marble打破了单一输入的限制,提供了极为灵活的创作起点。
  • 文本生成:用户只需输入一段描述性文字,例如“一个住过人的霍比特厨房,摆满了编织篮子和铜壶,沐浴在宁静的浅蓝色日光中”,AI便能精准捕捉并构建出充满细节、光影真实的3D场景。
  • 单图生成:上传一张照片,Marble能够智能推断并补全360度的全景视角,将二维图像“升维”为三维空间。
  • 多图/视频生成:通过提供来自不同角度的素材,AI可以更精确地拼接和重建一个完整的3D环境,有效解决了单图生成可能出现的边缘形变问题。
  • 3D布局生成:用户可以先用简单的几何体搭建场景框架,再交由AI填充材质、光照和所有细节。
  • AI原生编辑:这或许是Marble最引人注目的特性。它不是简单的贴图修改,而是对3D空间结构的深度理解和智能调整。想移除场景中的某个物体?只需一句话指令,AI会自动处理光影和环境的相应变化。想将餐厅的后墙改造成舞台?同样可以通过自然语言描述来实现,AI会智能地重构空间布局。
  • 世界扩展与组合:创作的边界可以无限延伸。当生成的场景边缘略显模糊或不完整时,“扩展”功能可以智能地向外填充内容,生成更广阔的区域。而“组合模式”则允许用户将多个独立生成的世界无缝拼接在一起,创造出如一整列火车车厢般宏大而连贯的场景。

降维打击?Chisel模式如何颠覆传统3D流程

如果说上述功能还在预期之内,那么Chisel工具则展现了Marble对3D创作流程的颠覆性思考。它巧妙地将结构风格彻底分离,极大提升了创作效率和自由度。
整个流程如同前端开发中HTML与CSS的分离逻辑:
  1. 搭建结构:用户使用立方体、平面等基础模块,像玩乐高一样搭建出场景的骨架。这一步只关心空间布局和物体位置,不涉及任何视觉细节。
  1. 定义风格:通过一段文本提示词(Prompt),描述你想要的视觉风格,比如“现代艺术博物馆,木质地板,陈列着色彩斑斓的画作”或“宁静的斯堪的纳维亚风格卧室,窗外是壮丽的冰川景色”。
  1. AI填充:AI接收到结构和风格指令后,会自动为骨架填充上对应的材质、灯光、道具和氛围,生成一个完整的3D世界。
这种模式最妙的地方在于,同一套结构框架,可以通过更换提示词,一键切换成截然不同的风格。这对于需要快速迭代设计方案的建筑师、游戏场景设计师或影视美术来说,无疑是革命性的效率提升。传统建模软件中需要耗费大量时间调整的操作,在Marble里简化为了拖拽方块和修改文本。

从生成到应用:完整的商业化工具链

一个大模型工具的价值最终体现在其落地应用能力上。Marble在这一点上考虑得相当周全,提供了多种专业级的导出方案,确保生成的内容能无缝对接到现有的生产管线中。
  • 高斯溅射 (Gaussian Splats):一种高保真度的表示方式,适合实时渲染,可以直接在浏览器中流畅运行,非常适合在线展示和VR体验。
  • 三角网格 (Triangle Meshes):这是游戏和影视行业的标准格式。Marble支持导出低精度碰撞网格和高精度渲染网格,可直接导入Unity、Unreal Engine等主流游戏引擎。
  • 视频格式:不仅支持像素级的镜头控制,还能利用AI进行“增强”,自动为场景添加烟雾、火焰、水流等动态特效,一键生成电影级的预览视频。
从游戏开发者快速生成背景环境,到影视团队进行场景预览和镜头规划,再到VR内容创作者构建沉浸式体验,Marble提供了一套从概念到可用资产的端到端解决方案。

李飞飞的终极愿景:超越LLM的“空间智能”

Marble的发布并非孤立的技术展示,它承载着李飞飞对AI未来发展的深邃思考——空间智能(Spatial Intelligence)
李飞飞认为,当前的大语言模型(LLM)虽然在语言处理上取得了巨大成功,但它们对物理世界几乎一无所知,缺乏对三维空间、物理规律的基本理解。而人类智能的核心恰恰是空间智能,它支撑着我们与物理世界的一切交互。
因此,她规划了空间智能应用的三步走战略:
  1. 近期(创造力):通过Marble这样的工具,赋能游戏、电影、建筑设计等创意产业。
  1. 中期(机器人学):在模拟环境中训练机器人,让它们学会在真实世界中导航和行动。
  1. 长期(科学突破):应用于药物研发、材料科学、医疗诊断等需要深刻理解空间结构的领域。
从这个角度看,Marble不仅是一款工具,更是实现“空间智能”这一宏大愿景的探路石。从当年教会AI“看懂”世界的ImageNet,到如今教会AI“构建”世界的Marble,李飞飞始终在推动机器视觉向更深层次的理解迈进。
当OpenAI等巨头在LLM的道路上持续内卷时,李飞飞和她的World Labs选择了一条更具挑战性但也可能引爆下一场范式转移的道路。这场关于AI技术路线的豪赌,胜负未分,但无疑让AI的未来充满了更多可能性。
想要获取更多关于人工智能大模型的前沿AI新闻与深度分析,欢迎访问AI门户网站 AIGC.bar。
Loading...

没有找到文章