李飞飞AI造世神器Marble开放！一句话重塑3D创意边界

type

status

date

slug

summary

Marble的强大之处在于它构建了一个从创意到成品的完整工具链，远超市场上大多数同类产品。其核心功能可以概括为三个层面：多模态生成、AI原生编辑和无限扩展。

文本生成：用户只需输入一段描述性文字，例如“一个住过人的霍比特厨房，摆满了编织篮子和铜壶，沐浴在宁静的浅蓝色日光中”，AI便能精准捕捉并构建出充满细节、光影真实的3D场景。

AI原生编辑：这或许是Marble最引人注目的特性。它不是简单的贴图修改，而是对3D空间结构的深度理解和智能调整。想移除场景中的某个物体？只需一句话指令，AI会自动处理光影和环境的相应变化。想将餐厅的后墙改造成舞台？同样可以通过自然语言描述来实现，AI会智能地重构空间布局。

世界扩展与组合：创作的边界可以无限延伸。当生成的场景边缘略显模糊或不完整时，“扩展”功能可以智能地向外填充内容，生成更广阔的区域。而“组合模式”则允许用户将多个独立生成的世界无缝拼接在一起，创造出如一整列火车车厢般宏大而连贯的场景。

如果说上述功能还在预期之内，那么Chisel工具则展现了Marble对3D创作流程的颠覆性思考。它巧妙地将结构与风格彻底分离，极大提升了创作效率和自由度。

整个流程如同前端开发中HTML与CSS的分离逻辑：

定义风格：通过一段文本提示词（Prompt），描述你想要的视觉风格，比如“现代艺术博物馆，木质地板，陈列着色彩斑斓的画作”或“宁静的斯堪的纳维亚风格卧室，窗外是壮丽的冰川景色”。

这种模式最妙的地方在于，同一套结构框架，可以通过更换提示词，一键切换成截然不同的风格。这对于需要快速迭代设计方案的建筑师、游戏场景设计师或影视美术来说，无疑是革命性的效率提升。传统建模软件中需要耗费大量时间调整的操作，在Marble里简化为了拖拽方块和修改文本。

一个大模型工具的价值最终体现在其落地应用能力上。Marble在这一点上考虑得相当周全，提供了多种专业级的导出方案，确保生成的内容能无缝对接到现有的生产管线中。

三角网格 (Triangle Meshes)：这是游戏和影视行业的标准格式。Marble支持导出低精度碰撞网格和高精度渲染网格，可直接导入Unity、Unreal Engine等主流游戏引擎。

从游戏开发者快速生成背景环境，到影视团队进行场景预览和镜头规划，再到VR内容创作者构建沉浸式体验，Marble提供了一套从概念到可用资产的端到端解决方案。

Marble的发布并非孤立的技术展示，它承载着李飞飞对AI未来发展的深邃思考——空间智能（Spatial Intelligence）。

李飞飞认为，当前的大语言模型（LLM）虽然在语言处理上取得了巨大成功，但它们对物理世界几乎一无所知，缺乏对三维空间、物理规律的基本理解。而人类智能的核心恰恰是空间智能，它支撑着我们与物理世界的一切交互。

因此，她规划了空间智能应用的三步走战略：

从这个角度看，Marble不仅是一款工具，更是实现“空间智能”这一宏大愿景的探路石。从当年教会AI“看懂”世界的ImageNet，到如今教会AI“构建”世界的Marble，李飞飞始终在推动机器视觉向更深层次的理解迈进。

当OpenAI等巨头在LLM的道路上持续内卷时，李飞飞和她的World Labs选择了一条更具挑战性但也可能引爆下一场范式转移的道路。这场关于AI技术路线的豪赌，胜负未分，但无疑让AI的未来充满了更多可能性。

想要获取更多关于人工智能和大模型的前沿AI新闻与深度分析，欢迎访问AI门户网站 AIGC.bar。