魔芯科技:00后领军AI世界模型,亿元融资开启产业新纪元

type
status
date
slug
summary
tags
category
icon
password
网址
notion image
2024年底,AI领域迎来重磅消息:由浙江大学00后创业者陈天润创立的魔芯科技,凭借其在“世界模型”(World Models)领域的深厚技术积累和前瞻性布局,成功完成新一轮亿元级别融资。这一里程碑不仅标志着资本市场对魔芯科技未来潜力的认可,更预示着AI认知范式正加速向更深层次的三维空间理解迈进。本文将深入解读魔芯科技的创业历程、核心技术,以及其在AI产业化落地方面的重要进展,揭示AI迈向“理解世界”的下一站。

00后创业新势力:魔芯科技的AI世界模型征程

陈天润,一位在AI浪潮中崭露头角的00后创业者,早在2021年,当大语言模型尚未“破圈”,“世界模型”还停留在AI在游戏环境中“做梦”的阶段时,他就果断创立了魔芯科技,聚焦于AI与3D技术的融合。起初,公司的业务围绕AI驱动的3D内容生成展开,逐步积累了宝贵的三维数据资产和工程经验。
随着AI技术的飞速发展,陈天润敏锐地洞察到市场机遇。2024年底,他做出一个更为激进的战略决策:将公司资源重心全面转向3D场景建模和世界模型。他坚信,从单个物体到整个场景的跨越,将打开一个数量级更大的应用空间和市场规模——“一个场景里可以装下整个世界”。这一前瞻性的判断,也得到了其导师、中国计算机图形学与人工智能领域的开拓者潘云鹤院士的鼎力支持,潘院士提出的“用新技术做新的事”和“充分利用视觉知识,把数据转化为知识,让AI去学”的建议,深刻影响了魔芯科技的技术路线选择。

洞悉“世界模型”:AI的下一代认知范式

要理解魔芯科技的价值,首先需要理解“世界模型”这一前沿概念。如果将大语言模型比作预测下一个词的“语言世界”,那么世界模型则是预测三维物理状态的“真实世界”。它接收当前的场景信息和潜在扰动,能够推演出下一刻世界将如何演变。这标志着AI正从处理离散的文本信息,迈向理解连续、动态的物理空间。
当前,全球AI巨头和初创公司都在积极布局世界模型赛道。李飞飞的World Labs、杨立昆的AMI Labs,以及Google DeepMind的Genie 3等,都在探索不同的技术路径。然而,魔芯科技选择了一条独特的“第三条路”。

魔芯科技的独特技术路线:纯隐式方法与海量数据积累

与主流的3D高斯(Gaussian Splatting)或显式几何重建方案不同,魔芯科技选择了纯隐式(implicit)的方法来实现世界模型的扩展。这种纯数据驱动的范式,不依赖于手工设计的先验规则,而是通过大规模的模型训练来提升能力。这意味着模型的表现高度依赖于数据的质量和数量。
恰恰是数据,构成了魔芯科技的核心壁垒。自2021年起,公司就持续投入资源雇佣设计师和美术艺术家制作高质量3D内容,逐步积累了覆盖复杂物理场景、动态自然环境的PB级3D模型和场景资产。这些海量、高质量的3D数据,是AI领域中稀缺且难以大规模获取的资源。陈天润表示:“我们不光有数据,还打磨了一套让人画得更快的工具。如果相信世界模型是一个靠数据scaling的范式,那谁能更快更高效地产生数据,谁就有优势。”
在模型设计上,魔芯科技的KOKONI-World采用了14B参数规模,远超部分同行。为解决大模型带来的推理速度和成本问题,团队创新性地设计了级联式知识蒸馏方案,通过减少多步推理过程的迭代次数,在不牺牲模型尺寸的前提下大幅提升了推理效率。
另一项关键设计是相机感知记忆结构。KOKONI-World生成的三维场景具备持久的空间信息记忆,用户在场景中移动视角后,几何结构和视觉细节不会坍塌,能够实现2000帧(约两分钟)的连续动态预测,支持1080P全高清实时交互输出和6自由度的精确相机控制。这些技术叠加,为世界模型在长时一致性、高保真度和交互性方面树立了新的标杆。

年轻团队的“硬核”实力与产业交付能力

魔芯科技的团队构成是其另一张亮眼的名片——一支平均年龄不到30岁的全博士团队,核心成员来自浙江大学、中国科学技术大学、同济大学等顶尖高校。他们是多模态大模型驱动的3D重建与视频生成领域的研究骨干,拥有丰富的顶会论文发表经验。陈天润认为,这支“搞大模型的人在做世界模型”的年轻团队,对数据驱动的范式有天然的信心和经验,能够引领AI的下一代创新。
与不少仅停留在学术研究阶段的团队不同,魔芯科技已具备强大的产业交付能力。他们是世界模型赛道上少数已经产生收入的团队之一。自2025年交付首版模型以来,魔芯科技提供的3D重建服务已支持API调用和定制化开发,并在影视娱乐、数字孪生、自动驾驶、具身智能等多个领域实现了实际的对接和交付。更重要的是,魔芯的模型能够同时输出人类可理解的显式结果(如视频、3D点云)以及机器可直接用于决策的纯隐式token和向量,这种“两头都能交付”的能力,使其在面对不同行业客户时拥有极大的灵活性。

展望“3D的ChatGPT时刻”

当前,世界模型作为一个全新范式,整个行业仍处于能力爬坡期,其泛化性和场景覆盖度仍在持续迭代。陈天润将当前比作大语言模型在ChatGPT之前的BERT时代,基础能力已涌现,但距离爆发式的产品化落地尚需时日。
魔芯科技的愿景宏大:“3D的ChatGPT时刻”。这意味着世界模型将不再是实验室里的概念,而是能够部署到亿级设备上,让AI真正理解物理世界并做出可靠判断的基础能力。这个方向面向的是万亿级别的市场。
随着新一轮亿元融资的到位,魔芯科技正加速推进下一代模型的研发与发布,新模型将显著提升输入分辨率,带来更高的3D建模准确度和泛化能力。魔芯科技正以务实的态度,致力于交付真正“work”的产品,而非仅仅停留在概念层面。这支年轻的团队,正以前所未有的速度,引领AI走向更深度的智能。
--- AI资讯,AI新闻,AI门户,AGI,LLM,大模型,提示词,openai,chatGPT,人工智能,claude,AI日报,Prompt,AI变现
Loading...

没有找到文章