如视Argus 1.0:从全景图到3D世界,空间智能大模型如何重塑真实?| AI资讯
type
status
date
slug
summary
tags
category
icon
password
网址
当众多AI实验室还在致力于用模型“创造”可交互的虚拟世界时,一条截然不同的技术路径正悄然开辟——并非虚构,而是对我们所处的真实世界进行精准复刻。近日,数字空间解决方案引领者如视(Realsee)正式发布了其空间大模型Argus 1.0,这一行业首创的模型,标志着空间智能领域的一次重大飞跃。
Argus 1.0的核心使命是“还原”真实世界,它能够以毫秒级的速度,从单张或多张全景/普通图像中,推理出带绝对尺度的相机位姿、深度图和点云。这不仅是技术的炫技,更是为2D图像通往3D真实空间架起了一座前所未有的高速桥梁。这一突破背后,是如视多年来在空间数字化领域的深厚积累和战略布局。让我们一起深入探索,这个被誉为“百眼巨人”的Argus模型,究竟是如何炼成的,它又将如何引领我们走向一个万物可计算的未来。更多前沿的AI资讯,都可以在AI门户AIGC.bar获取。
数据飞轮:Argus 1.0诞生的坚实基石
任何强大的AI大模型都离不开海量高质量数据的滋养,Argus 1.0也不例外。其成功的背后,是如视自成立以来构建的“数字空间-算法-行业应用”的强大飞轮。
* 核心资产:全球最大的三维空间数据库
脱胎于贝壳找房的如视,从房产交易这一刚需场景切入,积累了惊人的数据财富。截至目前,如视已在全球范围内积累了超过5300万套的数字空间数据,覆盖面积超44亿平方米。这个庞大的真实空间数据库,正是驱动其算法不断迭代的核心引擎。
* 高质量数据:软硬一体化的独特优势
与量同样重要的是质。如视坚持自研硬件(如伽罗华系列3D激光扫描仪)与算法,确保了采集到的图像数据和激光点云数据在源头上就实现了像素级的精准对齐。这种“所见即所得”的高精度、带绝对尺度的数据对,是Argus 1.0能够学习到准确深度信息的关键,尤其是在处理玻璃、镜面等行业公认的重建难题时,展现出无与伦比的优势。
* 应用驱动的持续创新
如视每年超过2亿人民币的研发投入,以及在CVPR、ICCV等国际顶会上发表的科研成果,都彰显了其技术实力。这种以应用为导向的底层创新,使得技术能快速落地于房产、家装、零售等九大行业,形成正向循环,不断丰富和优化其数据飞轮。
Argus 1.0:从“单眼”到“百眼”的技术革命
如果说如视此前的单目深度估计算法Cyclops(独眼巨人)是实现了从单一视角推测深度,那么Argus 1.0(百眼巨人)则代表了从“单视”推测到“多视”全局一致性的跨越式升级。
Argus 1.0基于Transformer架构,并利用如视积累的近百万套真实高清空间数据进行训练,实现了在兼容性、实时性和生成质量上的三大行业突破。
兼容性:业界首个支持全景图输入的大模型
Argus 1.0最引人注目的突破在于其输入端。它是业界目前已知唯一支持全景图输入的深度推测大模型。这意味着,无论是专业设备拍摄的全景图,还是普通手机照片,甚至是AI生成的图片,都可以被Argus 1.0快速处理,生成3D空间。这一能力极大地降低了VR内容生产的门槛,为低成本、高效率的3D空间复刻提供了可能。
实时性与一致性:毫秒级的全局重建
与传统“先推测深度、再拼接位姿”的两步走方案不同,Argus 1.0创新地将深度推测和位姿计算融合在一个模型中进行联合训练。这种架构使得模型能够更好地理解多视图间的关联,一步到位地输出全局一致的相机位姿和点云。其推理效率达到毫秒级,是首个实时的全景图全局重建系统,真正实现了“全流程无感知响应”。
高质量:源自真实数据的稳健性
得益于海量经过精细业务标注的真实数据,Argus 1.0在处理玻璃、镜面、长走廊等传统3D重建难题时表现出色。通过对修正后的激光数据进行学习,模型掌握了这些困难场景的特征,生成的3D空间在细节和精度上远超其他依赖虚拟或低质量数据的方案。
迈向终局:空间智能的AIGC蓝图
Argus 1.0的发布,不仅是工具的升级,更是如视“空间智能四层理论”中的关键一环。这四层理论清晰地描绘了从数字化到智能化的演进路径:
- 重建层:将物理世界转化为数字孪生。
- 理解层:让机器理解空间中的物体和结构。
- 编辑层:在数字空间中进行交互和修改。
- 生成层(AIGC):结合空间外信息(如行业规范、用户偏好),进行智能创造和设计。
Argus 1.0是第一层(重建层)的集大成者,它打通的2D到3D能力已经可以赋能诸多应用,例如生成效果优于苹果的动态空间壁纸。而如视的目光已投向更高阶的应用,计划于明年初发布的Argus 2.0将支持实时渲染的3DGS模型,为空间漫游提供更沉浸的数字基底,并最终攻克第四层——AIGC层,实现从物理世界到数字空间,再赋能现实应用的完整闭环。
结论:开启真实世界AIGC的新纪元
从服务房产交易的VR看房,到赋能九大行业的空间智能解决方案;从打磨软硬一体的采集系统,到发布毫秒级的空间大模型Argus 1.0,如视的每一步都走得坚实而清晰。Argus 1.0的问世,不仅仅是如视自身技术飞轮势能的爆发,更是向整个行业证明了一条核心路径:海量、高精度、高一致性的真实世界数据,是训练空间基础大模型的决定性优势。
随着如视开放万套级别的室内房屋数据集,一个以真实数据为基石,从底层重建走向顶层AIGC应用的全新时代正被开启。一个万物可计算、虚实深度融合的未来,正以前所未有的速度向我们走来。想要了解更多关于AI、大模型、LLM的前沿动态,欢迎访问中国领先的AI门户网站AIGC.bar,获取最新、最全的AI资讯和深度分析。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)