斯坦福博士造14万家务机器人Memo:具身智能新突破
type
status
date
slug
summary
tags
category
icon
password
网址

在人工智能飞速发展的今天,我们似乎已经习惯了ChatGPT在屏幕背后为我们生成文本或代码,但对于物理世界的“脏活累活”,我们依然渴望一个能真正动手的帮手。近日,具身智能领域迎来了一颗重磅炸弹:由斯坦福顶尖华人博士赵子豪(Tony Zhao)和迟宬(Cheng Chi)联合创办的Sunday公司,正式亮相了其首款家务机器人——Memo。
这款机器人不仅拥有极具亲和力的外观,更号称能“把周末还给你”,售价约2万美元(约合人民币14万元)。作为AI新闻领域的焦点事件,Memo的出现不仅展示了人工智能在硬件载体上的最新进展,也让我们窥见了AGI(通用人工智能)走向家庭生活的可能性。
颜值与实力并存:Memo的初次亮相
与传统工业机器人冰冷、机械的外观不同,Memo的设计充满了“人味儿”。它身高1米7,有着卡通化的小脸蛋,头顶甚至还俏皮地戴着一顶棒球帽。这种设计并非仅仅为了美观,其全身采用刚性与弹性聚合物混合材料,外层包裹触感柔软的硅胶,没有尖锐边角,极大地提升了家庭环境中的安全性。
在功能演示中,Memo展现了惊人的灵巧度。它不是在执行简单的预设程序,而是能够处理复杂的家务流程:将餐具整齐地放入洗碗机、叠好散乱的袜子、甚至能为你亲手冲泡一杯咖啡。即使在受到外界干扰(例如衣服被扔到头上)时,它也能保持稳定,继续完成手中的叠衣任务。这种抗干扰能力和柔顺的动作控制,正是新一代具身智能机器人的核心竞争力。
核心大脑:ACT-1 具身大模型
Memo之所以能如此聪明,归功于其背后强大的“大脑”——ACT-1。据官方介绍,这是首个融合了长时序操控与基于地图导航的端到端基础模型。
在大模型技术日益成熟的背景下,ACT-1采用了类似LLM(大型语言模型)的训练思路,但它处理的不是文本,而是像素和动作。它仅需输入视觉观测值,就能直接输出全身的动作指令。这意味着Memo不需要为每一个动作编写死板的代码,而是像人类一样通过“看”来理解环境并做出反应。
ACT-1的强大之处在于其泛化能力。在训练中,模型接触了大量多样化的家庭布局数据,学会了解释3D地图而非死记硬背。因此,当Memo被放置在一个从未见过的陌生家庭环境中时,它依然能够利用给定的3D地图导航到厨房或餐厅,并完成取餐具等精细操作。
数据采集革命:让用户教机器人做事
制约机器人发展的一大瓶颈往往是高质量训练数据的匮乏。Sunday团队为此提出了一套极具创新性的解决方案:技能捕捉手套。
不同于昂贵的遥操作设备,这款手套成本仅需400美元,且与Memo的手部拥有完全相同的几何结构和传感器套件。这遵循了一个简单的逻辑:只要人戴着手套能做到的动作,Memo就能学会。通过配套的“技能转换(Skill Transform)”技术,人类的操作数据能以近90%的成功率转换为机器人可用的训练数据。
这一设计不仅降低了研发成本,更开启了“用户共创”的大门。未来,购买Memo的用户可以亲手教自己的机器人新本领,这种个性化的学习能力将极大地丰富机器人的技能库,加速AI变现与家庭普及的进程。
斯坦福全明星团队的愿景
Sunday的两位创始人赵子豪和迟宬,在机器人学术界可谓是星光熠熠。赵子豪曾在DeepMind、Tesla等顶尖机构工作,是ALOHA等明星项目的核心作者;迟宬则是UMI和扩散策略(Diffusion Policy)的第一作者。他们的结合,代表了从算法大脑到硬件躯体的全栈式技术整合。
他们致力于打造一款友好、安全且价格实惠的机器人。目前的Memo虽然仍处于测试阶段,预计2026年正式推出,但它所展示的技术路线——即利用低成本数据采集和强大的端到端模型——为家用机器人的量产化指明了方向。
结语与展望
Memo的亮相,让我们看到了人工智能从数字世界迈向物理世界的坚定步伐。虽然14万元的售价对于普通家庭来说依然是一笔不小的开支,但随着技术的迭代和产业链的成熟,机器人的成本终将下降。
在这个AI资讯日新月异的时代,Memo不仅是一个产品,更是一个信号:未来的周末,我们或许真的可以从繁琐的家务中解脱出来,享受科技带来的自由。如果您对大模型、Prompt工程以及更多前沿AI新闻感兴趣,欢迎访问 aigc.bar 获取更多深度解读。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)