LeCun怒揭机器人骗局:世界模型才是AGI未来,LLM已死?| AI新闻

type
status
date
slug
summary
tags
category
icon
password
网址
在人工智能(AI)浪潮席卷全球的今天,任何一位行业巨擘的言论都可能掀起滔天巨浪。近日,图灵奖得主、Meta首席AI科学家Yann LeCun(杨立昆)在MIT的一场讲座中,再次以其标志性的犀利言辞,向当前最火热的两个领域——人形机器人和大型语言模型(LLM)——泼了一盆冷水,直言人形机器人是“AI圈最大的骗局”,并坦白Meta的王牌模型Llama“与我无瓜”。这番言论不仅引发了特斯拉、Figure等机器人公司大佬的激烈反驳,也让我们不得不重新审视通往通用人工智能(AGI)的真正路径。

LeCun的“惊世骇俗”:为何人形机器人是当前最大骗局?

当众多公司以酷炫的人形机器人演示视频吸引数十亿估值时,LeCun一针见血地指出了行业的核心秘密:这些公司根本不知道如何让机器人变得足够“聪明”
他认为,目前的技术可以让机器人在工厂等结构化环境中完成拧螺丝、搬运货物等特定任务,这属于“窄智能”的范畴。然而,要让机器人走进家庭,完成叠衣服、倒水、甚至理解人类复杂意图等任务,则需要通用智能(AGI)层面的突破。而这个突破的核心,LeCun断言,在于构建一个能够学习、理解并预测物理世界如何运作的“世界模型”(World Model)
没有世界模型,机器人就无法进行有效的规划和推理,所有的演示都可能只是预先编程的“戏剧表演”。LeCun的这盆冷水,瞬间点燃了行业战火: * 特斯拉Optimus AI负责人Julian Ibarz 直接表示:“我不同意LeCun的观点”,并暗示特斯拉内部已有清晰的实现路径。 * Figure创始人Brett Adcock 更是直接喊话,让LeCun“别端着了,亲自下场干点实事”。
这场争论的本质,是关于实现通用智能机器人时间表和技术路径的根本分歧。

LLM已是死胡同?LeCun:连猫的智商都不如

LeCun对人形机器人的批判,根植于他对当前主流AI技术——大型语言模型(LLM)的深刻不信任。在他看来,“LLM就是一条死胡同,世界模型才是正道”
他的核心论点如下: 1. 数据带宽过低:LLM依赖文本进行训练,而文本是“低带宽”的离散符号。真正的智能来源于高带宽的感官输入,如视觉、听觉和触觉。他举例说,一个四岁儿童通过视觉接收的数据量,已经远超任何LLM所训练的文本总量。 2. 缺乏真实理解:LLM本质上是通过海量数据学习了词语之间的统计关系,它们能够生成流畅的文本,有时甚至让人误以为其“智商堪比博士”,但这仅仅是“回忆”和模式匹配,而非真正的理解和推理。 3. 不如生物智能:LeCun毫不客气地指出,LLM不具备任何真实意义上的智能,“甚至不如一只猫”。一只猫能够感知三维空间,判断物体稳定性,并规划复杂的跳跃动作,这些对物理世界的深刻理解和互动能力,是目前所有生成式AI模型都无法企及的。
对于追求更高层次AI能力的开发者和研究者来说,理解这一观点至关重要。大家可以访问 AIGC导航(https://aigc.bar) 这样的AI门户网站,获取最新的AI资讯和前沿观点,从而更全面地把握人工智能的发展脉搏。

通往AGI的正道:世界模型究竟是什么?

既然LLM是死胡同,那么出路在哪里?LeCun反复强调的概念就是“世界模型”。
简单来说,世界模型就是一个内部模拟器。它能够: > 给定一个世界当前的状态,再给定一个智能体(如机器人)可能采取的动作,预测这个动作执行后世界会变成什么样。
拥有了这样一个模型,AI系统就可以在“脑海”中进行规划: * 设想:构思一系列连续的动作。 * 预测:利用世界模型推演每个动作可能带来的结果。 * 优化:结合一个评估任务完成度的“代价函数”,通过优化算法找出最优的动作序列。
LeCun透露,他的团队正致力于通过自监督学习的方式,让AI从观察中(例如观看视频)自动学习物理世界的规律,而无需人工标注。他甚至大胆预测:“未来3-5年内,这会成为AI架构的主流模型。到那时候,但凡头脑清醒的人,都不会再用现在这种生成式LLM的路子了。”

产业界的博弈:在质疑与实践中前行

尽管LeCun的观点极具颠覆性,但产业界并未停下脚步,而是从不同角度探索着未来。
  • 特斯拉:马斯克一方面强调规模化制造的巨大挑战,另一方面,其AI团队也在开发所谓的“神经世界模拟器”,一个通过海量车辆视频数据训练的端到端系统,这与LeCun的世界模型理念不谋而合,并计划将其“无缝迁移”至Optimus机器人。
  • Figure AI:则表现得更为激进,其CEO声称明年就能让机器人在陌生家庭环境中完成通用工作,他们坚信神经网络是解决机器人复杂自由度问题的唯一途径。
  • 1X Technologies:这家获OpenAI投资的公司则更为有趣,他们公开宣布正在研发自己的“世界模型”,在技术路线上与LeCun对齐,但在实际部署上却非常谨慎,承认现实环境的复杂性远超想象。
这场博弈表明,虽然路径不同,但业界已经认识到,人形机器人的竞赛终点,并非最酷的演示或最激进的量产目标,而是谁能率先攻克机器理解物理世界这一根本性难题。

彩蛋揭秘:Llama的诞生与我“无瓜”

在演讲的最后,LeCun还分享了一个有趣的幕后故事,再次强调自己与Meta的开源大模型Llama没有直接的技术关系。
他透露,第一代Llama实际上是一个由巴黎十余人小团队发起的“海盗项目”,并行于官方的LLM开发计划。没想到这个轻量高效的模型最终脱颖而出,成为主力,并在2023年初由扎克伯格拍板,组建专门的GenAI团队进行产品化。LeCun反复澄清:“在技术上,我个人确实没怎么插手”,这一坦白为这场严肃的技术讨论增添了一丝趣味。

结论

Yann LeCun的言论如同一面镜子,映照出当前AI领域的光鲜与隐忧。他并非否定人形机器人或语言模型的价值,而是对通往AGI的路径提出了根本性的拷问。LLM的成功让我们看到了AI的巨大潜力,但它可能只是通往真正智能的一块垫脚石,而非终点。世界模型所代表的,是对物理世界更深层次的理解和交互能力,这或许才是打开AGI大门的真正钥匙。这场关于AI灵魂的辩论才刚刚开始,最终的胜利者,将属于那个能够让机器真正看懂并融入我们这个复杂物理世界的探索者。
Loading...

没有找到文章