Transformer之父炮轰OpenAI:AI的未来在开源,DeepSeek模式才是出路

type
status
date
slug
summary
tags
category
icon
password
网址
“闭源人工智能正在阻碍我们探索真正的科学。”
这句振聋发聩的论断,出自“Attention Is All You Need”论文的核心作者、Transformer架构的奠基人之一——Ashish Vaswani。在人工智能浪潮席卷全球的今天,当所有目光都聚焦于OpenAI、Anthropic等巨头时,这位开启了LLM(大语言模型)时代的先驱者却发出了不一样的声音。他认为,以OpenAI为代表的闭源模式,在商业化的道路上越走越远,已经逐渐偏离了推动技术边界的初心。
Vaswani不仅提出了尖锐的批评,更用行动给出了自己的答案:All in基础研究,坚持开源路线,并公开表示“我们很乐意成为西方世界的DeepSeek”。这一宣言无疑在AI界投下了一颗重磅炸弹。本文将深入解读Vaswani的观点,探讨他为何对OpenAI失去信心,以及他所倡导的开源模式将如何塑造AGI的未来。

从谷歌到三度创业:一位理想主义者的漫漫求索路

要理解Vaswani今天的选择,必须回顾他一路走来的历程。
2017年,在Google Brain工作的Vaswani与同事共同发表了划时代的论文《Attention Is All You Need》,为今天的ChatGPTClaude等所有主流大模型奠定了理论基础。然而,大公司的条条框框和创新束缚让他感到心灰意冷。
2022年,他选择离开,与同为“Transformer八子”之一的Niki Parmar等人共同创办了Adept AI。但好景不长,据报道,一次严重的内部冲突让他再次意识到,当商业目标与科研理想发生碰撞时,后者往往需要让步。
于是,仅仅几个月后,他再度出走,创立了Essential AI。起初,公司方向非常务实——为企业提供财务分析自动化服务。但就在今年,Vaswani做出了一个惊人的决定,向董事会宣布公司将彻底转型,放弃短期商业应用,全力投入到基础模型研究,并走开源路线。
这次“三迁”,不是简单的跳槽,而是一位技术理想主义者在商业世界中不断碰壁后,为保护科研火种而进行的战略转移。他用亲身经历告诉世界:要想实现真正的技术突破,就必须摆脱投资回报率的枷锁。

为什么说OpenAI们“指望不上了”?

在Vaswani看来,当下的AI巨头们正陷入“创新者窘境”。曾经,Scaling Law(规模法则)是推动模型能力飞跃的“暴力美学”,让算力雄厚的企业实验室占据了绝对优势。然而,随着Scaling Law的边际效益递减,这条路似乎走到了一个瓶颈期。
面对增长放缓和投资者的巨大压力,这些曾经高喊“改变世界”的独角兽们,不得不将重心从遥远的基础研究转向了眼前的商业化落地。 * 产品化倾向:OpenAI推出企业版服务,Anthropic开发浏览器,各大厂商纷纷下场亲自探索应用场景,科研人员的角色越来越像产品经理。 * 人才流动频繁:硅谷热钱涌动,顶尖人才在巨头、初创公司之间频繁流动,追逐风口和热点。这种浮躁的环境很难让团队静下心来,花上数年甚至十几年去啃一块硬骨头。 * 技术壁垒:为了维护商业护城河,闭源公司将最核心的技术成果和数据牢牢锁在“黑箱”中,这阻碍了整个行业知识的共享与流动,减缓了整体的创新速度。
Vaswani直言,这种以商业利益最大化为最终归宿的模式,从一开始就注定了它们无法承担起探索人工智能前沿的重任。这不是科学应有的进步方式。

“成为西方DeepSeek”:开源路线的希望与挑战

在对闭源模式感到失望的同时,Vaswani将目光投向了东方,看到了以DeepSeek为代表的开源力量。他毫不掩饰自己的雄心:“短期内,我们想要成为西方世界的DeepSeek。”
这不仅仅是一句口号,背后是一整套清晰的理念和商业模式构想。
首先,是技术普惠的愿景。 Vaswani设想的AI,不应只是少数大公司的盈利工具,而应成为推动社会公平的强大力量。一个偏远地区的孩子可以通过开源AI获得顶级的教育资源;一个基层诊所可以借助开源工具进行更精准的诊断。这才是技术应有的温度。
其次,是可持续的商业模式。 开源最大的难题是“如何赚钱”。对此,Vaswani提出了“交叉补贴”的解决方案,这在互联网时代早有成功先例: 1. 构建开源基座:开发一个强大的、针对特定领域的开源基础模型,免费提供给整个社区。 2. 提供增值服务:当企业客户希望利用这个开源基座构建自己的应用时,Essential AI可以向其销售定制化的训练数据、技术支持和相关产品。 3. 反哺开源社区:通过企业服务获得的利润,将用于持续投入基础研究和维护开源社区的繁荣。
这种模式既保证了核心技术的开放与共享,又能让公司健康地活下去,形成了一个良性循环。

开源,不只是代码,更是一种精神

Vaswani的团队已经开始践行他们的承诺。转型不久后,Essential AI就发表了一篇名为《Rethinking Reflection in Pre-Training》的论文,提出了在预训练阶段就培养模型反思能力的颠覆性观点,这可能大幅降低大模型的训练成本,对整个开源社区无疑是巨大的福音。
有趣的是,回溯Vaswani的学术生涯,他的两位博士导师——蒋伟教授与黄亮教授,均为华人学者。这本身就是全球学术开放交流、知识共享精神的最好体现。从这个角度看,AI技术能发展到今天,其根基正是这种持续交流、开放互助的生态环境。
开源是一种技术选择,更是一种推动人类知识边界不断拓展的精神和信仰。
总而言之,Ashish Vaswani的振臂一呼,代表了AI领域一股重要的反思潮流。当商业化的浪潮裹挟一切时,总需要有人站出来,提醒我们勿忘初心。开源与闭源的路线之争远未结束,但Vaswani和他的Essential AI无疑为我们展示了一条充满希望的新路径。
想要获取最新的AI资讯和深度解读,探索ChatGPTClaude等前沿大模型的奥秘,欢迎访问AI门户网站 AIGC.bar (https://aigc.bar),与我们一同见证人工智能的未来。
Loading...

没有找到文章