Transformer之父炮轰OpenAI：AI的未来在开源，DeepSeek模式才是出路

type

status

date

slug

summary

从谷歌到三度创业：一位理想主义者的漫漫求索路

要理解Vaswani今天的选择，必须回顾他一路走来的历程。

2017年，在Google Brain工作的Vaswani与同事共同发表了划时代的论文《Attention Is All You Need》，为今天的ChatGPT、Claude等所有主流大模型奠定了理论基础。然而，大公司的条条框框和创新束缚让他感到心灰意冷。

2022年，他选择离开，与同为“Transformer八子”之一的Niki Parmar等人共同创办了Adept AI。但好景不长，据报道，一次严重的内部冲突让他再次意识到，当商业目标与科研理想发生碰撞时，后者往往需要让步。

于是，仅仅几个月后，他再度出走，创立了Essential AI。起初，公司方向非常务实——为企业提供财务分析自动化服务。但就在今年，Vaswani做出了一个惊人的决定，向董事会宣布公司将彻底转型，放弃短期商业应用，全力投入到基础模型研究，并走开源路线。

这次“三迁”，不是简单的跳槽，而是一位技术理想主义者在商业世界中不断碰壁后，为保护科研火种而进行的战略转移。他用亲身经历告诉世界：要想实现真正的技术突破，就必须摆脱投资回报率的枷锁。

为什么说OpenAI们“指望不上了”？

在Vaswani看来，当下的AI巨头们正陷入“创新者窘境”。曾经，Scaling Law（规模法则）是推动模型能力飞跃的“暴力美学”，让算力雄厚的企业实验室占据了绝对优势。然而，随着Scaling Law的边际效益递减，这条路似乎走到了一个瓶颈期。

面对增长放缓和投资者的巨大压力，这些曾经高喊“改变世界”的独角兽们，不得不将重心从遥远的基础研究转向了眼前的商业化落地。 * 产品化倾向：OpenAI推出企业版服务，Anthropic开发浏览器，各大厂商纷纷下场亲自探索应用场景，科研人员的角色越来越像产品经理。 * 人才流动频繁：硅谷热钱涌动，顶尖人才在巨头、初创公司之间频繁流动，追逐风口和热点。这种浮躁的环境很难让团队静下心来，花上数年甚至十几年去啃一块硬骨头。 * 技术壁垒：为了维护商业护城河，闭源公司将最核心的技术成果和数据牢牢锁在“黑箱”中，这阻碍了整个行业知识的共享与流动，减缓了整体的创新速度。

Vaswani直言，这种以商业利益最大化为最终归宿的模式，从一开始就注定了它们无法承担起探索人工智能前沿的重任。这不是科学应有的进步方式。

“成为西方DeepSeek”：开源路线的希望与挑战

在对闭源模式感到失望的同时，Vaswani将目光投向了东方，看到了以DeepSeek为代表的开源力量。他毫不掩饰自己的雄心：“短期内，我们想要成为西方世界的DeepSeek。”

这不仅仅是一句口号，背后是一整套清晰的理念和商业模式构想。

首先，是技术普惠的愿景。 Vaswani设想的AI，不应只是少数大公司的盈利工具，而应成为推动社会公平的强大力量。一个偏远地区的孩子可以通过开源AI获得顶级的教育资源；一个基层诊所可以借助开源工具进行更精准的诊断。这才是技术应有的温度。

其次，是可持续的商业模式。 开源最大的难题是“如何赚钱”。对此，Vaswani提出了“交叉补贴”的解决方案，这在互联网时代早有成功先例： 1. 构建开源基座：开发一个强大的、针对特定领域的开源基础模型，免费提供给整个社区。 2. 提供增值服务：当企业客户希望利用这个开源基座构建自己的应用时，Essential AI可以向其销售定制化的训练数据、技术支持和相关产品。 3. 反哺开源社区：通过企业服务获得的利润，将用于持续投入基础研究和维护开源社区的繁荣。

这种模式既保证了核心技术的开放与共享，又能让公司健康地活下去，形成了一个良性循环。

开源，不只是代码，更是一种精神

Vaswani的团队已经开始践行他们的承诺。转型不久后，Essential AI就发表了一篇名为《Rethinking Reflection in Pre-Training》的论文，提出了在预训练阶段就培养模型反思能力的颠覆性观点，这可能大幅降低大模型的训练成本，对整个开源社区无疑是巨大的福音。

有趣的是，回溯Vaswani的学术生涯，他的两位博士导师——蒋伟教授与黄亮教授，均为华人学者。这本身就是全球学术开放交流、知识共享精神的最好体现。从这个角度看，AI技术能发展到今天，其根基正是这种持续交流、开放互助的生态环境。

开源是一种技术选择，更是一种推动人类知识边界不断拓展的精神和信仰。

总而言之，Ashish Vaswani的振臂一呼，代表了AI领域一股重要的反思潮流。当商业化的浪潮裹挟一切时，总需要有人站出来，提醒我们勿忘初心。开源与闭源的路线之争远未结束，但Vaswani和他的Essential AI无疑为我们展示了一条充满希望的新路径。

想要获取最新的AI资讯和深度解读，探索ChatGPT、Claude等前沿大模型的奥秘，欢迎访问AI门户网站 AIGC.bar (https://aigc.bar)，与我们一同见证人工智能的未来。