日本最强AI竟是DeepSeek马甲？Rakuten AI 3.0翻车现场深度解析 | AI资讯

type

status

date

slug

summary

引言：日本“国产”AI光环下的尴尬真相

在人工智能全球竞赛中，各国都在不遗余力地推出具有代表性的“国产大模型”。3月17日，日本国民级电商巨头乐天（Rakuten）集团高调发布了其号称“日本国内最大规模、最高性能”的AI模型——Rakuten AI 3.0。官方宣传称，该模型拥有约7000亿参数，专门针对日语进行了深度优化，并获得了日本政府相关部门的巨额补助。

然而，这场充满民族自豪感的发布会仅仅过去了不到12小时，剧情就发生了戏剧性的反转。随着技术人员在Hugging Face上扒开该模型的底层配置文件，一个令人啼笑皆非的真相浮出水面：这款所谓的“日本最强AI”，其内核竟然是来自中国的开源模型DeepSeek V3。

证据确凿：config.json里的“不打自招”

这次“翻车”事件的发现过程几乎没有技术门槛。按照开源惯例，乐天将Rakuten AI 3.0的模型权重上传到了Hugging Face官方仓库。当开发者点开该仓库的config.json配置文件时，第一行代码就让所有人沉默了。

在architectures（架构）字段中，清晰地写着：DeepseekV3ForCausalLM。而在model_type字段中，则直接标明了deepseek_v3。

不仅如此，详细的参数配置也与DeepSeek V3如出一辙： * 隐藏层大小（hidden_size）：7168 * 中间层大小（intermediate_size）：18432 * 隐藏层数（numhiddenlayers）：61 * 路由专家数（nroutedexperts）：256 * 词汇表大小（vocab_size）：129280

这种参数层面的高度一致，坐实了Rakuten AI 3.0本质上就是DeepSeek V3的“微调版”。乐天官方宣称的“7000亿参数”，也正对应了DeepSeek V3那6810亿的总参数量。

合规但不体面：开源协议与品牌宣传的博弈

从法律和技术伦理角度来看，乐天的做法其实并未违反规则。DeepSeek V3采用的是极其宽松的开源许可，允许商业使用和二次开发。在业界，基于优秀的开源模型（如Llama或DeepSeek）进行垂直领域的微调（Fine-tuning）是提高研发效率的通行做法。

乐天在新闻稿中也含糊地提到“基于开源社区最优秀的模型开发”，这在技术逻辑上是站得住脚的。然而，争议的核心在于信息披露的不对称。

在所有的对外宣传、媒体采访以及官方PR稿件中，乐天从未主动提及“DeepSeek”字样。这种刻意淡化原模型贡献、试图将其包装成“完全自主研发”的行为，在社交媒体上引发了日本网友的集体吐槽。许多人调侃道：“日本终于进入了用中国AI冒充国产AI的时代。”

讽刺的现实：一边严厉封禁，一边“真香”换壳

此次事件最具有讽刺意味的地方在于日本社会对DeepSeek的复杂态度。

自2025年初DeepSeek在全球范围内爆火以来，日本媒体将其称为“AI界的黑船事件”，意指其对日本科技界造成了巨大的外部冲击。随后，日本政府和多家巨头企业表现出了极高的警惕性： * 日本数字大臣曾公开警告公务员谨慎使用DeepSeek，担心个人信息保护问题。 * 丰田汽车、三菱重工等传统工业巨头明确禁止员工在工作设备上使用DeepSeek。 * 软银等科技公司也限制了内部对DeepSeek的访问。

然而，就在官方和企业层层设防的同时，日本顶尖的互联网企业却在核心AI产品中直接套用了DeepSeek的架构。这种“身体很诚实”的表现，侧面印证了中国大模型在算法效率和性能上的领先地位。

深度思考：AI大模型时代的“拿来主义”

Rakuten AI 3.0事件反映了当前全球AI竞赛中的一个现状：大模型的底层架构正在向少数几个顶尖开源模型收敛。对于后来者而言，从零开始训练一个千亿参数模型的成本极高，且未必能达到开源模型的水平。

因此，越来越多的企业选择“站在巨人的肩膀上”。但这同时也给行业提出了新的挑战：如何在借鉴开源成果的同时，保持技术透明度并建立起真正的竞争壁垒？

对于关注AI资讯和行业动态的读者来说，识别这类“换壳”模型需要敏锐的技术观察力。如果你想了解更多关于人工智能、AGI、LLM以及最新的AI新闻，欢迎持续关注 aigc.bar，我们为你提供最前沿的AI日报和深度解读，助你在AI浪潮中掌握先机。

结语：透明度才是AI发展的基石

乐天的这次尝试虽然在日语本地化上做了一定工作，但其在公关上的失策却给品牌形象抹了黑。在AI领域，开源精神的核心不仅是代码的分享，更是对贡献者的尊重和技术的透明。

未来，我们可能会看到更多基于DeepSeek或其他顶尖架构的变体模型出现。这本身是AI生态繁荣的体现，但前提是，请给开发者和用户一份诚实的交代。

获取更多ChatGPT、Claude以及全球大模型API的最新资讯，请访问 aigc.bar。