日本最强AI竟是DeepSeek马甲?Rakuten AI 3.0翻车现场深度解析 | AI资讯

type
status
date
slug
summary
tags
category
icon
password
网址
notion image

引言:日本“国产”AI光环下的尴尬真相

在人工智能全球竞赛中,各国都在不遗余力地推出具有代表性的“国产大模型”。3月17日,日本国民级电商巨头乐天(Rakuten)集团高调发布了其号称“日本国内最大规模、最高性能”的AI模型——Rakuten AI 3.0。官方宣传称,该模型拥有约7000亿参数,专门针对日语进行了深度优化,并获得了日本政府相关部门的巨额补助。
然而,这场充满民族自豪感的发布会仅仅过去了不到12小时,剧情就发生了戏剧性的反转。随着技术人员在Hugging Face上扒开该模型的底层配置文件,一个令人啼笑皆非的真相浮出水面:这款所谓的“日本最强AI”,其内核竟然是来自中国的开源模型DeepSeek V3。

证据确凿:config.json里的“不打自招”

这次“翻车”事件的发现过程几乎没有技术门槛。按照开源惯例,乐天将Rakuten AI 3.0的模型权重上传到了Hugging Face官方仓库。当开发者点开该仓库的config.json配置文件时,第一行代码就让所有人沉默了。
architectures(架构)字段中,清晰地写着:DeepseekV3ForCausalLM。而在model_type字段中,则直接标明了deepseek_v3
不仅如此,详细的参数配置也与DeepSeek V3如出一辙: * 隐藏层大小(hidden_size):7168 * 中间层大小(intermediate_size):18432 * 隐藏层数(numhiddenlayers):61 * 路由专家数(nroutedexperts):256 * 词汇表大小(vocab_size):129280
这种参数层面的高度一致,坐实了Rakuten AI 3.0本质上就是DeepSeek V3的“微调版”。乐天官方宣称的“7000亿参数”,也正对应了DeepSeek V3那6810亿的总参数量。

合规但不体面:开源协议与品牌宣传的博弈

从法律和技术伦理角度来看,乐天的做法其实并未违反规则。DeepSeek V3采用的是极其宽松的开源许可,允许商业使用和二次开发。在业界,基于优秀的开源模型(如Llama或DeepSeek)进行垂直领域的微调(Fine-tuning)是提高研发效率的通行做法。
乐天在新闻稿中也含糊地提到“基于开源社区最优秀的模型开发”,这在技术逻辑上是站得住脚的。然而,争议的核心在于信息披露的不对称
在所有的对外宣传、媒体采访以及官方PR稿件中,乐天从未主动提及“DeepSeek”字样。这种刻意淡化原模型贡献、试图将其包装成“完全自主研发”的行为,在社交媒体上引发了日本网友的集体吐槽。许多人调侃道:“日本终于进入了用中国AI冒充国产AI的时代。”

讽刺的现实:一边严厉封禁,一边“真香”换壳

此次事件最具有讽刺意味的地方在于日本社会对DeepSeek的复杂态度。
自2025年初DeepSeek在全球范围内爆火以来,日本媒体将其称为“AI界的黑船事件”,意指其对日本科技界造成了巨大的外部冲击。随后,日本政府和多家巨头企业表现出了极高的警惕性: * 日本数字大臣曾公开警告公务员谨慎使用DeepSeek,担心个人信息保护问题。 * 丰田汽车、三菱重工等传统工业巨头明确禁止员工在工作设备上使用DeepSeek。 * 软银等科技公司也限制了内部对DeepSeek的访问。
然而,就在官方和企业层层设防的同时,日本顶尖的互联网企业却在核心AI产品中直接套用了DeepSeek的架构。这种“身体很诚实”的表现,侧面印证了中国大模型在算法效率和性能上的领先地位。

深度思考:AI大模型时代的“拿来主义”

Rakuten AI 3.0事件反映了当前全球AI竞赛中的一个现状:大模型的底层架构正在向少数几个顶尖开源模型收敛。对于后来者而言,从零开始训练一个千亿参数模型的成本极高,且未必能达到开源模型的水平。
因此,越来越多的企业选择“站在巨人的肩膀上”。但这同时也给行业提出了新的挑战:如何在借鉴开源成果的同时,保持技术透明度并建立起真正的竞争壁垒?
对于关注AI资讯和行业动态的读者来说,识别这类“换壳”模型需要敏锐的技术观察力。如果你想了解更多关于人工智能、AGI、LLM以及最新的AI新闻,欢迎持续关注 aigc.bar,我们为你提供最前沿的AI日报和深度解读,助你在AI浪潮中掌握先机。

结语:透明度才是AI发展的基石

乐天的这次尝试虽然在日语本地化上做了一定工作,但其在公关上的失策却给品牌形象抹了黑。在AI领域,开源精神的核心不仅是代码的分享,更是对贡献者的尊重和技术的透明。
未来,我们可能会看到更多基于DeepSeek或其他顶尖架构的变体模型出现。这本身是AI生态繁荣的体现,但前提是,请给开发者和用户一份诚实的交代。
获取更多ChatGPT、Claude以及全球大模型API的最新资讯,请访问 aigc.bar
Loading...

没有找到文章