盘古Qwen抄袭风波深度解析 | AI资讯尽在AIGC.bar

type

status

date

slug

summary

引言

近期，国内人工智能领域波澜再起。华为雄心勃勃地开源其盘古大模型系列后，一份来自GitHub的技术报告直指其核心模型与阿里巴巴的通义千问（Qwen）存在惊人的“高相似度”，迅速引爆了一场关于“抄袭”的激烈争论。这场风波不仅牵动着两大科技巨头的神经，也引发了整个行业对大模型（LLM）原创性、开源协作以及技术评判标准的深刻反思。这究竟是一场有理有据的技术指控，还是一次基于误解的乌龙事件？本文将为你层层剥茧，深入解读这场备受关注的AI新闻事件。

争议的起点：一纸“高相似度”报告

事件的导火索源于一个名为@HonestAGI的研究者在GitHub上发布的报告。报告核心论点是：华为盘古Pro MoE模型与阿里Qwen-2.5 14B模型在注意力参数分布上，平均相关性高达0.927。

在深度学习领域，这是一个极不寻常的数值。由于大模型的训练过程充满了随机性——从数据投喂顺序到权重初始化，再到复杂的优化算法，理论上两个独立训练的模型，即便架构相似，其内部参数也应呈现显著差异。业内公认，不同模型间的此类参数相关性通常不会超过0.7。如此之高的相似度，自然让“抄袭”或“模型窃取”的疑云笼罩在盘古之上，成为各大AI资讯平台的热议焦点。这不仅仅是一个数字，它直接挑战了盘古大模型宣称的独立研发与创新的根基。

技术攻防：相似度指标的科学性之辩

面对突如其来的指控，自称盘古大模型团队的人员迅速在GitHub上进行了反击。他们并未直接否认该数值，而是对测试方法本身的科学性提出了质疑。

盘古团队复现了该测试方法，并将其应用于其他主流模型对比，得出了同样惊人的结果： 百川2-13B vs. Qwen1.5-14B = 0.87 百川2-13B vs. 盘古-72B-a16b = 0.84 * 百川2-13B vs. Qwen2.5-14B = 0.86

这些数据显示，HonestAGI所采用的评估指标，似乎能轻易地在不同模型间找到“高度相似”的证据。盘古团队认为，这恰恰说明该指标缺乏足够的区分度和实际意义，不能作为判定抄袭的依据。然而，HonestAGI方面则回应称，盘古模型依然是相似度最高的，其报告只是初步警示，后续还有更多维度的分析。这场围绕评测方法论的“技术攻防战”，凸显了当前人工智能领域在模型原创性鉴定方面缺乏统一、公认标准的困境。

“实锤”还是误读？开源代码声明的真相

因此，这份声明非但不是抄袭的证据，反而证明了盘古团队遵守了开源社区的规则。在当今大模型和AGI的开发中，站在巨人的肩膀上，利用优秀的开源组件来构建自己的系统，是一种高效且普遍的通行做法。将遵守开源协议的行为误读为抄袭，反映了部分公众对开源软件文化缺乏深入了解。

官方定调：华为诺亚方舟实验室的正式回应

随着舆论发酵，7月5日，负责盘古大模型研发的华为诺亚方舟实验室发布了官方声明，对事件进行了最终定调。

声明核心要点如下： 1. 自主研发，非二次训练：盘古Pro MoE是基于华为自家的昇腾硬件平台开发、训练的基础大模型，并非在其他厂商模型基础上进行增量训练而来。 2. 架构创新：盘古模型在架构设计上进行了关键创新，如全球首个面向昇腾硬件设计的MoGE（分组混合专家模型）架构，旨在提升大规模分布式训练的效率和稳定性。 3. 承认参考，遵守开源：官方承认，模型部分基础组件的代码实现参考了业界优秀的开源实践，并涉及了其他开源模型的代码。但强调，所有使用行为都严格遵循了开源许可证的要求，并在代码文件中清晰标注了版权声明，这符合开源协作精神。

结论：一场关于开源、创新与标准的深刻探讨

综合来看，目前并没有确凿证据表明华为盘古大模型“抄袭”了阿里通义千问。HonestAGI的指控虽然在技术上引发了有趣的讨论，但其核心评测方法的可靠性尚待同行评审的进一步验证。而所谓的代码“实锤”，则更多是一场对开源文化的误读。

这场风波不仅是两大科技巨头的技术碰撞，更是对整个AI行业开源精神和创新边界的一次深刻探讨。它提醒我们，在追求AGI的道路上，真正的创新往往是建立在开放协作的基础之上。同时，也亟需建立更加科学、公正、透明的评测体系，以避免不必要的争议，让行业焦点回归到技术本身的进步与突破上。

想要获取更多前沿的AI资讯和AI日报，深入了解大模型、Prompt技巧以及AI变现的最新动态，欢迎访问AI门户网站 AIGC.bar (https://aigc.bar)，掌握第一手人工智能信息。