盘古Qwen抄袭风波深度解析 | AI资讯尽在AIGC.bar

type
status
date
slug
summary
tags
category
icon
password
网址

引言

近期,国内人工智能领域波澜再起。华为雄心勃勃地开源其盘古大模型系列后,一份来自GitHub的技术报告直指其核心模型与阿里巴巴的通义千问(Qwen)存在惊人的“高相似度”,迅速引爆了一场关于“抄袭”的激烈争论。这场风波不仅牵动着两大科技巨头的神经,也引发了整个行业对大模型(LLM)原创性、开源协作以及技术评判标准的深刻反思。这究竟是一场有理有据的技术指控,还是一次基于误解的乌龙事件?本文将为你层层剥茧,深入解读这场备受关注的AI新闻事件。

争议的起点:一纸“高相似度”报告

事件的导火索源于一个名为@HonestAGI的研究者在GitHub上发布的报告。报告核心论点是:华为盘古Pro MoE模型与阿里Qwen-2.5 14B模型在注意力参数分布上,平均相关性高达0.927。
在深度学习领域,这是一个极不寻常的数值。由于大模型的训练过程充满了随机性——从数据投喂顺序到权重初始化,再到复杂的优化算法,理论上两个独立训练的模型,即便架构相似,其内部参数也应呈现显著差异。业内公认,不同模型间的此类参数相关性通常不会超过0.7。如此之高的相似度,自然让“抄袭”或“模型窃取”的疑云笼罩在盘古之上,成为各大AI资讯平台的热议焦点。这不仅仅是一个数字,它直接挑战了盘古大模型宣称的独立研发与创新的根基。

技术攻防:相似度指标的科学性之辩

面对突如其来的指控,自称盘古大模型团队的人员迅速在GitHub上进行了反击。他们并未直接否认该数值,而是对测试方法本身的科学性提出了质疑。
盘古团队复现了该测试方法,并将其应用于其他主流模型对比,得出了同样惊人的结果: 百川2-13B vs. Qwen1.5-14B = 0.87 百川2-13B vs. 盘古-72B-a16b = 0.84 * 百川2-13B vs. Qwen2.5-14B = 0.86
这些数据显示,HonestAGI所采用的评估指标,似乎能轻易地在不同模型间找到“高度相似”的证据。盘古团队认为,这恰恰说明该指标缺乏足够的区分度和实际意义,不能作为判定抄袭的依据。然而,HonestAGI方面则回应称,盘古模型依然是相似度最高的,其报告只是初步警示,后续还有更多维度的分析。这场围绕评测方法论的“技术攻防战”,凸显了当前人工智能领域在模型原创性鉴定方面缺乏统一、公认标准的困境。

“实锤”还是误读?开源代码声明的真相

在技术争论之外,网友在盘古Pro模型的开源代码文件中发现了一条看似“实锤”的证据。其“Open Source Software Notice”中明确包含了“Copyright 2024 The Qwen team, Alibaba Group and the HuggingFace Team. All rights reserved.”的字样。
这是否意味着盘古直接复制了Qwen的代码?事实并非如此。业内人士指出,这其实是一份标准的开源合规声明。它表明盘古大模型在开发过程中,使用了由Qwen团队和HuggingFace团队共同开发的“transformers”开源组件,并严格遵守了其“Apache License 2.0”开源协议。该协议允许任何使用者自由地使用、修改、分发甚至商用这些代码,前提是保留原始的版权声明。
因此,这份声明非但不是抄袭的证据,反而证明了盘古团队遵守了开源社区的规则。在当今大模型和AGI的开发中,站在巨人的肩膀上,利用优秀的开源组件来构建自己的系统,是一种高效且普遍的通行做法。将遵守开源协议的行为误读为抄袭,反映了部分公众对开源软件文化缺乏深入了解。

官方定调:华为诺亚方舟实验室的正式回应

随着舆论发酵,7月5日,负责盘古大模型研发的华为诺亚方舟实验室发布了官方声明,对事件进行了最终定调。
声明核心要点如下: 1. 自主研发,非二次训练:盘古Pro MoE是基于华为自家的昇腾硬件平台开发、训练的基础大模型,并非在其他厂商模型基础上进行增量训练而来。 2. 架构创新:盘古模型在架构设计上进行了关键创新,如全球首个面向昇腾硬件设计的MoGE(分组混合专家模型)架构,旨在提升大规模分布式训练的效率和稳定性。 3. 承认参考,遵守开源:官方承认,模型部分基础组件的代码实现参考了业界优秀的开源实践,并涉及了其他开源模型的代码。但强调,所有使用行为都严格遵循了开源许可证的要求,并在代码文件中清晰标注了版权声明,这符合开源协作精神。

结论:一场关于开源、创新与标准的深刻探讨

综合来看,目前并没有确凿证据表明华为盘古大模型“抄袭”了阿里通义千问。HonestAGI的指控虽然在技术上引发了有趣的讨论,但其核心评测方法的可靠性尚待同行评审的进一步验证。而所谓的代码“实锤”,则更多是一场对开源文化的误读。
这场风波不仅是两大科技巨头的技术碰撞,更是对整个AI行业开源精神和创新边界的一次深刻探讨。它提醒我们,在追求AGI的道路上,真正的创新往往是建立在开放协作的基础之上。同时,也亟需建立更加科学、公正、透明的评测体系,以避免不必要的争议,让行业焦点回归到技术本身的进步与突破上。
想要获取更多前沿的AI资讯AI日报,深入了解大模型Prompt技巧以及AI变现的最新动态,欢迎访问AI门户网站 AIGC.bar (https://aigc.bar),掌握第一手人工智能信息。
Loading...

没有找到文章