华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴发布的通义千问Qwen-2.5 14B模型在参数结构上存在高相似度。

HonestAGI 通过测试比较称,Pangu Pro MoE模型与Qwen-2.5 14B模型在注意力参数分布上的平均相关性高达0.927,远超其他模型对比的正常范围(业内同类模型对比通常不超过0.7)。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

由于深度学习模型的训练具有高度随机性,涉及复杂的数据采样、权重初始化及优化路径。两个模型在众多注意力参数上呈现近乎一致的分布,其自然发生的概率极低。因此,这种极高的相似度,立即引发其涉嫌抄袭的质疑。

随后,有自称是盘古大模型团队的人在GitHub上进行了回应,否认抄袭指控,并且认为该作者的评估方法不科学。

该用户表示,使用论文中描述的方法,评估了以下模型比较:

pangu-72b-a16b vs. Qwen2.5-14b = 0.92baichuan2-13b vs. Qwen1.5-14b = 0.87baichuan2-13b vs. pangu-72b-a16b = 0.84baichuan2-13b vs. Qwen2.5-14b = 0.86

可以看到不同其他相近参数规模的模型在该评估方法下也得到了与Qwen-2.5 14B模型高度相似的结果。这表明该论文和指标缺乏实际意义。盘古团队进一步并重申没有抄袭。

对于该回应,HonestAGI 表示,其无法信服盘古大模型团队的说法。HonestAGI 称,盘古仍然显示出最高的相似度,对吧?我们很高兴看到您成功复现了我们的结果!事实上,任何分类问题都有一个阈值来识别决策边界(例如,本例中疑似值为0.9)。这主要是一个用于初步比较的工具,而盘古‘不幸地’在我们开始进一步调查之前触发了这个警告信号。我们并非仅仅基于注意力参数就做出判断。这只是动机。……

随后,HonestAGI 还提供了 Qwen 和 Hunyuan A13B 之间的比,结果显示二者在不同层级上展现出截然不同的内部模式,这表明它们拥有截然不同的架构和学习到的表征。显然,HonestAGI提供该对比数据是想说明其测试方法没有问题。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

不过,目前HonestAGI似乎已经下线了之前关于盘古大模型的研究报告。但是,HonestAGI 在最新的回应中表示,我们计划在论文最终定稿并提交所有代码后,将其提交给同行评审会议(可能是 ICLR 或之后的会议?)。

另外,值得注意但是,通过查询盘古大模型团队官方发布在国内代码托管平台Gitcode(类似国外的Github)的盘古Pro大模型代码,可以发现其'Open Source Software Notice当中的赫然出现了关于transformers组件的版权声明Copyright notice:Copyright 2024 The Qwen team, Alibaba Group and the HuggingFace Team. All rights reserved. 显然这段说明的意思是,其所用到的transformers组件的版权所有人是Qwen团队、阿里巴巴集团和HuggingFace团队。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

需要指出的是,该代码是由Ascend Tribe——盘古大模型团队官方发布,并不是其他第三方进行发布的。由此也有不少网友认为这是实锤抄袭的证据。

不过,业内人士表示,这是一份标准的开源声明,当盘古大模型团队使用了第三方开发的开源软件时,根据开源许可要求,是必须需要向用户说明的法律义务。而在这份声明当中,只能表明盘古大模型当中用了阿里巴巴Qwen团队 和 HuggingFace共同开发的transformers组件,并且使用的是Apache License 2.0协议。该协议它允许任何人自由地使用、修改和分发该软件,甚至用于商业产品中。所以,这份声明只反应了盘古大模型团队用了一些开源代码,并且遵守了开源协议,并不能证明抄袭。

盘古大模型团队正式回应

7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于抄袭指控进行了官方回应。

诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型(MoGE)架构,有效解决了大规模分布式训练的负载均衡难题,提升训练效率。

不过,诺亚方舟实验室也承认,盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

此外,芯智讯发现,有百度贴吧网友爆料称,负责盘古大模型的开发的诺亚方舟负责人王云鹤在内网也针对此事做了回应,回应内容的核心是两个:1、盘古大模型是基于昇腾芯片进行训练的,与Qwen所用的训练硬件是不同的;2、盘古大模型当中所使用的Llama和Qwen的组件都是已经开源的,并不是抄袭。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

总结来看,目前尚无证据证实盘古大模型存在抄袭阿里Qwen的实锤证据,HonestAGI 所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证,毕竟其并未完全公开其测试代码,更何况HonestAGI 已经下线了之前的质疑论文。至于盘古大模型当中确实有采用Qwen的开源代码,但这部分的代码本就是开源代码,盘古大模型团队的相关的声明做法也是合规的,只能说盘古大模型并不是从零起步的绝对原创,如果只是用了部分开源组件,也并不属于抄袭。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/75686.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年7月6日 下午3:00
下一篇 2025年7月6日 下午3:00

相关推荐

  • 核废料处理利器!我国首台万瓦级氦制冷机研制成功

    4月28日消息,据报道,中国科学院理化技术研究所联合中山低温研究院等单位,近日成功研制出国内首台万瓦级氦制冷机,标志着我国在超大型低温制冷装备领域取得重大突破。 该制冷机是我国科学家研制成功的首台超大型氦低温制冷机,将应用于国家重大科技基础设施加速器驱动嬗变研究装置,为处理核废料提供低温环境。 这台具有完全自主知识产权的制冷机,在液氦温区(零下269摄氏度)…

    2025年4月28日
    10300
  • 研究表明人类智力急剧下降:精神集中能力遭到侵蚀

    3月24日消息,据报道,根据美国密歇根大学的一项长期研究,人类智力在本世纪10年代中期达到顶峰后,开始呈现下降趋势,且智力水平正在急剧下滑。 研究指出,无论是哪个年龄段的人群,其注意力集中能力、逻辑推理能力、问题解决能力、信息处理能力以及批判性思维等基本认知能力都在迅速减弱。 尽管近年来的疫情对人类的认知能力产生了一定影响,但研究显示,这一智力下降的趋势早在…

    2025年3月24日
    14000
  • 国内首次!小米剧透雷军将有重大发布:几nm还不能说

    5月18日消息,17日晚间,小米集团总裁卢伟冰开启直播,剧透了15周年战略新品发布的部分细节,包括玄戒SoC、小米YU7等重磅新品。 据卢伟冰透露,使用玄戒O1芯片的产品,不只有手机。言外之意,还有其它新品采用这款自研处理器。 不过,卢伟冰没有透露此次小米自研手机芯片的具体工艺。对于该款芯片是几nm的制程,他表示目前还不能说。 卢伟冰表示,之前雷总也说过,芯…

    2025年5月18日
    27800
  • 曝京东大型折扣超市将落地:面积可达5000平米

    8月5日消息,据媒体报道,近日,京东在下沉市场又爆出新动作,8月份将在江苏宿迁、河北涿州两地五店同开,落地京东折扣超市。 区别于市场上常见的小型、SKU有限的折扣店模式,京东折扣超市依托其强大的供应链能力,采用大店型、多SKU策略。 以首家涿州店为例,其经营面积达5000平方米,精选超过5000款高性价比民生商品,售价普遍低于市场常规水平。 业内人士分析认为…

    2025年8月5日
    14400
  • 俄一女子蹦极后返回起跳点自拍时不慎坠亡:最后画面曝光

    9月2日消息,当地时间8月30日,俄罗斯一女子蹦极庆祝自己45岁生日,返回起跳点自拍时意外滑倒坠亡,她生命中最后的画面曝光。 据悉,该女子名为伊丽莎白・古什奇纳(Elizaveta Gushchina),是一名极限运动爱好者,当天她在巴甫洛夫斯克的一座废弃锅炉房烟囱处蹦极庆祝自己的生日。 成功完成蹦极后,她未系安全带返回约88米高的烟囱顶部与儿…

    2025年9月2日
    42800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信