华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

2025年6月30日,华为正式宣布开源盘古7B参数的稠密模型、盘古Pro MoE 72B混合专家模型和基于昇腾的模型推理技术。随后一项由@HonestAGI 发布于GitHub的针对盘古大模型的研究引发业界热议,该研究的作者认为,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴发布的通义千问Qwen-2.5 14B模型在参数结构上存在高相似度。

HonestAGI 通过测试比较称,Pangu Pro MoE模型与Qwen-2.5 14B模型在注意力参数分布上的平均相关性高达0.927,远超其他模型对比的正常范围(业内同类模型对比通常不超过0.7)。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

由于深度学习模型的训练具有高度随机性,涉及复杂的数据采样、权重初始化及优化路径。两个模型在众多注意力参数上呈现近乎一致的分布,其自然发生的概率极低。因此,这种极高的相似度,立即引发其涉嫌抄袭的质疑。

随后,有自称是盘古大模型团队的人在GitHub上进行了回应,否认抄袭指控,并且认为该作者的评估方法不科学。

该用户表示,使用论文中描述的方法,评估了以下模型比较:

pangu-72b-a16b vs. Qwen2.5-14b = 0.92baichuan2-13b vs. Qwen1.5-14b = 0.87baichuan2-13b vs. pangu-72b-a16b = 0.84baichuan2-13b vs. Qwen2.5-14b = 0.86

可以看到不同其他相近参数规模的模型在该评估方法下也得到了与Qwen-2.5 14B模型高度相似的结果。这表明该论文和指标缺乏实际意义。盘古团队进一步并重申没有抄袭。

对于该回应,HonestAGI 表示,其无法信服盘古大模型团队的说法。HonestAGI 称,盘古仍然显示出最高的相似度,对吧?我们很高兴看到您成功复现了我们的结果!事实上,任何分类问题都有一个阈值来识别决策边界(例如,本例中疑似值为0.9)。这主要是一个用于初步比较的工具,而盘古‘不幸地’在我们开始进一步调查之前触发了这个警告信号。我们并非仅仅基于注意力参数就做出判断。这只是动机。……

随后,HonestAGI 还提供了 Qwen 和 Hunyuan A13B 之间的比,结果显示二者在不同层级上展现出截然不同的内部模式,这表明它们拥有截然不同的架构和学习到的表征。显然,HonestAGI提供该对比数据是想说明其测试方法没有问题。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

不过,目前HonestAGI似乎已经下线了之前关于盘古大模型的研究报告。但是,HonestAGI 在最新的回应中表示,我们计划在论文最终定稿并提交所有代码后,将其提交给同行评审会议(可能是 ICLR 或之后的会议?)。

另外,值得注意但是,通过查询盘古大模型团队官方发布在国内代码托管平台Gitcode(类似国外的Github)的盘古Pro大模型代码,可以发现其'Open Source Software Notice当中的赫然出现了关于transformers组件的版权声明Copyright notice:Copyright 2024 The Qwen team, Alibaba Group and the HuggingFace Team. All rights reserved. 显然这段说明的意思是,其所用到的transformers组件的版权所有人是Qwen团队、阿里巴巴集团和HuggingFace团队。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

需要指出的是,该代码是由Ascend Tribe——盘古大模型团队官方发布,并不是其他第三方进行发布的。由此也有不少网友认为这是实锤抄袭的证据。

不过,业内人士表示,这是一份标准的开源声明,当盘古大模型团队使用了第三方开发的开源软件时,根据开源许可要求,是必须需要向用户说明的法律义务。而在这份声明当中,只能表明盘古大模型当中用了阿里巴巴Qwen团队 和 HuggingFace共同开发的transformers组件,并且使用的是Apache License 2.0协议。该协议它允许任何人自由地使用、修改和分发该软件,甚至用于商业产品中。所以,这份声明只反应了盘古大模型团队用了一些开源代码,并且遵守了开源协议,并不能证明抄袭。

盘古大模型团队正式回应

7月5日下午16:59分,隶属于华为的负责开发盘古大模型的诺亚方舟实验室发布声明对于抄袭指控进行了官方回应。

诺亚方舟实验室表示,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来,在架构设计、技术特性等方面做了关键创新,是全球首个面向昇腾硬件平台设计的同规格混合专家模型,创新性地提出了分组混合专家模型(MoGE)架构,有效解决了大规模分布式训练的负载均衡难题,提升训练效率。

不过,诺亚方舟实验室也承认,盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码。我们严格遵循开源许可证的要求,在开源代码文件中清晰标注开源代码的版权声明。这不仅是开源社区的通行做法,也符合业界倡导的开源协作精神。我们始终坚持开放创新,尊重第三方知识产权,同时提倡包容、公平、开放、团结和可持续的开源理念。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

此外,芯智讯发现,有百度贴吧网友爆料称,负责盘古大模型的开发的诺亚方舟负责人王云鹤在内网也针对此事做了回应,回应内容的核心是两个:1、盘古大模型是基于昇腾芯片进行训练的,与Qwen所用的训练硬件是不同的;2、盘古大模型当中所使用的Llama和Qwen的组件都是已经开源的,并不是抄袭。

华为盘古大模型被质疑“抄袭”阿里Qwen:官方回应

总结来看,目前尚无证据证实盘古大模型存在抄袭阿里Qwen的实锤证据,HonestAGI 所发布的质疑论文所采用的测试方法的可靠性也有待进一步验证,毕竟其并未完全公开其测试代码,更何况HonestAGI 已经下线了之前的质疑论文。至于盘古大模型当中确实有采用Qwen的开源代码,但这部分的代码本就是开源代码,盘古大模型团队的相关的声明做法也是合规的,只能说盘古大模型并不是从零起步的绝对原创,如果只是用了部分开源组件,也并不属于抄袭。

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/75686.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年7月6日 下午3:00
下一篇 2025年7月6日 下午3:00

相关推荐

  • 蔚来拆分芯片部门 可对外承接订单:安徽神玑技术公司成立

    6月20日消息,近日,多家媒体报道蔚来计划为旗下芯片业务引入战略投资者,并成立独立项目实体。 目前,该项目实体已完成工商注册,名为安徽神玑技术有限公司,注册地址与蔚来中国总部一致,法定代表人为蔚来芯片及智能硬件负责人白剑。 工商信息显示,该公司注册资本1000万元,业务范围涵盖芯片设计与销售。 报道称,蔚来计划向战略投资者出让少量股权,但仍保持对项目实体的控…

    2025年6月20日
    12400
  • 超7000辆沃尔沃插混汽车宣布召回!官方:解决之前不要充电

    3月27日消息,沃尔沃在美国宣布召回超过7000辆插电式混合动力汽车。 召回原因是这些车辆在停放并充满电后可能发生短路,尤其是在夜间停放在车库时存在严重的起火风险。 鉴于此隐患,沃尔沃建议车主在问题解决前不要给车辆充电。 此次召回涉及7483辆2020至2022年款的S90、V90,以及S60、V60、XC60和XC90车型。 沃尔沃调查发现问题源于电池模块…

    2025年3月27日
    10200
  • 小米16系列三剑齐发 卢伟冰:变化非常大

    8月21日消息,博主数码闲聊站表示,小米16系列已经备案,这次入网备案的机型共有3款,新品将在9月份登场。 据爆料,小米16系列将会同时推出小米16和小米16 Pro,其中小米16 Pro有6.3英寸和6.8英寸两种尺寸,这是小米史上变化最大的数字系列(超大杯小米16 Ultra将在后续单独发布)。 其中6.3英寸版本的小米16 Pro综合配置看齐6.8英寸…

    2025年8月21日
    10400
  • 宏碁推出Chromebook Tab 311平板:军工级耐用 8000mAh大电池

    1月25日消息,宏碁推出了新款Chromebook Tab 311平板电脑,主打耐用、便携和实用功能,能高效处理学习和日常任务。 据悉,这款全新平板搭载了10.95英寸的IPS高清触摸显示屏,分辨率1920 x 1200。在存储与内存配置上,它提供了最高8GB的RAM,同时配备了128GB的内部存储空间,并支持通过MicroSD卡扩展至2TB。 性能方面,C…

    2025年1月25日
    17900
  • 女演员突发疾病成植物人昏迷3个月苏醒 本人称还想继续拍戏

    4月9日消息,日前,中国内地女演员肖妍倪发布康复视频引发网友关注。 据媒体报道,肖妍倪2021年9月突发心脏骤停,送医后变成植物人,在家人照顾下,昏迷3个月的肖妍倪苏醒,但身体留下严重后遗症,一直坚持康复训练。 肖妍倪称,她平时觉得身体很好,但疾病的发生毫无征兆,诊断结果是缺血缺氧性脑病。 从肖妍倪发布的视频来看,她现在可缓慢自主行走、自己穿衣服,但左手没有…

    2025年4月9日
    21600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信