【无标题】

AGI大模型老王

1027人浏览 · 2025-07-09 11:18:03

AGI大模型老王 · 2025-07-09 11:18:03 发布

当“原创”的战旗在AI领域猎猎作响，华为盘古大模型却突然陷入一场迷雾重重的争议漩涡。

从否认抄袭阿里的铿锵回应，到内部员工自曝套壳、续训、洗水印的惊人爆料，这场风波不仅撕裂了科技大厂的体面，更撕开了AI行业狂飙突进背后的隐秘角落。

在这个算力与算法主宰的时代，AI大模型早已超越单纯的技术竞争，演变成一场关乎尊严与未来的战役。

这场风波，不仅是华为盘古的“至暗时刻”，更是整个AI行业必须面对的灵魂叩问：当创新的边界日益模糊，当商业利益与技术理想激烈碰撞，该如何守护科技发展的底线？

01.盘古大模型被爆抄袭！华为又被黑？

在科技飞速发展的当下，AI大模型已然成为科技领域的核心竞争力。

2025年6月30日，华为正式开源盘古70亿参数的稠密模型、盘古ProMoE720亿参数的混合专家模型，同时开放基于昇腾AI平台的模型推理技术，旨在推动大模型技术的研究与创新发展，加速推进人工智能在千行百业的应用与价值创造。

然而，仅仅几天后，风云突变。

7月4日，一位自称为哥斯达黎加大学的韩国学生在GitHub上发布了一份技术分析报告，将华为盘古大模型推向了舆论的风口浪尖。

报告通过“LLM-Fingerprint”（大语言模型指纹）技术对比，指出盘古ProMoE模型与阿里通义千问Qwen-2.514B模型在注意力参数分布上的平均相关性高达0.927，远超正常范围，这一数据暗示盘古模型可能并非独立开发。

面对质疑，华为迅速做出回应。7月5日下午，华为旗下AI大语言模型盘古ProMoE技术开发团队“诺亚方舟实验室”发布声明，坚定否认抄袭指控。

▲ 图源：盘古

声明强调盘古ProMoE开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来。

在架构设计、技术特性等方面做了关键创新，是全球首个面向昇腾硬件平台设计的同规格混合专家模型，创新性地提出了分组混合专家模型（MoGE）架构，有效解决了大规模分布式训练的负载均衡难题，提升训练效率。

同时，华为也坦诚表示，盘古ProMoE开源模型部分基础组件的代码实现参考了业界开源实践，涉及其他开源大模型的部分开源代码。

02.盘古“员工”自曝内幕，争议升级

就在大众以为抄袭风波随着华为的声明逐渐平息之时，7月6日凌晨，一位自称是盘古大模型团队的员工在网络上发布了一篇长文，再次将华为盘古大模型推向了舆论的深渊。

这位员工在长文中详细地揭露了团队内部一些不为人知的操作，其中“套壳”“续训”“洗水印”等内容格外刺眼。

他表示，在盘古大模型研发初期，团队面临着严峻的算力限制，尽管成员们付出了诸多努力，尝试了各种方法，但模型训练的效果始终不尽如人意。

▲ 图源：爆料文章截图

随着时间的推移，内部对项目的质疑声日益高涨，领导也不断施压，要求尽快取得成果。在巨大的压力之下，小模型实验室开始剑走偏锋，多次采用套壳竞品模型的方式来试图缩短研发周期、获取短期成果，而领导层对此竟采取了默许的态度。

根据他的爆料，盘古ProMoE模型实际上是使用Qwen1.5110B进行续训，通过加层、扩增ffn维度，并添加盘古pi论文的一些机制，才凑够了大约135B的参数。

为了消除模型中可能存在的来自阿里通义千问的“痕迹”，也就是所谓的“洗水印”，团队甚至采取了一些极端手段，包括故意训练脏数据。

此外，该员工还提到团队曾套壳DeepSeekv3进行续训，通过冻住DeepSeek加载的参数来进行训练，以达到伪装模型来源的目的。

对此，一直支持华为的网友认为，这可能是一场有预谋的抹黑行动。毕竟华为在国际上一直面临着来自国外势力的打压，在国内也可能会因为市场竞争等因素而遭遇一些恶意中伤。

仅仅凭借一位自称是员工的爆料，还不足以坐实这些指控，因为确实没有其他确凿的证据能够相互印证。

截至目前，华为方面尚未对这位员工的自曝内容发表任何声明。

03.AI大模型领域竞争白热化，砸重金抢人了！

2025年的AI大模型领域已然成为了一片竞争激烈的“战场”，硝烟弥漫，战火熊熊。

在这场没有硝烟的战争中，众多大厂纷纷下场，投入了大量的资金、人力和物力，展开了一场全方位的较量。

技术研发无疑是竞争的核心战场之一。只有拥有最先进的技术，才能在这场竞赛中占据优势。

为了提高模型的语言理解和生成能力，大厂研发团队不断尝试新的神经网络结构，引入更多的训练数据，运用更高效的训练算法，力求让模型能够更准确地理解人类语言，生成更加自然、流畅、富有逻辑的文本。

同时，市场拓展也是大厂们竞争的重要方向。他们积极与各行各业合作，将AI大模型应用到实际业务场景中，推动产业升级和创新发展。

人才争夺更是这场竞争中的关键环节。AI大模型领域的发展离不开顶尖人才的支持，因此，大厂们纷纷开出高薪、提供优厚的福利待遇和广阔的发展空间，吸引全球范围内的优秀人才加入。

▲ 图源：微博

他们不惜重金挖角，甚至为了争夺一名关键人才而展开激烈的竞争。一个优秀的AI人才，不仅能够为企业带来先进的技术和创新的思维，还能带动整个团队的发展，提升企业的核心竞争力。

所以，在这场人才争夺战中，谁能吸引到更多的优秀人才，谁就能在竞争中占据先机。

大厂对AI大模型的执着，实际上暗藏商业理性与技术情怀的双重逻辑。

商业层面，数字化浪潮催生万亿级市场需求，提前卡位即是抢占未来发展的战略高地；而更深层的驱动力，源自科技企业对"技术向善"的本能坚守。

当AI帮助视障者"看见"文字，助力语言障碍者顺畅沟通，甚至在灾害来临前发出预警，我们便懂得，这些重金投入不仅是商业布局，更是科技对时代的作答。

站在2025年的时间坐标上，AI大模型的竞争早已超越技术比拼，演变为一场关于人类未来的集体思考。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】