全球大模型开源战略的动因、影响与应对策略探析
谭俊 程莹 刘志鹏
(中国信息通信研究院政策与经济研究所,北京 100191)
摘 要 阿里巴巴、深度求索(DeepSeek)的开源路线引发全球开源浪潮,欧盟在巴黎人工智能行动峰会明确释放支持开源发展的信号,谷歌、微软纷纷开源前沿多模态模型,OpenAI同样释放将开源大语言模型的信号。总体来看,全球领先大模型企业纷纷加快开源布局,有利于降低AI领域创新壁垒,但开源风险成为短期重要未决议题;开源助力抑制美国拉大技术代差,欧盟借此寻求技术自主权,我国开源大模型出海机遇与挑战并存。对此,建议我国筑牢开源生态根基,构建安全可靠的产业体系,把握国际开源技术扩散的窗口契机,进一步拓宽人工智能技术与规则的海外输出路径。
关键词 人工智能治理; 开源生态; 产业出海
DOI:10.11959/j.issn.2096-0271.2025089
引用格式:
谭俊, 程莹, 刘志鹏. 全球大模型开源战略的动因、影响与应对策略探析[J]. 大数据, 2025, 11(6): 28-34.
Tan J, Cheng Y, Liu Z P. Analysis of the motivations, impacts, and countermeasures of the global open-source strategy for large models[J]. Big Data Research, 2025, 11(6): 28-34.
0 引言
人工智能(AI)大模型技术正经历深刻变革,开源模式凭借其加速创新、汇聚众智、降低门槛的优势,成为全球领先企业战略布局的关键方向。开源浪潮显著降低了AI创新壁垒,促进技术普惠与多边协作,为发展中国家能力建设提供契机。然而,开源模型在安全可控、合规伦理、供应链安全等方面的风险,以及开源生态成熟度差异塑造的多元产业格局,成为亟待解决的全球性挑战。在此背景下,深入分析全球大模型企业加速开源布局的动因、现状、影响及风险,特别是探讨其给我国带来的机遇与挑战,并提出针对性策略,对我国把握技术变革窗口、筑牢安全发展根基、提升国际话语权具有重要的理论和现实意义。
1 全球领先大模型加快开源布局
1.1 阿里巴巴、深度求索通过开源加速收窄与美国的差距,吸引英伟达等上线接入
从技术角度看,阿里Qwen3系列8款混合推理模型近期全部开源,在推理、指令遵循、工具调用、多语言能力等方面均取得大幅增强。而DeepSeek则超越Meta、Google等美国头部企业模型开源程度,在“代码开源周”期间,5日内连发FlashMLA、DeepEP通信库等开源项目,进一步丰富开源生态资源工具。从产业生态看,DeepSeek-R1训练成本达到同性能模型的1/10,直接使用成本为1/30,阿里Qwen3则以DeepSeek-R1参数量的1/3,使成本进一步下降,二者吸引全球开发者共同参与人工智能迭代优化。例如,Qwen3在开源3小时内在GitHub获1.7万点赞量,DeepSeek-R1下载量超300万次,二者均成为国际开源社区150万个模型中最受欢迎的开源大模型。从市场格局看,DeepSeek-R1发布后用户与应用数量呈爆发式增长,形成技术输出与市场扩张的双向增进。具体而言,其推出后曾在全球140个市场的应用商店排名榜首,百度、腾讯、英伟达、微软等超200家企业宣布上线和接入。
1.2 国际头部企业加快开源布局,争夺行业发展主导地位
一方面,美国闭源模型企业反思商业模式,开源模型企业加速技术迭代。面对开闭源模型技术差距的持续缩小,OpenAI首席执行官承认闭源策略“站在了历史错误的一边”,并在2025年4月1日宣布将开源一款强大的推理大语言模型。谷歌、微软则在2025年3月纷纷开源前沿多模态模型,试图以低成本高性能产品维持市场份额。另一方面,欧洲借力开源力量,力争跻身“第一梯队”。欧盟委员会主席在巴黎AI行动峰会表示,“开源能够更快地传播”“欧洲AI将拥抱开源力量”。近期,欧洲启动开源AI协作项目OpenEuroLLM,整合欧洲研发资源开发开源语言模型,并获3 749万欧元资助;得益于法国政府全方位支持,法国初创企业开源Mistral Small 3,并定位为OpenAI的低成本“优质开源替代方案”。
1.3 从代码共享到生态共建,开源成熟度差异塑造多元产业格局
当前主流模型开源程度存在梯度,依据开源源代码、参数权重、训练数据等要素的成熟度可分为4种类型。一是深度开源模式,以法国Mistral Small 3为例,采用促进深度集成的完全开源策略,支持任意部署与定制,且无限制地允许商用。二是限制开源模式,Meta的LLaMA系列模型保持训练数据、核心算法闭源,通过开源生态扩大市场,并对商用实施严格限制。三是分层开源模式,x.AI仅开源上一代模型,Google则仅选择开源TensorFlow等部分模型框架,均通过闭源模块实现盈利。四是生态绑定模式,华为开源适配自研芯片的盘古大模型,通过模型优化算力效率与应用场景,以提升昇腾芯片销量。
2 对我国的影响与挑战
2.1 全球开源加速削弱美技术领先优势,我国开源生态仍存明显短板
2024年5月,美国拟议法案管控开源模型权重,试图在AI领域保持全球技术领先地位。我国深度求索、阿里巴巴等企业凭借开源体系,挑战AI研发对“算力堆砌”的路径依赖,逐渐突破美国主导市场的格局。美国或调整封闭策略,降低全球创新要素的获取难度,为我国实现战略反超提供契机。值得注意的是,我国开源生态仍存明显短板。国内开源社区缺乏类似LLaMA等的全球性标杆,开源大模型训练仍高度依赖谷歌Transformer架构和英伟达CUDA编程框架。全球开源模型的跟进布局,可能会放大我国开源生态话语权等方面的短板问题。有必要防范PyTorch等开源框架在技术协议中附加地缘政治条款,同时警惕美国借助上游工具链优势,占据全球人工智能开源底座,进一步巩固其在人工智能领域的领导力。
2.2 开源推动技术普及与多边协同,我国产品海外部署机遇与挑战并存
从普惠发展角度看,开源人工智能契合“真正的多边主义”理念,有利于推动全球南方国家的能力建设。例如,南非医疗AI公司利用DeepSeek重构诊断系统,成本直降80%。从国际合作角度看,开源人工智能有助于形成多方协同共建的发展范式,增强我国国际规则话语权。法国、波兰等欧洲国家正积极构建开放式AI研发生态,为中欧技术研发合作、技术标准协同以及大语言模型互操作等方面提供新契机。同时,韩国、印度、菲律宾等国也积极拥抱开源AI,有助于我国在人工智能领域与更多国家增进共识,抢占标准话语权。从产业竞争角度看,我国企业全球化布局面临市场份额挤压挑战。2025年2月17日,法国Mistral AI发布专精阿拉伯语的区域语言模型Mistral Saba,凭借文化适应性和高精度形成竞争优势,可能放大对东南亚、中东等新兴市场的吸引力。
2.3 开源应用推广可能持续放大安全风险,亟须把握规则主导新契机
当前,Mistral AI等企业竞相推出开源产品,但在商业竞争中可能放松安全管控,导致滥用误用等风险加剧。技术安全方面,开放权重易遭恶意代码注入、权重篡改等供应链攻击,如DeepSeek的链式思维功能可能被用于“预设答案攻击”。开源生态方面,基于开源模型修改的FraudGPT等大模型,可能被用于违法信息生成、生化武器研发等违法活动。合规与伦理方面,贡献者突破法规及协议要求的风险凸显,全球部署难以保证符合各国监管规则与伦理文化,快速迭代或引发不可控的超级智能风险。基于此,开源模型风险治理合作为构建新规则话语权提供战略窗口。单边治理模式难以有效覆盖开源生态复杂性,训练数据溯源、模型微调审计等技术方案逐步被讨论并写入国际标准方案,进而影响技术发展主导权。
3 对策建议
3.1 以开源生态筑基,打造开源模型场景应用创新标杆示范
一是建设国家级开源创新平台,支持基于开源框架开发行业级解决方案,实现生态供给与产业需求的有效对接。牵头构建开源模型技术标准体系,强化基础软硬件适配能力,依托国家人工智能创新应用先导区建设开源算力服务平台。二是聚焦智能制造、智慧政务等垂直领域,实施“开源大模型+”场景赋能计划,支持龙头企业联合科研院所打造行业级开源解决方案示范项目。三是推进国家级开源社区建设,建立开发者贡献度积分奖励机制,加快形成“产学研用”协同创新生态。
3.2 以国际合作突围,把握开源技术扩散窗口拓宽发展空间
一是依托世界人工智能大会等平台,发起全球开源人工智能发展伙伴计划,设立开源奖项吸引国际开发者团队参与开源项目建设。推动开源大模型纳入“数字丝绸之路”建设框架,强化国产开源协议影响力,对冲美国技术标准主导权。二是联合欧洲启动多种语言模型研发计划,输出配适欧洲监管和文化需求的开源解决方案,推动建立中欧人工智能技术标准互认机制。三是建设全球开源枢纽,吸引Apache、Linux基金会等设立分支机构,为海外市场提供开源人工智能基础设施。
3.3 以风险防控守界,加快构建安全可控开源模型产业体系
一是建立人工智能开源生态透明化机制,强化可追溯机制,完善开源社区自治体系,建立开发者信用约束机制。二是加强开源人工智能研发与应用安全治理,要求开源模型提供安全说明和风险提示,对高风险开源项目要求采取安全防范措施,对关键基础设施要求完善开源组件使用备案制度和安全审查机制。三是通过设立专项基金、引导企业投入等方式,支持高校、科研机构和企业开展开源模型风险防范技术的研究,提升开源模型抗风险能力。
4 结束语
全球大模型开源浪潮正重塑AI创新生态与竞争格局。我国阿里巴巴、深度求索等企业的开源人工智能实践,体现出开源可加速迭代、汇聚智慧、降低成本等,对国际技术影响力有重要影响。然而,生态短板、安全风险放大、国际竞争加剧及地缘政治扰动,构成我国深度参与必须应对的挑战。机遇与挑战并存,要求我国采取系统性举措:对内建设国家级开源平台与社区,推广垂直领域人工智能应用,强化基础软硬件适配与安全可控能力;对外把握技术扩散窗口,深化国际合作,积极参与全球规则塑造;同时严守风险底线,构建透明可追溯、安全可靠的开源治理体系。
(参考文献见原文,点击篇末『阅读原文』阅读及下载本文)
作者简介
谭俊,男,中国信息通信研究院政策与经济研究所工程师,主要研究方向为人工智能治理、个人信息保护等。
程莹,女,博士,中国信息通信研究院政策与经济研究所高级工程师,主要研究方向为人工智能治理、平台治理领域研究等。
刘志鹏,男,博士,中国信息通信研究院政策与经济研究所工程师,主要研究方向为人工智能互联网平台、数据要素治理等。
相
关
阅
读
联系我们:
Tel: 010-53859533
010-53879208
E-mail: bdr@bjxintong.com.cn
http://www.j-bigdataresearch.com.cn/
转载、合作:010-53879255
大数据期刊
《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。

关注《大数据》期刊微信公众号,获取更多内容
更多推荐


所有评论(0)