【摘要】当开源精神的火种点燃人工智能的星辰大海,人类正见证一场关乎数智文明重构的认知革命。开源大模型不仅重构技术生态,而且重塑人类对知识生产与再分配的传统认知范式。当前,这场看似温和的大模型开源技术运动,实质上是中国科技企业突破算力封锁、实现产业转型与生态博弈共同催生的战略选择,其行动早已超越单纯的技术选择,直指知识与技术的垄断与解放。
【关键词】人工智能 大模型 DeepSeek 开源 重构 【中图分类号】F49 【文献标识码】A
自2023年以来,阿里巴巴陆续开源通义千问(Qwen)系列大语言模型,其在自然语言理解、多模态交互等领域具有突破性表现,在多项基准测试中可与全球顶尖大模型并驾齐驱。中国人工智能企业深度求索(DeepSeek)在2024年底和2025年初,相继推出DeepSeek-V3与DeepSeek-R1两大开源引擎,前者以媲美GPT-4的千亿参数架构构筑智能基座,后者则在复杂逻辑推理的深水区开辟新航道,将人机协作的边界推向更辽阔的疆域。美国CNBC电视台网站发表《中国对开源的拥抱颠覆了围绕人工智能的传统看法》一文,认为中国正在积极拥抱人工智能开源大模型,这一趋势正推动中国人工智能技术的普及与创新。当前,中国已构建出参数规模横跨十亿至万亿级、应用场景覆盖智能制造至数智政务的开源生态网络。人工智能的技术演进与产业需求如齿轮般精密咬合,塑造出独具特色的应用需求牵引创新、开源生态反哺产业的发展范式。中国工业和信息化部数据显示,截至2024年6月,中国人工智能企业数量已超4500家,核心产业规模接近6000亿元。中国软件开发者数量已经突破940万。中国已经成为全球开源参与者数量排名第二,增长速度最快的国家。①这不仅是数字的跃迁,更是创新范式的质变,中国运用开源开放与协同创新的群体智慧,从代码仓库到产业应用,从实验室到生产线,在全球人工智能竞争中激起层层涟漪。
开源之潮:智能时代的星星之火
“开源”一词最初来源于软件领域,原指可以访问源代码且对程序的使用或发行没有限制,所有人均可查看、修改和分发。截至2025年1月1日,全球97%的软件开发者和99%的企业已使用开源软件,70%以上的新立项软件项目采用开源模式②。现阶段,受限于大模型的技术复杂性与海量数据规模,机构或公司往往难以实现全方位开源,这既源于商业机密保护与合规性审查的多重风险管控,又涉及完全开放可能导致的技术滥用隐患。然而,采用开源策略仍具显著价值:通过展现技术透明度与研发规范性,开发者能够有效提升品牌可信度,在争取开发者社区支持与社会公众认同等方面获得实质性效益③。
通常来说,中小型创新主体构建的人工智能大模型,往往比大科技公司构建的大模型更倾向采用开源模式。这种差异,主要源于初创机构对协作创新的迫切需求,以及资源限制之间的动态平衡机制。国际上,在微软、谷歌、苹果和亚马逊等构建的平台与算力壁垒之中,中小型创新主体面临双重锁定效应:上游受限于平台与算力寡头的定价权,下游被困于专利丛林形成的创新堰塞湖。开源运动正在创造技术民主和技术平权的新秩序,这种秩序呈现出量子化组织特征:既保持个体创新的离散性,又通过相互合作实现量子纠缠般的协同效应。开源不是乌托邦式的理想主义,而是以透明性换取信任、用协作对抗垄断。开源运动正在创造技术史上的悖论:当每个局部创新都来自分布式个体,整体却涌现出超越中心化系统的智慧。这种群体智慧暗示着知识生产的范式革命。中小型创新主体通过开源构建的量子化创新网络,本质上是将技术创新从牛顿式的机械论与确定性范式,转向量子力学的概率云范式——既保持个体自由,又通过协作实现相干叠加。
近年来,国际上许多声称开放或者开源的大模型,包括Meta公司的Llama和谷歌公司的Gemma,实际上只是“开放权重”,而非严格意义上的开源。这些大模型的许可证限制某些使用和修改权限,而且它们的训练数据集并不公开。而DeepSeek的R1在“MIT许可证”下分发,促进不受限制的使用、修改和分发,包括用于商业目的,其从软硬件的适配到应用推广甚至产品宣传,均由全球厂商和开发者共同完成,极大降低其生态建设成本。正是由于低建设成本和高性价比,反过来进一步帮助DeepSeek拓展大模型生态,快速提升用户数量和市场占有率。
破茧之因:技术困局与战略突围
芯片封锁下的自主创新。面对美国芯片禁运,中国科技型企业以算法创新突破物质桎梏,将算力劣势转化为算法创新的催化剂。华为“盘古”大模型通过动态稀疏训练技术,依托开源大模型提升算法效率,弥补硬件短板,在算力受限下实现大模型效率跃升,在8192张昇腾NPU构建的大规模集群上,将算力利用率提升至50%④。这种“以软补硬”的智慧,宛如在芯片封锁的铁幕上凿开一道微光。开源社区中涌现的量化压缩工具链,让千亿参数大模型得以在国产昇腾等芯片上流畅运行,创造出属于中国人工智能的“纳米空间折叠术”。
闭源铁幕中的开源星窗。当GPT-4、Claude 3等闭源大模型筑起技术铁幕时,Qwen、DeepSeek等开源力量正以“否定性实践”重构知识生产范式。这种闭源与开源的张力,既是资本逻辑与技术民主化的对抗,又是人类认知范式革命的先声。闭源大模型通过算法封装构建“技术垄断的认知鸿沟”,形成知识权力不对称的新型技术垄断,持续强化大模型开发者与使用者之间的信息势差,而DeepSeek-R1的开源,引发了全世界开源社区的“羊群效应”,开源社区通过持续的技术否定实现跃迁。虽然DeepSeek尚未公布训练该大模型的全部成本,但据估算,其算力租赁费用约是Meta公司Llama 3.1 405B的十分之一,且使用DeepSeek-R1界面的用户成本仅是ChatGPT o1的三十分之一⑤。这使更多的研究人员和企业能够轻松使用人工智能技术服务,推动人工智能技术的普及和应用。
产业实践上的技术涌现。我国拥有全球最完整的工业体系。截至2025年1月,全球“灯塔工厂”累计数量达到189家,中国有79家,占比约42%,总量位居世界首位⑥。工业和信息化部数据显示,2023年,我国重点工业企业数字化研发设计工具普及率达到80.1%,关键工序数控化率达到62.9%⑦。2024年11月,《中国互联网发展报告2024》显示,全国已建成近万家数字化车间和智能工厂。当全球最完整的工业体系、数智化程度日益递增的行业,与超11亿网民的数字足迹,在960多万平方公里土地上交织时,这片沃土正在演绎大模型技术革命的独特路径——数据、产业、场景、市场多维共振的技术涌现。当前,中国开源技术的“生态赋能”效应已覆盖制造、金融、医疗等多个核心领域,形成“技术开源—场景迭代—生态培育—市场验证”的良性循环。DeepSeek的涌现,充分说明创新要素与产业场景深度融合的必要性。
中国的产业实践表明:中国开辟了产业需求牵引开源创新的独特路径,开源大模型技术不仅是工具创新,更是重构生产关系的系统性变革。这种转变背后,是数智化转型需求激增、数据要素市场化改革深化,以及产学研用协同机制创新等多重因素驱动的结果。
涟漪效应:技术哲学的范式重构
全球技术平权的精神远征。开源模式打破巨头或寡头垄断,通过社区协作优化大模型性能,推动全球开发者参与技术迭代。开源大模型较闭源大模型的优势主要体现在三点⑧:更好地分配权力——开源大模型创造新的社会经济权力形式,下游用户可以更好地自行做出决策;更快地促进创新——开源大模型更加可定制,并提供更深的访问权限,可更好地促进创新;更高的透明性——开源大模型相比闭源大模型,平均透明度更高,可帮助避免过去因数智技术不透明而造成的危害。
技术发展至今,人类对技术平权的追求已超越工具理性的边界,演变为一场影响文明发展的精神远征。这场远征的终极目标,不是算力的均分,而是认知主权的觉醒。DeepSeek作为中国人工智能开源大模型的代表之一,正在为工业智能赛道注入“超级大脑”,推动工业母机领域的颠覆性变革。这是对“技术主权”的深层诠释,中国开源生态正用分布式算力破解“算力霸权”的困境。
知识生产范式的认知革命。开源与开放,无论是对技术创新还是科学发展而言,均尤为重要。传统的闭源大模型构筑算力高墙,以亿级美元研发投入与超万卡集群的准入门槛,将人工智能创新禁锢于少数科技巨头的认知堡垒,高校和中小型创新主体被拒之门外而“望卡兴叹”⑨。这种资本密集型的研发范式虽然推动技术迭代,却在无形中加剧全球科技创新的“马太效应”,也会在一定程度上阻碍知识和技术的传播与创新。开源的浪潮冲破了上述知识或技术的垄断,算法民主化让思维的火种在技术平权中爆发链式反应:原本深藏于垄断机构的认知框架,如今在分布式协作的开源社区里重组知识DNA;过往可控理想条件下,边界清晰且线性递进的研究范式,蜕变为可在开放复杂环境下实现交叉融合,且呈现出涌现式进化的认知生态,每一次开源社区中的模型微调,均带来技术迭代。知识生产的终极命题,从“占有真理”转向“开放交互”。人工智能时代,开源社区中每天产生的数万次模型微调请求,正在孵化出模型即服务(MaaS)的新模式——知识成为主体间协作生成的流动智慧。近期中国密集发布的开源大模型,其高性能和低成本吸引全球众多科学家的关注,正驱动多学科交叉的新型科研范式涌现:来自高校和中小型创新主体的人工智能专家,依托其超参数优化引擎突破技术边界,数学家借助大模型解决组合优化难题,认知科学家运用神经仿生框架构建脑网络动态模型,多学科交叉的智慧激流共同解码智能本质与思维本源的科学密码⑩。我们正在进入一个人工智能重构科研流程的时代,而开源技术使得人工智能已成诸多领域的研究引擎⑪。
安全与创新的量子纠缠。开源基础大模型在推动科技创新、促进竞争和权力分配方面具有巨大潜力,在透明度和可定制性上相比闭源大模型具有优势。而围绕开源大模型的许多担忧,源于大模型权重一旦发布,开发者便失去对其下游使用的控制,容易被部分用户滥用。而闭源大模型则可以限制访问,上述风险相对可控。因此,如何在推动开源大模型技术创新的同时,对开源大模型技术进行适度监管,成为关键挑战之一。不同的政策可能会对创新生态系统产生不均衡的影响,我们需要平衡开源与闭源大模型的发展,可以通过提高经济效益、支持关键基础模型发展,以及促进大模型的复用性、鲁棒性和可控性,并通过持续广泛的同行审核以及智能巡检等手段,提高大模型的可靠性和安全性,从而在促进创新的同时有效管理其潜在的社会风险⑫。
燎原之势:中国自主的技术星图
中国开源大模型技术的发展,是在政策引导与市场机制的双轮驱动下,探索出“政府搭台、市场运作、科研攻坚”的中国特色发展路径,既能保障技术自主可控,又可通过开源社区激活全球创新网络,构建起有效的技术生态体系,为全球人工智能创新与发展提供中国方案。
中国可综合运用政策、立法和技术等手段确立数据主权边界,通过加快算力基础设施建设降低创新门槛,用产学研协同机制打通技术转化动脉。在数据确权方面,可通过智能合约、内容指纹或数字水印等方式,实现数据采集时的权属声明、数据流转时的收益分配,以及数据销毁时的连带清除等。在算力基础设施建设方面,可通过“东数西算”工程、智算中心布局及算力调度平台优化等,建设全国一体化算力网络;通过发放“算力券”等优惠政策,提供一定额度的免费或者低成本的算力支持,可显著降低高校、科研院所以及中小型企业获取高性能计算能力的成本,让更多创新主体能够深度参与技术创新。在产学研协同方面,在国家人工智能发展战略的指导下,构建灵活的政府、企业与用户多方协同机制,高校的基础研究成果、科研院所的前沿技术突破与企业的市场化需求形成高效对接,通过建立联合实验室、技术转移中心和产业创新联盟等载体,快速缩短大模型的科研成果转化周期,实现基座大模型的公共品属性,与领域或行业大模型的商业化价值的辩证统一,形成“开放核心+增值服务”的可持续发展模式;通过产业链上下游的参数共享、算力众包等方式,建立新型协同与协作关系,在模型轻量化、推理优化等关键技术领域,催生差异化的技术路线,避免同质化内耗。这种协同机制不仅可以加速技术迭代,还能够涌现出从基础研究到商业落地的完整创新链条。
构建健康的开源大模型生态需要形成“政府—开发者—用户”多方协同治理体系:政府监管大模型的风险,核心开发者专注基础架构创新,行业开发者深耕垂直场景应用,终端用户提供反馈形成闭环。建议重点推进三个方向:防止开源大模型生态垄断,构建多中心技术体系,避免单一主体掌控核心资源,建立开放标准和反垄断机制,保障技术共享公平性;建立训练数据的合规制度与数据要素市场化流通体系,解决网络爬取数据合法性的问题,构建多级数据交易平台;创新“中心化监管+去中心化自治”并存机制,以及“监管沙盒+熔断机制”的敏捷治理模式,基于大模型规模和应用风险实施分级监管,通过工具链矩阵降低技术门槛,平衡创新自由度与系统稳定性,在保障创新自由度的同时,形成风险传导的阻尼系统,有效调和创新活力与秩序稳定间的矛盾⑬,最终形成政府引导、社区自治、法律保障的多维治理体系。
在开源供应链自主可控方面,中国需构建兼顾内外的协同发展体系:对内依托本土开源生态,打造“代码托管—合规审查—安全验证”全链条治理机制,强化核心技术的自主创新能力;对外深度参与国际标准制定,建立技术断供预警与应对机制。针对算力瓶颈,重点攻关碎片化训练、异构计算适配等关键技术,构建区块链赋能的联邦式算力共享平台,打造“硬基建+软服务”,以及“绿色算力+高效算法”的新型数字底座,研发低功耗芯片架构和节能训练技术,实现国产芯片与大模型的深度协同优化。努力实现新一代高性能计算技术突破,建立智能算力网络,提升资源利用效率。在安全防护方面,需防范数据投毒(即攻击者在大模型的训练数据中故意注入恶意样本,以诱导大模型学习错误模式并产生有害输出的攻击行为)等新型威胁,通过构建全生命周期溯源体系和形式化验证工具,形成“预防—检测—响应”的主动防御闭环,确保开源大模型的自主可控发展。
从芯片禁运下的技术抗争,到开源社区中的认知重构,从芯片架构的底层适配,到应用生态的枝繁叶茂,全球开发者的智慧在无界协作中结晶成价值网络。通过开源治理、安全防护和软硬件协同等方面的持续突破,构建中国特色的技术星图,以实现从“追随者”到“人类命运共同体”的跨越。这场开源运动已不仅是单纯的技术选择,也是一场关于创新范式的社会实验。
(作者为中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员、博导,中国科学院大学人工智能学院岗位教授、博导)
【注:本文系国家杰出青年科学基金项目(项目编号:72225011)、国家自然科学基金重点项目(项目编号:72434005)以及国家自然科学基金专项项目(项目编号:L242400108)的阶段性成果】
【注释】
①高乔:《中国人工智能创新何以令海外惊叹(环球热点)》,《人民日报海外版》,2025年2月15日。
②黄鑫:《开源生态加速培育壮大》,《经济日报》,2025年1月1日。
③Gibney, E., Not all 'open source' AI models are actually open: here's a ranking. Nature, 2024.
④https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-report.pdf
⑤Gibney, E., China’s cheap, open AI model DeepSeek thrills scientists. Nature, 2025. 638(8049): p. 13-14.
⑥刘向东:《我国“灯塔工厂”的发展格局与全球价值链塑造》,《人民论坛》,2025年第8期,第52-56页。
⑦康义:《制造业向好发展 夯实实体经济根基》,《新型工业化》,2025年第1期,第22-29页。
⑧⑫Bommasani, R., et al., Considerations for governing open foundation models. Science, 2024. 386(6718): p. 151-153.
⑨Ahmed, N., M. Wahed, and N.C. Thompson, The growing influence of industry in AI research. Science, 2023. 379(6635): p. 884-886.
⑩Gibney, E., Scientists flock to DeepSeek: how they’re using the blockbuster AI model. Nature, 2025.
⑪Maffulli, S., ‘Open source’AI isn’t truly open—here’s how researchers can reclaim the term. Nature, 2025. 640(8057): p. 9.
⑬Spirling, A., Why open-source generative AI models are an ethical way forward for science. Nature, 2023. 616(7957): p. 413.
责编/谢帅 美编/杨玲玲
声明:本文为人民论坛杂志社原创内容,任何单位或个人转载请回复本微信号获得授权,转载时务必标明来源及作者,否则追究法律责任。
