网站首页 | 网站地图

每日推荐
首页 > 理论 > 正文

国产大模型发展按下“提速键”

2025年,中国在大模型技术迭代速度方面表现出显著的活跃度,已成为全球大模型技术迭代速度最快的国家之一。自2025年年初DeepSeek走红以来,国际人工智能领域掀起“中国热”,大模型已成为人工智能国际竞争的“兵家必争之地”。凭借在技术创新、落地应用、生态搭建等多个维度的突破,中国大模型正进入全球第一梯队,成为引领新质生产力跃迁式发展的智能底座。

【摘要】随着国产大模型的集体崛起,应用场景正从广度和深度加快渗入科学发现、政务、医疗、教育、AIGC等数字领域,同时逐步迈入真实物理世界,开始赋能智能制造、自动驾驶、通用人形机器人、低空经济、脑机接口、个人电脑和手机等真实物理系统,对实体经济的支撑力进一步彰显。2026年有望成为“人工智能应用元年”,大模型与智能体将从试点示范走向规模化商业化应用。中国人工智能产业只有在全方位赋能智能经济与智能社会的征程中,才能做强做大。

【关键词】国产大模型产业  人工智能+  大模型开源产业生态

【中图分类号】TP18    【文献标识码】A

《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》指出:“加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等高效供给。”①人工智能(AI)生态通常由算力底座层、AI操作系统层、核心模型层、数据驱动层与应用场景层等“五层架构”组成。国产大模型的发展正面临从底层软硬件技术到上层应用落地的全层级系统性挑战。在产业应用落地方面,既懂大模型又深耕行业的顶级人工智能应用复合型人才缺口较大。国产大模型的安全及性能评估标准体系亟待完善。产学研用的协同创新开放生态有待加强。与此同时,中国AI产业生态仍需持续增强全球竞争力与影响力。

应用场景:国产大模型从数字空间走向真实物理世界

大模型的价值在于实际应用。中国人工智能发展的战略路径,需优先且坚定选择大模型在经济社会中的广泛应用,强化中国人工智能发展的国际竞争优势。近年来,随着国产开源大模型的集体崛起,其应用场景正从广度和深度,加快渗入科学研究、医疗、教育、法律、政务、编程等数字空间领域,同时也开始迈入真实物理世界,赋能智能制造、自动驾驶、智能座舱、通用人形机器人、低空经济、脑机接口、个人电脑与手机等真实物理系统,走向对实体经济的实质支撑。

国产大模型加速渗入科学研究等数字空间

在科学研究领域,人工智能驱动的科学研究(AI for Science)的崛起,正在重塑科研范式变革,推动“AI+学科”的协同创新生态,加速科学探索与科技创新进程,有望成为人类获得重大科学发现、实现重大技术突破的强大引擎与关键路径。

在医疗领域,国产大模型的应用已从普通门诊常见疾病的AI辅助问诊,深入到专科疾病。通过利用海量临床数据构建各种门诊与专科大模型,致力成为临床决策的AI辅助工具。“国产大模型+医疗”已广泛结合多模态电子病历,包括检查化验单,医学影像与辅助问诊语音等,基于医学专业知识,以期实现对患者症状的智能分析、个性化预诊建议等。

在教育领域,国产大模型的应用广泛而深刻,覆盖范围涉及中小学直至大学,已从教学辅助拓展至推动高效科研。包括豆包、DeepSeek、Qwen、Kimi等在内的国产大模型及多模态内容生成工具,已在全国众多学校规模化落地应用,支持各层级学生的个性化学习,同时也成为教师的高效得力帮手。在高校的科研工作中,国产大模型也被广泛应用于文献整理、实验结果分析与论文准备等②。

在法律与政务方面,提升公共服务效率与规范性是国产大模型的核心价值。其法律应用已涵盖行政执法与司法行政,如快速生成执法报告,提升行政复议的文书处理效率等。在政务应用中,各地各级政府正利用国产大模型优化政务服务与社会治理流程。

作为生产力工具,国产大模型正以极高的效率,通过平台技术与AI代码工具,深度赋能低代码与自动代码产业,如辅助代码生成,对大型软件辅助进行代码Bug查找,或自动完成代码注释等。这是一个可望实现商业闭环的高价值炽热赛道。

随着华为乾崑智驾ADS 4.0采用的WEWA(世界引擎-世界行动)架构与特斯拉FSD最新版本14.2.1的大规模推送,世界模型智能体或具有世界模型的VLA,可望成为解决真实物理系统的“终极方案”。③世界模型通常由世界模拟器与世界预测器组成,可外置或内含于智能体。世界模拟器包括视频生成大模型与四维时空生成大模型。考虑到互联网上保有海量的视频数据,且视频是一种更为简单有效的“世界”描述方法,因此能够遵从物理规律的视频生成大模型,就成为构建世界模拟器的研究热点。

国产大模型全面赋能智能制造等真实物理世界

智能制造。面向工业场景的超级AI智能体与VLA,已成为赋能新型工业化的重要工具,工业人工智能正进入快速发展阶段。国产工业大模型已应用于产品研发设计、生产制造与运营管理等全生命周期,大幅提升工程设计效率,缩短产线排产时间,助力灯塔工厂的智能化、绿色化发展。流程工业多模态大模型与具身智能,还能对生产制造设备进行实时监控,对异常事件进行预测,并可生成相应的处置方案。

自动驾驶。轻量化端到端大模型已实现批量“上车”,支撑智能辅助驾驶NOA与智能座舱的发展。华为ADS 4.0的WEWA(世界引擎-世界行动模型)与具有世界模型的VLA(如FSD 14.2.1),已面向L3+自动驾驶进行产业化部署。自动驾驶历经数轮寒冬煎熬,终于迎来规模化商业化落地的曙光。2025年前7个月,已具备L2级智能辅助驾驶功能的国产新车,渗透率已超过62%④,且多家国内车企已宣布L3级自动驾驶的量产计划。

通用人形机器人。由于人形机器人的硬件成本出现大幅下降,再加上国产主流产品在本体设计与运动控制上已能“站得稳,跑得快,演得像”,因此2025年被许多企业视为中国人形机器人发展的元年。对标美国国家战略级机器人新政,AI驱动的通用人形机器人作为新一代生产力基础设施,已成为核心赛道。面对复杂技能性任务,AI不但需要一个“物理载体”进行安放,而且还需要通过与物理世界的交互,获得可媲美人类的任务完成能力。目前,以VLM作为底座的具身智能与世界模型智能体,已成为通用人形机器人发展的“灵魂”。尽管其技术路线尚未收敛,但部分中国人形机器人,正开始从炫技演示逐步走向工厂试用,“一机多用”,承担诸如搬运、装配等实际操作任务。

总之,从虚拟的数字空间到真实的物理世界,上述领域正呈现出协同进化与收敛聚合的发展态势,多模态大模型或VLM,世界模型VLA,已成为共同奔赴的焦点。作为基础底座,高性能国产多模态大模型的迅猛发展,必将发挥更大的作用。

技术突破:国产大模型正在集体崛起

2025年,包括DeepSeek系列、Qwen 2.5、Qwen 3、Kimi-K2、GLM-4.5与智源BGE等在内的国产开源大模型正在集体崛起,已在高级数学证明、智力游戏、猜谜、复杂代码生成、数学能力及上下文窗口长度等方面,打破国际AI性能霸权,开始追平国际闭源大模型的最高水平。不但实现多方面的工程技术创新,包括以极低的成本研发出世界一流的开源大模型,而且部分大模型还多次位居全球著名开源社区 Hugging Face的月度/热门下载榜榜首或前列,体现中国AI崛起的硬核实力。

国产大模型以极低的成本实现多方面的工程技术创新。例如,DeepSeek V3与R1,参数规模均为6710亿,但其预训练与高效微调的成本却显著低于其他国际同类模型,不仅对AI硬件算力的需求大幅减少,而且性能对标国际一流,其蒸馏小模型甚至可实现本地部署与端侧落地应用。

开源商用与推断部署的便利化。DeepSeek与Qwen等国产大模型实现全球开源与免费商用,降低技术及应用门槛,将十分有利于全球普惠化应用及AI产业生态的建设。

高效的架构设计。DeepSeek通过融入改进的Transformer与MoE架构,利用稀疏注意力机制等,显著降低模型的计算复杂度,进而在保持顶级性能的同时,大幅降低对AI硬件算力的依赖。

显著的能力跃升。2025年9月最新发布的DeepSeek V3.2及V3.2-Speciale,在推理能力、计算效率和智能体性能方面,同时逼近Gemini 3.0 Pro等国际最先进闭源模型。例如,V3.2在多个推理基准测试任务中达到GPT-5水平。V3.2-Speciale在国际数学奥林匹克、国际大学生程序设计竞赛等国际顶级竞赛中达到金牌水平。

开源平台构建世界级AI产业生态。以阿里Qwen 和DeepSeek为代表的中国系列开源模型,在各种权威性能基准测试中频繁登顶,对齐甚至超过Llama、Mistral 等国际顶尖开源模型,开始逼近国际一流闭源模型,多次位列Hugging Face月度或周度热门模型下载榜前列,反映全球开发者社区对中国先进开源模型的高度关注。此外,作为中国AI开源平台代表的阿里云“魔搭社区”(ModelScope),已拥有12万以上的开源模型,用户数达到2000多万,且来自于全球200多个国家与地区⑤。就模型总量及活跃程度而言,已初步构建可与美国 Hugging Face 相对应的世界级AI产业生态。

双链优化筑牢自主可控基石。未来,国产开源大模型与智能体需要进一步发挥优势,完善并优化供应链,深耕产业链,坚定筑牢自主可控的安全底线。

优化供应链。国产大模型的供应链涉及前述算力底座层、AI操作系统层、核心模型层、数据驱动层及应用场景层等“五层架构”,也涵盖高端人才、AI产业生态等核心要素。在硬件算力底座层,目前受国际高端GPU“断供”制约,导致预训练AI算力卡过于昂贵,算力不足对国产大模型应用产生不利影响。在大规模高质量训练数据集的供给上,“数据孤岛”现象比较突出,难以实现行业流通与共享。大力培养基础性创新国际顶尖人才,打造一大批面向AI应用的复合型人才,已成为当务之急。

深耕产业链。在国产大模型的应用中,许多大模型及智能体系统还停留在技术演示层面,产业链尚未完全补全,技术与产业存在脱节现象。在工业大模型等领域,由于制造场景数据标准化程度较低、上下游协同存在数字化水平差异等,产业落地受到制约,产业链有待深耕。为此,需要通过更多垂域应用来推动“大模型+”走实走深,包括向行业提供高效微调与增强、知识蒸馏与轻量化部署等共性关键技术,研发行业基础大模型,倒逼产品的数据化、标准化建设;通过产学研用联合攻关,将大模型作为赋能新型工业化的核心驱动,助力“人工智能+新型工业化”的发展。

顶天立地做强做大中国人工智能产业

做强做大中国人工智能产业,需做到“顶天立地”,既勇闯前沿领域的“无人区”,也持续推动大模型与实体经济的深度融合。国产大模型不仅要实现更多的原始创新与工程技术创新,如以更积极的姿态抢抓物理AI或系统AI(AI for System),而且要以更大的力度推动人工智能面向千行百业与千家万户的广泛应用。

AI双引擎的迭代演化路径。大模型与智能体共同构成人工智能发展的双引擎,并呈现出如下迭代演化路径,即从单模态基础模型发展到多模态基础大模型,再迭代到领域或行业专用大模型,之后再演化为自主具身智能体,并最终进化到世界模型智能体。从更宏大的尺度来看,人工智能已从弱人工智能,跃升到通用人工智能(AGI)的初级阶段。此时一个大模型可以通过微调适配各种下游任务,其中任务的个数称为AGI的宽度,取值可以从2直到人类的总体最大宽度。当AGI的宽度达到人类的总体宽度,就称AI到达“奇点”时刻,此时的AI被称为强人工智能。当强人工智能出现后,智能体的智商会出现指数级别的增长,从而迅速达到超级人工智能(ASI),完成部分任务的智商可能远超人类的最高水平。

物理AI也是系统AI。物理AI的核心内涵是将物理世界模型、世界-(语言)-行动模型与感知-决策-执行闭环,具身于物理系统中,利用物理动作完成各种复杂的技能性任务,并使之具有通用、自主及泛化能力。由于是针对物理系统或实体完成的,因此相应的AI也称为系统AI。它本质上就是一种通用自主的世界模型智能体。在真实物理世界中进行模仿训练与试错交互的成本极高,风险较大,且获得的数据稀疏。为此需要一个平行的虚实物理世界,以便在虚拟物理世界中,完成远比人类更为高效与强大的交互式学习,即大量孪生智能体首先在虚拟世界中“想象后果”,“撞够南墙”,充分学习、“修炼”与进化,然后再进行最优策略的虚实迁移,最终完成面向真实物理系统的产业推断部署。而虚实迁移的关键则是虚拟物理世界对物理规律的遵从程度。由此获得的高质量虚实物理交互数据,可进一步反哺智能体人工智能与ASI的发展。

实现更多的原始创新与工程技术创新。中国AI要在日益激烈的国际竞争中获得更多的主动和优势,需突破“跟跑”“并跑”式研究,通过体制机制创新,壮大创新生态,在全球AI“从0到1”的基础研究中,做出更多历史性的中国贡献。

在原始创新方面,可在两个大方向寻求突破:一是新范式与新架构。目前大模型主要以Transformer架构作为基石,需探索下一代更高效、更类脑且仅需更少算力的基础架构。例如,谷歌最新发表的嵌套学习新范式,可在持续学习新知识与新技能时避免出现“灾难性遗忘”,且能如人脑般温故知新。二是前沿技术。包括规模定律与涌现能力,持续学习,测试时间学习,持久记忆,空间智能,AI超级智能体,世界模型与世界模型智能体,智能体人工智能,自改善人工智能等。在工程技术创新方面,核心是“低成本,低算力,高效率,高性能”挑战。通过极致优化,利用更少算力、更低成本、更少数据,高效训练出更高性能的大模型与智能体。同时还要解决“可用、易用、好用”痛点,包括利用AI操作系统解决异构、异地AI算力卡整合,实现从芯片、编译器到框架的软硬协同。最后则是通过模型压缩技术、轻量化技术与蒸馏技术等,基于端云协同或边缘技术,使大模型下沉到端侧做产业化部署。如最近推出的豆包手机,大模型不仅可以“上”机,还可以直接“上”各种真实的物理系统。

2026:迈入人工智能应用的元年。2026年有望成为“人工智能应用元年”,大模型与智能体将从试点示范走向规模化商业化应用。中国人工智能产业只有在全方位赋能智能经济与智能社会的征程中,才能真正做大做强。

这是一场关乎国家战略发展方向的“顶天立地”之战,既要仰望星空,在原始创新与关键核心技术上做出中国人的历史贡献,又需脚踏实地,让国产大模型扎根产业、服务社会。

国产大模型已跨越初期的技术追赶阶段,就开源大模型应用的普惠化、技术迭代速度及创新活跃程度而言,已居全球领先水平。“顶天”与“立地”已成为未来清晰的AI发展路径:一方面,持续构建创新性科研生态,完善学术界与产业界的跨界人才流动机制,鼓励基础研究的长期主义,宽容失败,努力在影响全球AI重大发展方向的深度神经网络基础架构、先进模型框架、核心算法、物理AI、世界模型智能体与高端AI异构芯片、量子AI计算等前沿领域,实现具有世界影响力的基础性原始创新,夯实自主可控的理论与技术根基;另一方面,以国产大模型及智能体的广泛应用为牵引,将技术积蓄的势能,有效地转化为推动自动驾驶、低空经济等新兴产业,以及通用人形机器人等未来产业的核心力量,聚焦对实体经济、产业转型升级、现代化产业体系建设的支撑,加速新质生产力的发展。总之,优化从芯片、操作系统、框架、数据到应用的完整供应链与产业链,凝聚创新合力,通过打造世界级国产大模型产业生态,以此全力助推中国智能经济社会的高质量发展与中国式现代化建设。 

【注释】

①《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》,新华社,2025年10月28日。

②刘中民:《人工智能技术在能源化工行业的应用现状及未来趋势》,《人民论坛·学术前沿》,2025年第2期。

③《从墨脱公路看华为乾崑的向上生长、向下扎根》,新华网,2025年12月17日。

④《智能网联汽车决胜“下半场”》,《经济日报》,2025年11月7日。

⑤《全国最大的AI模型开源社区,为什么又选择在杭州安家?》,杭州市投资促进局,2025年11月27日。

责编/孙垚    美编/李祥峰

声明:本文为人民论坛杂志社原创内容,任何单位或个人转载请回复本微信号获得授权,转载时务必标明来源及作者,否则追究法律责任。

[责任编辑:孙渴]