网站首页

人民论坛网·国家治理网> 《国家治理》杂志> 正文

高效推进数据基础设施运营

摘 要:当前,我国数据基础设施建设和运营稳步推进。基于在多方主体协同、分层运营与场景牵引方面形成的初步共识,面对人工智能引发的数据供给结构、数据产品形态、商业模式等系统性变革,需以系统思维推动数据基础设施运营提质增效,围绕算力、算法、数据、安全、制度关键维度,统筹推进能力建设与机制优化,打造适配人工智能发展的数据基础设施运营体系。

关键词:数据基础设施 人工智能 运营

【中图分类号】F623;F49 【文献标识码】A

“十五五”规划纲要提出“建设和运营国家数据基础设施”[1]。当前,我国数据基础设施建设和运营取得积极进展,围绕多方主体协同、分层运营与场景牵引,数据基础设施运营相关工作已形成初步共识。同时,人工智能技术快速迭代与深度渗透,引发数据供给结构从静态记录向合成数据转变,数据产品形态从数据集向“模型即服务”转变,商业模式从按量计价向按效付费转变。在此背景下,亟需在算力统筹调度、模型平台与工具链完善、数据全链条运营,以及全过程安全保障等方面进行前瞻性布局,全面提升数据基础设施运营能力,为深入推进数字中国建设提供有力支撑。

积极推动落地,夯实数据基础设施运营实践基础

在国家顶层设计和统筹布局下,各地区各行业坚持因地制宜,积极探索数据基础设施高效运营路径,在主体协同、运营模式和场景应用等方面形成广泛共识,为数据基础设施高效运行和推动数据要素价值释放筑牢基础。

强化多方主体协同。数据基础设施的运营涉及监管方、应用方、服务方、运营方、数据提供方、数据使用方等多方主体,协同机制的设计与落实,推动多方主体实现各司其职、利益共享,有效提升基础设施可持续运营能力,显著促进区域间协同创新。比如,贵州贵阳市构建“1+3+5+N”数据流通利用基础设施体系,通过统一底座支撑多业务体系协同,以数据沙箱、隐私计算等技术工具打通主体间的信任壁垒,构建“基础设施+运营管理+要素市场化”的多方主体生态共创模式;又如,全国组织机构统一社会信用代码数据服务中心打造“一码融通”密态计算空间,创新建立“政企银”协同模式,由代码中心统筹数据,技术方提供密算引擎,金融机构开发“数据增信贷”产品,不仅兼顾数据安全与价值释放,而且形成多方主体供给、赋能、应用的完整闭环;再如,国家基础学科公共科学数据中心、国家冰川冻土沙漠科学数据中心等七家机构,联合构建协作式数据基础设施CoNet,通过制定跨域协作规范和溯源机制,成功接入2.1万个数据资源,促进科学研究从单点突破向联合创新转型。

构建分层运营体系。目前,数据基础设施运营已探索形成以基础设施、平台、场景、资产为依托的商业化路径,成为当前运营模式的基本参照。面对大型科技公司带来的云基础设施的垄断性依赖及其引发的工业化挑战,构建自主可控且分层明确的运营体系势在必行。

探索“基础设施即服务”,通过提供互联网数据中心(IDC)、算力、网络等基础资源租赁获取收益。比如,内蒙古呼和浩特市充分发挥全国一体化算力网枢纽节点的资源优势,通过“免费试用+算力券”模式吸引政企研主体,为数据安全流通提供坚实的算力底座支持;又如,“数算云网”纵向贯通“部—省—校”三级数据通道,建成辐射32个省级单位和1300余所本科高校的“数据高速路”,同时打造跨域融合调度系统,为广东省近70所高校提供弹性算力服务;再如,中国联通等单位承接粤港澳大湾区数据特区有关基础设施试点建设运营,以可信数据空间为载体构建数算网安一体化底座,并搭建一体化调度平台作为资源枢纽,实现多地算力、数据、服务资源的统一调度,为超大城市群数据跨境跨域高效流通打造“高速公路”。

探索“平台即服务”,依托数据汇聚、加工、治理等平台能力实现价值转化。比如,中电数据产业集团有限公司打造“需求—生产—流通”全链路运营平台,形成总量突破198.39亿条的跨行业数据资源,并开发出3615类标准化数据产品,显著提升数据加工与供给效率[2];又如,浙江温州市开发“数链温州”一体化架构,整合公共数据授权域和交易平台等存量资源,兼容13家厂商接入连接器,已汇聚流通主体636家,登记数据资源13778个,形成支撑数据安全高效流通的规模化平台设施;再如,中兴通讯自主研发“数字矩阵”可信数据空间平台,深度融合制造领域PB级多源异构数据,实现上千项数据资产在多家上下游企业间可信共享,推动产业链数据价值共创。

探索“场景即服务”,将数据能力封装为行业解决方案并按效果付费。比如,中电工业互联网等单位建设医药工业可信数据空间,将底层数据能力封装成“AI注册、AI质检、AI验证、AI评估、AI营销”五大智能系统,深度嵌入医药企业的注册申报、质量管控等关键业务场景,推动注册周期大幅缩短、质检准确率有效提升;又如,飞友科技打造“智慧航空协同发展平台”,采用“数据沙箱+联邦学习”等技术保障数据“可用不可见”,并牵头制定民航数据标准,实现民航与旅游、保险、物流等跨领域数据要素的标准化、安全共享与价值转化,为产业协同奠定坚实基础;再如,中汽数据有限公司依托“整车—配件”标准化数据资源体系,将海量零配件及价格数据封装为车险理赔、供应链优化等关键场景服务,助力保险企业降低定损数据使用成本达50%以上。

探索“资产即服务”,通过数据资产入表、质押融资等资本化运作,实现价值跃升。比如,福建厦门市打造公共数据融合开发平台,通过“信易贷”等金融场景,将公共数据转化为信用资产,累计撮合融资超过千亿元,“厦鹭家政”等场景带动万人就业,实现数据价值的社会化释放;又如,福建省大数据集团有限公司建设一体化公共数据底座,率先实现公共数据资源“登记管理—授权运营—定价收费”的全流程闭环,已接入900多家数商,上架1400多款数据产品,支撑并带动金融、气象等行业的数据应用生态价值超78.27亿元。

深化场景牵引应用。场景既是检验设施效能的价值标尺,又是驱动设施迭代的关键引擎。数据基础设施运营成效,关键在于将设施能力深度嵌入真实业务场景,形成“场景牵引应用、应用拉动设施”的良性循环,驱动科技创新范式向数智化全面转型[3]。各地对此逐步形成广泛共识并积极开展相关实践。比如,江苏常州市入选国家数据基础设施第二批先行先试城市,聚焦可信数据空间,推动“1套数据基础设施+8个领域数据专区+30个示范场景+1000家流通主体”任务落地;又如,广州市依托“三港融合”架构,围绕跨境贸易便利化等场景,汇聚752亿条公共数据,打造87个数据产品[4];再如,浙江宁波市设立医疗健康、港航物流等行业专区,落地多个标杆场景,上架上百个数据产品,吸引多家数商入驻运营,初步形成数据产品开发、技术服务和场景应用协同发展的数据产业集群。

研判趋势变化,应对人工智能时代运营新挑战

随着人工智能等技术广泛应用于经济社会各领域,数据基础设施的运营环境、服务对象、产品形态发生深刻变化,给传统运营模式带来新挑战。

数据供给结构变化,质量和合规管理要求升级。传统数据运营主要围绕生产生活产生的原始记录展开,但随着人工智能技术的广泛应用和深度渗透,合成数据开始扮演重要角色,数据标注行业正在发生空间重组,对数据治理的稳定性提出新要求。在模型训练中,合成数据的占比正在快速提升。例如,上海市大数据中心、亚信科技联合建设“数据合成技术促进公共数据社会化价值释放”项目,以差分隐私与生成对抗网络相融合的生成式人工智能技术为重点,构建覆盖数据全生命周期的合成管理体系。这些变化将给数据基础设施建设、运营带来新的挑战。质量治理方面,运营方需建立比真实数据更严格的质量筛查机制。算力支持方面,合成数据的生成依赖大规模算力,基础设施需提供“生成—训练—迭代”的一体化环境。权属与伦理方面,合成数据涉及复杂权利归属问题,基础设施须嵌入合规审查模块。例如,广州数据集团有限公司在探索建设超大城市数据基础设施时,采用“三环境隔离+仿真数据”,筑牢安全流通基础,通过隐私保护计算技术,构建“集中管控+分布开发”的可信执行环境,在满足人工智能训练对海量数据需求的同时,严格保障数据供给的合规性。

产品形态迭代演进,全链条服务能力供给面临新挑战。数据基础设施流通的产品正从原始的“数据集”或“应用程序编程接口(API)”,升级为封装逻辑与知识的“模型”或“参数”,产品形态的变化要求延伸服务链条,通过“数据+人工智能”加速器重构生产函数[5]。运营方不仅承担数据清洗、加工等基础工作,而且需具备模型训练环境搭建、模型托管、推理加速等能力,要求基础设施加快构建“数据+算力+算法”一站式交付体系,适配人工智能时代产品形态的全新需求。比如,中国信息通信研究院搭建“星火·链网”,面向不同应用场景精准匹配三类可信接入服务,即面向产业侧的公共服务,对接区域节点的数据服务,以及提供接口的开放服务,生动诠释平台级与场景级服务的叠加演进;又如,北京腾云天下科技有限公司采取“1+4+3+N”架构,在提供可信空间底座的同时,结合监管沙箱机制,部署数据连接器、匿名化等组件,提供“连—治—算—流—用”全链条服务。

一体化算力网加速推进,协同调度面临更高要求。人工智能负载呈“瞬时爆发、用完即释”特征,算力部署与数据跨域流动能显著提升全要素生产率,但仍面临能耗与电网配套的结构性压力[6]。合成数据普及形成“生成—训练”双脉冲式算力需求,对协同调度提出三重挑战。一是弹性切换。生成与训练任务连续进行,需分钟级完成资源回收与再分配,传统静态调度难以适配。二是通信延迟。训练阶段需毫秒级梯度同步,跨地域调度造成“算力等数据”,双脉冲叠加放大调度复杂度。三是绿电匹配。脉冲窗口内中断代价极高,而绿电波动难以精确匹配双脉冲时序。对此,各地各部门积极推动绿色电力与算力协同布局。比如,南方电网通过预测绿电、动态调度,实现用电成本降低16%—33%,关键能力正转向“时空精准匹配”;又如,重庆长安汽车股份有限公司联合多方构建跨域数据流通利用一体化设施,主动响应“东数西算”工程,依托自研“星环”调度平台与国产视联网络,实现全链路自主可控的算力跨域智能调度,有效缓解人工智能高频计算任务的时空分布冲突;再如,最高人民法院牵头建设统一司法区块链平台,创新突破链上数据可信计算扩容合约技术、异构链跨链协同调度技术等关键技术,有效破除不同层级、不同架构节点间的调度壁垒,确保复杂计算任务在多方异构环境下的高频、低容错执行;还如,中国司法大数据研究院有限公司打造法治可信数据空间,全面践行“数据不动模型动”的计算调度新范式,将人工智能模型训练与推理的计算任务动态调度至数据所在的原生节点,为应对大模型训练中“瞬时爆发”的计算需求提供去中心化的协同调度解题思路。

商业模式创新升级,价值度量与收益分配有待重构。数据产品形态实现从“数据集”向“模型参数”跃迁,为长期困扰数据要素市场的定价难题提供突破口,商业模式从传统“按量计价”向“按效付费”创新升级。价值度量单位从模糊的“数据条数”转化为可量化的词元消耗、API调用次数或业务成效指标,数据价值与应用成效深度绑定。这要求基础设施运营加快构建与新商业模式相匹配的价值度量体系和收益分配机制,保障收益在各主体间合理分配。例如,杭州数据要素运营中心构建线上、线下一体化数商服务体系,将“基础运营”与“价值运营”深度融合,打磨并构建“数据易得、工具好用、产品好卖、效益可观”的商业生态环境,为基础设施的长期盈利与多方主体的收益合理分配提供可持续的运营土壤。

“十五五”时期高效推进数据基础设施运营的实践路径

面对人工智能时代的新变化、新挑战,亟需围绕算力、算法、数据、安全、制度五大关键维度,统筹推进能力建设与机制优化,打造适配人工智能发展的数据基础设施运营体系。

构建全链条算力服务体系。针对人工智能所需的高并发、低时延、强弹性等新型算力需求,推动算力体系向“统一调度、弹性服务”转型。[7]加快构建分层分布、统一调度的一体化算力网络,推动各类算力资源标准化接入,实现跨区域、跨主体的动态调度和弹性供给。围绕人工智能训练、推理和应用全流程,强化算力对数据处理与模型运行的全链条支撑能力。推动算力供给向能力服务转型,完善按调用、任务、性能等级的计费机制,提升算力资源使用效率。强化算电协同与绿色约束,将能效水平与绿电占比纳入调度体系,构建高效、低碳的算力运行模式。

提升算法供给与应用水平。聚焦当前模型能力供给分散、重复开发、供需脱节等问题,构建国家级统一模型服务平台,整合通用大模型、行业专用模型及人工智能开发工具链,形成服务体系,通过统一接口实现模型能力的高效调用与复用,降低行业人工智能开发成本,促进人工智能技术创新产出。围绕模型全生命周期,完善数据支撑、模型训练、测试验证和应用反馈的闭环机制,强化模型评测、审计与风险防控能力,提升模型供给质量。推动模型能力深度嵌入生产制造、政务服务、公共事业等关键领域,打造可复制、可推广的行业应用模式,实现算法能力与业务需求精准对接。

强化高质量数据供给能力。针对当前数据生产、加工、流通、应用各环节割裂问题,以及人工智能时代合成数据占比快速提升的新趋势,构建覆盖“真实数据+合成数据”的一体化数据运营体系。强化高质量数据供给能力,完善数据采集、清洗、标注、合成生成、质量评估等全流程工具链,提升合成数据的可控生成与质量评估能力。建立多层级、多类型的数据资源池,实现真实数据与合成数据的协同供给。完善数据流通服务体系,强化数据登记、供需对接、协同加工、交易结算与合规审查机制,探索合成数据权属认定、使用边界与伦理合规管理体系。建立统一的数据交付与计费清算机制,提升数据产品交付能力。以重点行业场景为牵引,形成“场景驱动供给、应用反哺优化”的良性循环,提升数据要素价值转化效率。

提升一体化安全保障水平。当前安全体系仍以单点防护为主,难以适应数据跨域流通与人工智能应用带来的系统性风险,建议构建覆盖数据、模型、算力全维度,合成、采集、传输、处理、流通、销毁全流程的安全防护体系。将安全能力深度嵌入数据流通、模型服务、算力调度各业务环节,实现安全与业务协同推进、同步优化。强化隐私计算、数据使用控制、可信执行、模型溯源等技术应用,保障数据“可用不可见”、模型“可控可溯”。建设国家级统一安全监测与预警平台,实现对跨区域、跨主体数据流动和模型调用行为的动态感知、实时监测与风险处置。明确各类主体安全责任边界,完善数据、模型分级分类监管机制,提升风险防控的针对性和有效性。

健全数据基础设施运营制度体系。针对当前数据基础设施“重建设、轻运营”的问题,以及人工智能推动数据从“资源形态”向“能力形态”转变的新趋势,进一步健全数据基础设施运营制度体系。从供给侧看,推动从“数据供给”向“数据—模型—算力协同供给”转型,发展面向人工智能模型训练与应用的定向供给与定制服务模式。从运营环节看,完善多种计费与结算机制,重点适配词元计量、API调用和模型服务等新型价值度量方式,推广按效果付费与按贡献分配相结合的收益机制。从分配环节看,探索基于多主体协同贡献的数据收益分配机制,解决数据、算法与算力等多要素融合下的价值分摊问题。建立与人工智能应用深度耦合的绩效评价体系,将模型效果、应用成效与数据价值转化纳入评价指标。通过制度创新与试点示范,推动形成以能力供给、效果导向、持续迭代为特征的人工智能时代数据基础设施运营新模式。

【本文系国家社科基金重点项目“国家数据基础设施建设运营机制研究”(项目编号:25AZD045)的阶段性成果;北京邮电大学经济管理学院副教授王友奎、易兰丽,对本文亦有贡献;文中案例数据主要参考国家数据局及地方数据管理部门公布的信息】

注释

[1]《中华人民共和国国民经济和社会发展第十五个五年规划纲要》,《人民日报》,2026年3月14日,第1版。

[2]《数据元件互联互通实践 助力跨区域跨行业释放数据价值》,国家数据局网站,2025年12月22日。

[3]杜传忠、李钰葳:《人工智能与大数据深度融合驱动科技创新范式变革的机制与路径》,《社会科学研究》,2026年第1期,第30—40页、第229页。

[4]《广州入选国家数据基础设施建设先行先试试点》,广州市政务服务和数据管理局网站,2025年9月2日。

[5]温兴春、徐友博、张伊华、龚六堂:《公共数据开放、人工智能创新与经济高质量发展——基于“Data+AI”加速器的理论分析》,《数量经济技术经济研究》,2026年第2期,第30—53页。

[6]许诺、毛聚、毛新述、王彦超:《算力部署、数据跨域流动与企业全要素生产率——来自智算中心的证据》,《中国工业经济》,2025年第4期,第61—79页。

[7]苑卫国:《我国数据基础设施建设现状、挑战与优化路径》,《学术前沿》,2025年第10期,第101—107页。

责编:单 宁/美编:石 玉

声明:本文为人民论坛杂志社原创内容,任何单位或个人转载请回复本微信号获得授权,转载时务必标明来源及作者,否则追究法律责任。

责任编辑:韩拓