热门资讯> 正文
2026-01-27 16:33
(来源:科创中国)
隐私计算是实现“数据可用不可见”的核心技术,隐私计算平台繁荣发展,逐渐形成了以隐私计算平台为核心的“平台孤岛”现象。如何解决“平台孤岛”问题,进一步促进数据要素融合和价值成为重要的研究方向。本文梳理了国内外典型的隐私计算平台功能、国内隐私计算平台的互联生态现状,结合行业实践案例,剖析了节点和算法互联的不同模式。总结了隐私计算跨平台互联的难点以及多种挑战。最后提出具体对策建议。
随着数据要素被确认为国家最新的生产要素,如何加速数据的要素化、市场化配置进程成为国家重点关注的问题。保障数据安全与隐私保护是数据流通与应用的底线要求,因此,隐私计算成为在保护隐私的基础上进行多方数据协同的关键技术之一。
隐私计算按照当前行业的主流思想可以分为3类技术,安全多方计算(MPC)、联邦学习(FL)和可信执行环境(TEE)。随着隐私计算技术的蓬勃发展,通过数据加密、参数共享代替数据共享等模式,实现了“数据孤岛”的有效连接,数据持有方的数据在不出其管理域的前提下,完成了多方协作计算。在部署多个框架、重新适配业界主流框架和推动不同平台框架的互联开放这3个选项中,推动不同平台框架的互联开放将成为解决“平台孤岛”问题的最优方案,如何实现不同隐私计算框架的互联成为了业界关注和亟待解决的难题。
1、隐私计算平台互联现状
1.1 隐私计算平台发展现状
根据公开信息,整理了国内外主流的隐私计算平台和典型隐私计算工具,隐私计算平台从上文提到的主流技术视角主要分为3类,具体如表1所示。
一是以工具包、引用库形式提供隐私计算的必要功能。行业上相对成熟的主要包括数据匿名化、差分隐私、同态加密库等。其技术核心都在于构建安全多方计算和联邦学习的基础能力和协议,并且采用与计算引擎松耦合的模式,实现跨平台的应用。
二是只提供多方安全计算、联邦学习或可信执行环境单一功能的平台。
三是提供多类功能的综合性平台。国内外多个平台提供的包含联邦学习、安全多方计算和可信执行环境中的多种能力。中国隐私计算的平台,以互联网公司、通信行业、金融行业和软件服务商为主要研发方,其多侧重于研发综合性隐私计算平台。
表1 国内外隐私计算平台工具
隐私计算平台与区块链技术的结合逐渐成为主流,在遵循安全协议的基础上,通过区块链进行身份认证、对计算参与方的行为数据进行上链和以智能合约实现协议自动化等方式,进一步保障计算参与者的身份可信和行为可追溯。
1.2 隐私计算平台互联的生态现状
隐私计算平台互联场景针对不同的数据持有方,采用不同的隐私计算平台进行联合建模或联合计算时,因计算框架或采用的计算工具不同进一步导致“平台孤岛”。中国的研究机构、互联网行业、金融行业都开始探索隐私计算框架的互联互通,从代码开源角度可分为开源互联和闭源互联。从互联的推动主体视角,主要包括以下3类。
一是以金融行业为中心的、代码闭源隐私计算平台互联互通。北京金融产业科技联盟是在中国人民银行指导下,由中国金融电子化集团发起的综合性金融科技联合创新工作平台,该联盟牵头开展了金融领域隐私计算数据流通平台的互联互通模式探索,成为金融行业的主流互联互通标准。
二是以互联网企业为中心的、开源研发生态。微众银行开源的FATE 2.0开放开源异构系统互联互通开发指南,意图推动异构系统的互联互通。蚂蚁集团开源的隐语框架,在隐私计算联盟的组织下,制定系列隐私计算跨平台互联互通开放协议。
三是点状的以自研平台为中心推进的、闭源的互联互通实践。中国电信和中国银联金融科技研究院的隐私计算平台构建“插拔式”算法组件的互联互通,中国移动基于其“1+X”隐私计算平台与洞见科技、富数科技、同盾科技和华控清交等多个软件服务商公司实现互联互通。
2、隐私计算平台互联的技术路径
不同隐私计算平台开发方就互联路径尚未达成共识。主要有2种思路,一是从平台架构和开放层次深度,在2022年可信隐私计算峰会上,有企业提出隐私计算互联从系统架构视角,可以按照应用层、算法层和原语层进行分层互通。北京金融产业科技联盟提出按照管理面和数据面解耦进行互联互通。叶剑等提出按照“底层通信—中间层交互—顶层应用”的思路设计隐私计算平台的互联互通。
2.1 研究范畴
中华人民共和国工业和信息化部批准发布的行业标准《隐私计算跨平台互联互通第1部分:总体框架》(编号 YD/T 4961.1—2024)定义隐私计算平台互联互通为“具有不同系统架构或功能实现方案的隐私计算技术平台(包括同一平台的不同版本)之间通过统一规范的接口、协议等实现跨平台数据、算法、算力的交互与协同,以支持部署不同技术平台产品用户共同完成同一隐私计算任务”。
在推动隐私计算跨平台互联的过程中,不同框架的节点不能直接调度其他平台的所有计算资源,包括其数据集和最小粒度的计算单元。算法互联也是同理,隐私计算平台只能调用自有平台的基础算法组件和算子,不能跨平台调度,但如果是外部第三方插件式的算法组件,多方都可调度算法相同算法组件实现互通。
需要指出的是,数据资源互联不在我们讨论范围内。不同隐私计算平台开放数据集以供互相访问的场景也不在我们的探讨范围内。隐私计算平台互联讨论内容如图1所示。
2.2 节点互联
节点是指承载具体计算任务的节点,可以是物理机、云虚拟机或容器。节点互联互通贯穿联合计算任务全周期,在框架部署阶段,各个隐私计算框架以信息配置的方式,明确单个平台内部节点的资源、IP(互联网协议)地址和端口等信息,默认在配置完成后内部各个节点可以互信。节点互联需要依据待同步的信息类型制定不同的通信协议。
2.2.1 联盟方节点自治
每个联盟方提供一个节点或一个集群参与联合计算,每个计算节点资源调度由联盟方节点的调度功能模块完成。集群管理等相关功能可能部署在代理节点上,也可能部署在单独某计算节点上,以完成多节点的管理、监控。在此种场景下,跨平台的节点互联互通是只需要面向不同框架开放代理节点即可。
互联方式也有2种,一种是以单平台为中心,根据其开放的节点通信接口,构建协议转换模块,实现节点互联,另一种是构建独立于各平台的独立开放协议,所有平台根据协议进行面向外部协议的适配模块,实现互联互通。方式一更适合单企业主导的互联互通模式,可扩展性较差;方式二更适合多企业、研发方参与的联盟式生态,可扩展性强,但需要所有参与方都进行适配。
值得注意的是,在每个隐私计算平台内部,其节点的信任机制由平台内部的信任机制控制,构建多方互信的节点认证方法,是节点互联互通后续研究的重要方向。
2.2.2 统一引擎管理
部分隐私计算平台采用统一管理不同联盟方计算节点的模式进行内部节点互联与调度,多采用成熟的分布式框架。平台不以联盟方为区隔,采用分布式管理引擎统一管理所有计算节点,并在物理节点上虚拟形成逻辑计算设备,由逻辑计算设备调度物理计算节点,实现任务的协同计算。
目前来看,早期系统常依赖显式的代理节点实现跨方通信,而当前云原生平台普遍通过服务网格将通信、认证与策略控制下沉至基础设施层,显著简化了节点互联的复杂性。当前,节点互联的核心关注点已转向身份认证、网络隔离与跨域通信协议的标准化,而非早期多样化的拓扑结构设计。
2.3 算法互联
算法互联是业界关心和积极探索的重点。行业上,一般用“黑盒”“白盒”针对算法组件互联进行分类,“黑盒”“白盒”的互联互通模式与参与企业是否开源其平台、主导塑造的生态模式息息相关。
算法互联的是当用户发起如隐私求交、联合统计或联合建模推理等任务时,不同隐私计算平台调用内部算法组件协同完成任务的算法执行过程互联。计算任务调度的互联是指多方发起计算任务后,不同的隐私计算平台完成不同的task,同步task的执行状态和结果数据,每个task调用独立的算法组件完成,同步内容与DAG中作业编排数据对象中的元数据结构相符。计算步骤的互联互通是不仅包含了task状态和数据的同步,也包含了task执行过程中的数据同步。
算法互联从平台改造视角,可以分为3种。
一是单向适配的模式,此种方法一般不涉及算法内部流程的同步,重点在于算法任务调度的互联互通,对应业界“黑盒”模式。
二是双向适配模式,双方都有适配模块一般是基于点对点的平台互联,在隐私计算平台发展前期,此种模式较为常见,且都是基于已成型平台进行互通,算法内部逻辑互不开放,采用算法调度层面互通。因此,也常见于“黑盒”模式。以独立适配器完成格式转换和数据传输等功能,但是,定制化程度高,一旦增加新平台,需要大量工程化改造。这正是从双向互联到基于公开协议的多向开放互联的过渡形态。
三是多向开放互联模式,任意参与方依据公开制定的协议规范,完成内部算法流程步骤的改造和算法调度的改造,即可实现算法互联。但是,由于面临算法开放后的知识产权问题,部分平台采用算法组件改造的模式,保障底层算法的不可见。将算法拆解成标准组件,如数据预处理、梯度计算、安全聚合等,也可将算法整体封装成独立组件,规范组件调用间的数据通信格式,保留算法底层计算方法的基础上实现算法互联。
2.4 算法互联协议
跨隐私计算平台互联互通的基础在于协议,不同的适配模式下,协议分为双方协定基础上的定制化协议和多方共识的标准化协议。从互联互通的深度上来说,算法调度互联的通信协议,主要是算法任务的调度信息的互联,算法互联则包括算法流程过程中交互的数据结构、算法内部协议的配置信息,表2展示了由隐私计算联盟2023年发布的《隐私计算 跨平台互联互通开放协议第1部分:ECDH−PSI》中ECDH−PSI算法的参数协商数据结构。
表2 已有规范中ECDH−PSI算法参数协商数据结构示例
消息队列是实现互联互通的调度组件。通过消息中间件,通过消息的产生和消费,实现互通信息的更新,可以以任务要素标识符(ID)作为消息主题,构建基于协议的消息格式,实现消息互通。
3、隐私计算平台互联的难点与趋势
3.1 互联难点
总体来看,隐私计算平台互联,仍然面临着底层技术不兼容、跨平台数据资源互操作难和复杂数据交互流程提升数据泄露风险,以及多方通信性能难以满足用户需求等难题。
从算法视角看,深层次的算法互联,技术的兼容性仍然是跨隐私计算互联平台面临的难题。另外,各种安全和加密算法是隐私计算核心技术,不同平台采用的不同底层安全加密算法也提升了算法互联层面的难度。
从数据视角看,不同隐私计算平台采用不同数据格式和不同数据预处理方法,不同特征工程的数据处理方法也提升了跨平台互联的适配和操作复杂性。
从安全视角看,跨平台的隐私计算任务调度增加了数据流转的环节,不同技术框架和不同的数据节点都可能引入新的安全漏洞,增加数据泄露的风险。而且,跨平台的隐私计算互联,进一步增加了监管部门的监管难度。
从性能视角看,跨平台的隐私计算平台互联往往面临着跨地域的通信,基础网络能否保障跨平台的通信时延要求存在不确定性。另外,由于不同平台采用的算法和架构不一致,平台间的任务计算效率存在差异,跨平台的互联,尤其是面临大规模数据的计算任务,会带来额外的计算和通信消耗,可能会引入新的效率性能瓶颈。
从生态视角看,隐私计算平台互联的驱动并非仅仅是技术驱动,也来自实际场景需求的市场驱动,但是市场由大型互联网企业、科技创新型企业、研究机构和以产品盈利为目标的技术服务型公司构成,各方利益难以平衡导致隐私计算平台的互联互通难度大大提升。
3.2 发展趋势
虽然隐私计算平台互联互通面临各种挑战,但是跨平台互联仍然是未来发展的重要趋势,各个隐私计算平台主导方也在持续推动跨隐私计算平台互联互通,目前已经逐渐形成了小范围的开放互联实践。
标准和规范方面,金融行业、电信行业都在探索行业内部的隐私计算平台互联标准。未来如何在符合不同行业监管要求和业务需求的基础上统一各行业标准、形成可兼容的标准体系成为了隐私计算平台各研发方的重点研究方向。
技术方面,规模化的、基于开放协议的平台互联互通将逐渐成为更多技术方的选择。多技术融合可能成为隐私计算跨平台互联互通完成计算任务的辅助手段,性能提升和安全保障也将成为因计算技术互联互通的重要研究方向。如何保障各方知识产权、利益分配合理基础上,实现各算法的进一步互联互通也成为后续重点研究问题。
总体来说,隐私计算平台作为数据流通基础设施的重要组成,对互通方案的可落地性要求会随着应用场景的增加而更加严格,各个参与主体由于商业考量导致生态小范围内闭源和技术差异导致的互通难度大都将随着市场需求的增加和技术进步逐渐实现突破。
4、结论
我们梳理了相关文献和公开资料,从功能视角切入当前隐私计算平台,结合隐私计算平台互联互通实践,总结了当前主要的互联方案。目前已形成以金融行业和互联网企业为中心的小规模探索型互联互通生态。同时结合当前生态,根据隐私计算平台的算法互联,从落地难度视角出发,明确隐私计算平台互联互通的适配难度、方式,从适配的工程化、复杂性角度阐述各种模式与当前行业“黑盒”“白盒”式互联的关系。
隐私计算的互联互通仍然处在小范围的试点实践过程中,单场景的应用较多,规范化的落地实践仍然面临着技术、监管和生态上的挑战。但是,随着鼓励数据开放、数据要素流通的政策文件频发,中国不断增加的数据流通需求将有效驱动技术的进步,而生态开放将会成为制约隐私计算互联互通的核心要素之一。因此,构建兼容并存、大规模公开互联、小规模封闭互联的模式可能成为未来隐私计算互联互通的重要模式。
本文作者:刘颖慧、魏进武、张溶芳、蔡一欣、李堃
作者简介:刘颖慧,北京交通大学电子信息工程学院,中国联合网络通信有限公司研究院,高级工程师,研究方向为数据流通;魏进武(通信作者),中国联合网络通信有限公司研究院,教授级高级工程师,研究方向为卫星互联网与大数据。
文章来源:刘颖慧, 魏进武, 张溶芳, 等. 数据要素时代的隐私计算平台互联路径与挑战[J]. 科技导报, 2025, 43(24): 17−26.
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。