随着数据要素市场发展与数据合规要求驱动,隐私计算成为近两年资本与市场关注的焦点。在产业快速发展的同时,各类背景的大小厂商涌入隐私计算赛道。
与此同时,今年1月央行印发的《金融科技发展规划(2022-2025年)》再次明确要求,探索建立跨主体数据安全共享隐私计算平台,在保障原始数据不出域前提下规范开展数据共享应用,确保数据交互安全、使用合规、范围可控,实现数据“可用不可见”、“数据不动价值动”。
据21世纪经济报道记者了解,目前银行等金融机构均已引入隐私计算技术,部署相关系统,但不同服务商的技术实现原理不同,反而对部署不同系统的金融机构产生“维护成本高、数据跨平台流通难”的问题。如何安全、合规、高效地实现不同隐私计算平台的互联互通,已成为行业接下来重点攻克的难题。
商业化元年
2021年被业内普遍认为是隐私计算的商业化元年。
一方面,金融机构用户个人信息采集受限,随着《网络安全法》《数据安全法》《个人信息保护法》的相继落地实施,我国网络安全与数据保护领域基本法律框架形成;另一方面,银行保险机构的信息安全保护更加严格,今年银保监会出台《银行保险机构信息科技外包风险监管办法》,从信息科技外包治理、准入、监控评价、风险管理等方面对银行保险机构信息科技外包提出全面要求。
数据合规保护的大背景下,在海外被谷歌、Facebook用于C端个人数据保护的隐私计算技术,在中国的政务数据开放与金融数据流通中大显身手。
隐私计算是一个技术体系,涉及机器学习、分布式机器学习、密码学、安全多方计算、联邦学习等多种技术。
“传统的机器学习是没有隐私可言的,需要把数据汇集在一起,集中进行训练建模。但在数据立法的背景下,数据孤岛和隐私保护问题凸显,只能通过联邦学习建立生态圈,在数据拥有方不出域的情况下,多方联合建模,从技术上解决数据孤岛问题。”大连理工大学副教授李祎表示。
洞见科技CEO姚明告诉记者:“在2018年之前数据处于野蛮流通的状态,诸多民间所谓的征信公司,作为数据中介机构物理复制、传输数据,造成数据留存、数据管控不严引发泄露,甚至有企业主观恶意在没有获取用户授权的情况下贩卖原始数据。如果说数据立法在法律层面约束这类灰色商业模式的发展,那么隐私计算就是从技术层面阻止数据的物理复制、缓存与不经授权的贩卖。”
据记者了解,在政策落地的同时,从2021年四季度起,多家头部金融机构正式启动隐私计算服务商的招采,包括招商银行、兴业银行、华夏银行、渤海银行、北京银行、中国人寿等均已布局隐私计算平台。
下一步,互联互通
在诸多隐私计算技术服务商涌入赛道的同时,不同技术流派的服务商技术实现原理的差异较大,隐私计算原应解决的“数据孤岛”反而演变成为“计算孤岛”。
尤其是金融机构在实际应用中,存在与多个数据源合作的情况,因此部署不同隐私计算平台的机构会面临“成本高、流通难”的困境。
“对于应用方来说,可能会部署很多隐私计算系统,涉及到大量学习、管理、维护成本,而且在诸多黑盒系统中保证数据安全也非常麻烦。”中国银联金融科技研究院新技术团队负责人周雍恺表示,“对于技术提供方而言,也需要投入大量精力用于不同企业的准入安全测试和用户培训,是一件比较吃力不讨好的事。”
为真正实现隐私计算的生产落地,提升应用方的系统架构能力,隐私计算行业开始探索互联互通。
一位保险公司科技创新部高管表示,各家在隐私计算平台上的技术路线存在差异,因此在建设平台时公司确定了一个原则,无论采取怎样的形式,最终要保证不同平台实现异构下的互联互通。
为打破不同隐私计算技术应用的原生壁垒,中国信通院联合多家机构编写《隐私计算跨平台互联互通》系列标准的总体框架,涉及通信规范、互联协议以及应用规范。
据记者多方了解,目前隐私计算平台的互联互通已经从上层管理系统层的接口互通,探索到多方异构隐私计算平台之间中层算法协议层的互联互通。
不同的隐私计算平台将核心算法作为一个黑盒,对算法本身涉及不做定义,仅规范定义算法的基本信息、输入、输出,使算法可以通过插件的形式在不同的技术服务厂商处发布,最终实现互联互通。
目前多家技术服务商正在探索将不同隐私计算平台的算法或协议进行最小粒度的计算原语分解,实现计算原语的抽象和定义,在原语层实现互联互通,继而实现基于底层计算原语的中层算法实现、上层应用实现,最终完成平台互联互通。
“发展到现在,隐私计算技术已远不像刚诞生时那样泾渭分明,而是多条技术路径齐演进。现阶段MPC、TEE与联邦学习三种技术三足鼎立,商用化进程领先。而在实际落地商用的过程中,人们发现单一路径技术的模式并不能满足市场需求,多种技术的融合应用已成为了当下趋势,各家厂商也已达成多元技术实现路径并行的技术共识。”洞见科技CTO何浩向记者表达了他的展望。“在隐私计算业务生态层面,我们构想未来应该由更多的参与方来构成一张更广域的数据智能流通网络。”
(文章来源:21世纪经济报道)