历经三次审议修改的《数据安全法》9月1日起正式施行。作为数据安全领域的关键技术——隐私计算也迅速从小众技术中脱颖而出,广受业界关注。
什么是隐私计算呢?2000年图灵奖得主姚期智曾提出著名的“百万富翁”设想:两个百万富翁在街上相遇,他们都想知道谁更富有,但又不愿意让对方知道自己拥有的真正财富。如何在没有第三方参与的情况下,让对方知道谁更有钱?
这个问题看上去无解,实际上,它反映了数据使用权与所有权之间的矛盾,而隐私计算似乎就是为解决这个矛盾而生的。
什么是隐私计算?
以最为常见的互联网信息服务为例,多数互联网平台在提供服务的时候,往往可以同时获得数据的使用权与实际所有权,用户仅能保留对数据的名义所有权。在公众对数据隐私安全焦虑加剧的今天,有没有一种技术可以让数据使用权与所有权分离,在保障用户数据所有权的同时不影响互联网平台提供正常的信息服务呢?答案就是隐私计算。
简而言之,隐私计算就是通过使用加密处理、多方计算等方法来处理用户隐私数据。数据使用方(例如互联网平台)得到的不再是用户原始数据,而是加密后的数据。赛迪智库网络安全研究所工程师张博卿对《中国电子报》记者说:“作为一种推动数据安全有序流动的解决方案,隐私计算的核心价值是能够实现‘数据可用不可见’‘数据不动模型动’,具备打破数据孤岛、加强隐私保护、强化数据安全合规性的能力。”
“隐私计算一定是涉及多方参与的场景(内部的数据使用不存在隐私问题),而多方参与的场景就必然会引入多方之间的信任问题。”微众银行区块链隐私计算技术负责人李辉忠在接受《中国电子报》记者采访时表示,“隐私计算体系共涉及三个关键技术支撑——区块链、联邦学习和安全多方计算。区块链是一个比较好的解决多方互信问题的基础技术,业界普遍认为隐私计算将会深度结合区块链技术。而联邦学习解决数据联合建模问题,安全多方计算解决多方数据融合问题,这两个技术都是隐私计算的基础技术。”
需要注意的一点是,隐私计算可以在安全可控的前提下实现数据开放流通,但它并不是唯一解。
张博卿强调说:“例如在数据安全合规性方面,也可以通过差分隐私、K-匿名、L-多样性等模型实现数据匿名,进而满足《数据安全法》《网络安全法》的部分合规性要求,但这些技术在数据匿名的过程中削弱了数据蕴含的价值,隐私计算相对而言更好的平衡了数据安全和数据使用价值,在一些场景中更为适用。”
走出“黑盒化”误区
事实上,中国的隐私计算研究从一开始就是和国际同步甚至是领先的。顶层设计方面,《网络安全法》《数据安全法》《个人信息保护法》“三驾马车”并行,倒逼企业在数据采集、使用、流通全环节中重视及投入数据保护,隐私计算行业也因此迎来重大利好。在这样的背景下,以互联网大厂、大数据公司、运营商、金融机构和金融科技企业、隐私计算初创企业为代表的五大类玩家相继入局。腾讯、阿里巴巴、百度、字节跳动、UCloud等大小玩家的身影皆在其中。翼方健数、蚂蚁金服、微众银行、华控清交被视为隐私计算“四小龙”,受到资本青睐。
据不完全统计,2021年上半年,国内隐私计算领域新增融资金额已超过6亿元,融资金额过亿的企业更是超过了50%。在数据安全的新命题下,隐私计算终于迎来了期盼已久的商机。
然而,距离实现真正“破局”尚有一段距离。首先,市场对隐私计算的认知度、认可度仍然不足。这一方面是因为隐私计算技术复杂且常常呈现“黑盒化”现象,导致大部分用户对隐私技术难以理解和信任;另一方面,对技术理解的不够全面,会使用户对技术应用的效果产生过度预期。
对此,李辉忠坦言:“大家在对隐私计算的认知上需要升级,包括在法规层面、科普层面以及生态层面,需要有更多的人去积极地推动这件事情。区块链刚开始也遇到类似的情况,随着越来越多的人参与进来,整个业界对区块链的认知已经有了很大的提升。隐私计算同样也需要有更多的人去积极推动,做到认识和行动统一,打破隐私悖论。”
其次,隐私计算技术的安全性和性能有待进一步完善。张博卿表示:“例如联邦学习技术中,各方贡献的数据结构不一将导致模型训练难,攻击者可供给恶意构造的训练集导致模型输出错误结果。”
李辉忠认为,技术本身就会存在各种各样的问题,比如性能问题、安全问题等。隐私计算在性能上、数据量上、产品体验等方面都带有复杂性,这会导致业界在提供解决方案时不得不做出一些妥协,而这样的妥协是否合理,也是需要时间逐步推进认知。
UCloud优刻得大数据与隐私计算负责人马强对《中国电子报》记者表示:“不管是沙箱、隐私计算,还是多方联邦计算,或多或少都会有一些计算不够完善的地方,比如隐私计算的性能比较弱,能够实现的场景比较少;沙箱计算,需要把数据汇总在一起;联邦计算,只能够针对人工智能来做等等。总体来看,技术上的挑战是比较大的。”
最令人担忧的地方是不同隐私计算平台有可能形成新的数据孤岛,这与隐私计算实现数据安全共享流动的初衷相悖,也将直接影响隐私计算的发展前景。
李辉忠表示,从平台技术选型角度看,目前主流路线包括安全多方计算(MPC)、联邦学习(FL)和区块链。一方面,每个技术路线仍存在安全性、性能、易用性等多方面问题;另一方面,不同的技术各有所长,有各自较为适宜的应用场景。“眼下想要让所有隐私计算平台互联互通起来,存在一定的挑战。”
对此,翼方健数CEO罗震提出了数据和计算互联网概念。他认为,可以让原始的数据孤岛通过私有的隐私计算协议连接起来,形成更大的岛链的同时,不同岛链又可以通过通用的隐私计算方式连接起来,最终形成数据和计算互联网。而李辉忠认为:“关于隐私计算平台互联互通可以开始关注和探讨,但不必急功近利,不妨‘让子弹再飞一会儿’。隐私计算的技术和应用更成熟之后,在供需侧才能够快速推动互通的落地。”
此外,马强指出:“如何对数据进行确权,如何进行估值,如何能够确保数据在法律的安全性,这是数据的确权和估值上、价值评估上是一个比较大的挑战。”他认为,要把这个事情真正做起来,需要良好的生态环境。目前隐私计算赛道上的参与者还在摸索自身定位,暂时没法形成一个比较良好的产业生态。
整体来看,尽管隐私计算在金融、医疗、智慧城市等场景已展现出普遍的需求场景,但目前鉴于法规完善、技术信任等方面不够充分,还没有看到非常亮眼的、标杆性的应用落地。
李辉忠说:“我觉得隐私计算的发展还需要一点时间的,需要依赖于逐步完善的法规制度、逐步优化的技术和产品体验、以及对于隐私计算的信任。”
未来之路该怎么走?
国际知名研究机构Gartner预测,到2025年,50%的大型企业机构将采用隐私计算来处理不可信环境或多方数据分析用例中的数据。业界普遍认为,这个领域还有很大的想象空间。那么,接下来,隐私计算的路究竟该怎么走?
马强认为,数据流通是一个新兴的产业,它的发展模式可以参考其他领域,引入更多的合作方,打造一个开放的平台。以证券交易为例,上交所的上下游产业比较多,比如有律师事务所,有专门负责上市的券商,有购买证券的股民,还有各种监管机构。数据交易也可以参考这样的模式。
他谈到:“数据提供方要把数据进行流通,必须要有券商的机构,确保数据所有权是确权的,有律师机构做合理的审查工作。经过了类似上交所或者是证监会的认定之后,可以进行挂牌交易,挂牌可以分为场内交易和场外交易,这个时候可以提供一个场内的交易平台或者是场外的数据流通平台,后面是有算法提供方和监管方和数据的使用方。”
另外,马强还分享了一个有意思的场景是数字海关,即针对有跨境流通需求的数据,可以使用类似安全屋这样的隐私计算解决方案,在数据本身不出境的情况下,有限定地输出计算结果,为数据安全流通监管提供技术支持。这样既能开放数据流通又能确保数据的安全。“未来数据交易平台不仅面向国内,还可以面向全球。”
究竟什么样的参与者有机会领跑赛道?李辉忠认为:“既要能够从技术层面普及和推广,也要能够在应用角度探索落地合作,最重要的是,还能通过开源生态更好地建立技术信任。”
“未来,隐私计算的应用将带动密码产业、人工智能产业细分领域的发展。随着《数据安全法》《个人信息保护法》《网络安全法》及其配套法规体系的日臻完善,隐私计算在合规性上的作用将受到重视,其应用也将带动整个网络安全产业的发展。”张博卿认为。(记者 宋婧 )