数据使用可控是数据流通安全的核心保障
来源:人民周刊 更新时间:2023-05-24

   参与“数据二十条”起草的过程,我的感受有三点:第一,理性务实地淡化所有权,强调使用权,聚焦数据使用权流通,创造性提出建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的数据产权制度框架,构建中国特色数据产权制度体系。第二,关注流通。交易是流通的一种特殊形式,它的特征就是以货币为对价,划拨、共享、开放、赠与、继承,这都是数据在流通,交易只是一种特殊形式。第三,强调安全可控。安全是信息安全,要保障信息安全,可控是安全的另外一个前提,凡是不可控的东西肯定不安全,可控的东西才有安全的基础,所以数据使用可控是数据流通安全的根本保障。

    数据流通的本质是什么?过去我们讲流通,我把我的数据拷贝一份给你或者给你开个API接口你来调用就行,所以传统明文数据流通就是流通数据本身,明文数据的流通有两大核心障碍:第一,在流通使用中暴露信息并丧失数据价值,你把这份数据拷贝给人家了,或者我在使用当中把API的数据留存下来了,大家都有了。数据的价值在于它所承载的信息的不对称性,越不对称,使用价值越大,数据的价格越高。所以明文数据流通的方式本质上是违背经济学理论的,经济学理论的定价根本依据是稀缺性,所以明文数据不能定价,它违背了稀缺性原则。第二,使用不可控,无法厘清数据使用的“责、权、利”,我把数据给你了,你复制成多少份?交给谁?我无法控制;数据被用于什么目的,以什么方式,用多少次我也不知道;万一某人在某个环节把数据用到了妨碍他人、妨碍社会、危害国家的目的上去了,根据《数据安全法》,所有人都有数据安全责任。怎么厘清?数据流通的问题在于供应侧不愿流通、不会流通、不敢流通。其中,不愿流通是经济问题,可以通过经济手段来补偿和平衡;不会流通,我们有生态、有技术、有专业化服务;怎么解决不敢流通问题,不敢流通问题的本质在于使用不可控。

    数据流通需要树立新的数据安全观念,也就是使用安全。过去认为数据安全很简单,数据在我这儿,就在我的域内使用,在我的控制范围内使用,目的就是不让人家看见,不让人家复制拿走,不让别人使用,传统的数据安全本质就是不流通。现在说数据要流通了,在我域内的数据拿出去给别人用还安全吗?在传统观念中肯定不安全,不安全那还拿出去吗?所以很多做过分类分级安全评估的,就是以保管安全为根本宗旨,当然还有传输安全。当数据要流通起来,跨域使用的时候,担心什么?除了暴露信息,那就是拿去干吗,会出事儿吗?会牵涉到我吗?这才是不敢的原因。数据流通就是多方多元多种数据的协同计算,它能产生巨大的价值,不是加法,可能也不是乘法,有的地方可能是指数级,这才是它的真正价值。它跟开“数据化工厂”没有任何区别,多种原料(数据)在一定的配方和反映条件下(算法)产生化合反应(融合计算),这个过程有可能对他人、社会和国家造成危害或重大危险,因此数据监管势在必行。要建立评估和管控“数据化合反应”的机制,明确数据使用安全责任。管控“数据化合反应”的根本手段就是管控数据融合计算的目的和方式。

    隐私保护计算技术现在很热门,可用不可见,这个词也是我们2018年提出来的,但“可用不可见”只做到了在流通中保护数据信息不暴露,它对使用目的是没有办法控制的。它保障在数据协同计算也就是在流通中的信息安全,不泄露,解决了明文数据流通的第一个问题——暴露信息,在技术上叫关闭信道,即关闭信息通道,在这个基础上,利用计算合约和区块链等技术,通过授权和存证,我们可以记录和管控数据的具体使用、目的、方式和次数,做到“使用可控可计量”,也就是数据使用可控。数据使用可控是数据流通安全的核心保障,做不到这个,安全是不可靠的,凡是不可控的东西一定不安全,可控的东西才有可能安全,道理就在这儿。只有做到数据“可用不可见”,“使用可控可计量”才能厘清数据流通使用的责、权、利,从根本上解决不敢流通的问题,解决数据供给侧的责任问题,打开数据流通的源头大门。同时它也是数据监管的根本抓手,数据监管,监什么,管什么?管的就是数据流通使用的目的、方式和次数,所以合规合在这儿,合规认定定在这儿。

    这件事是可以做到的,而且我们已经做到了,特别是在一些重要部门的高敏感、高价值数据使用上。当然它是有成本的,以算力为成本。场景价值大,数据敏感度高,监管要求高,这三个条件下会有不同的数据安全程度要求。安全度是一个梯度,安全要求越高,保密程度越高,对算力的要求越高。安全梯度是可以调下来的,在技术上已经不是一件难事,已经实现了。随着社会应用的迅速扩大,它的成本,基础设施投资效应会很明显。所以我们各级政府和大数据公司,需要建设数据流通的基础设施。

    [作者为华控清交信息科技(北京)有限公司董事长]