数据脱敏:为电子政务定制脱敏产品
来源:中国电子政务网 更新时间:2016-01-18


随着我国IT技术的日新月异,中国的电子政务建设也朝着为广大民众提供更优质服务的方向而进化。然而任何事物总有其两面性,安全问题也总是随着技术的发展如影随形。

目前我国的许多电子政务系统已经过了十多年的沉淀,自然系统中就存在着大量的居民和企业信息,而且其信息的完整程度也非常高。也就是说我们能够轻易地在政务系统当中找到一个具体的个体,包括其各方面的资料,个人的纳税信息、社保信息、固定资产,甚至医疗信息、办事信息等等。对于这些资料,如果不加以保护,公众的信息就会暴露,变得毫无隐私,给犯罪分子留下可乘之机。

数据为什么要脱敏?

由于受到人力、财力的限制,目前电子政务系统的建设大部分都是外包的。外包商可能会用到开发环境、测试环境、培训环境等等。这些环境当然也会存在数据,而且这些数据往往都是真实的。

为了防止数据泄漏,目前大多数的项目建设还主要靠签署协议,而缺少有效的技术手段。即便在开发环境使用各种安全技术,包括监控、审计、云桌面等,也无法阻止开发人员直接接触数据,而且开发人员能够通过各种方式准确高效地查阅甚至备份自己所处环境的数据。所以,针对非生产环境(包括开发环境、压力测试环境、培训环境等)最有效的数据保护技术就是数据脱敏。

为电子政务定制脱敏产品

鼎甲计算机科技有限公司(以下简称“鼎甲科技”)作为中国电子信息产业集团有限公司旗下品牌,是国家数据安全国产化灾备第一梯队,始终致力于国家命脉行业的数据保护技术与解决方案开发,并为政府和企业提供量身定制数据保护服务。

2014年来,鼎甲科技为电子政务系统量身定制了数据脱敏产品(Scutech InfoMask), 它是鼎甲科技综合数据治理平台针对测试数据管理的解决方案,集合了数据抽取、私密数据漂白、测试数据管理、数据装载等功能于一体,具有流程化、自动化和作业复用等特点。作为软硬一体化的设备,它拥有强大的功能、易于部署和使用等特点,开箱即用式的优势能够极大减轻工作人员的工作强度以及项目周期。

保障用户隐私数据的泄露风险

在各政府机构的电子政务系统中存在着的大量居民和企业单位信息,包括了姓名、居民身份证号码、企业单位名称、组织机构代码、工商注册号、纳税人识别号、电子邮箱、联系地址、电话等等,这些都属于敏感资料,也就是需要保护的对象。只要这些信息都经过脱敏,那么基本上系统中所存在的都是伪造的个体了。

由于电子政务系统的数据量过于庞大,对数据的脱敏程度越高,对运维人员的依赖就越低,同时数据也更加安全。因此,电子政务系统对数据脱敏提出了更高的要求:首先,是要从数据库外键层、系统层面、全单位层面保证数据的关联性;第二,要保证数据不可逆;第三,要保证数据的高仿真。同时,一个优秀的数据脱敏系统还要做到对隐私数据的精准定位。

为了达到脱敏的要求,根据客户隐私数据的定义,InfoMask针对数据库梳理出一套完整的隐私数据的模型和关系。发现功能会从生产数据源进行数据采样,然后对采样数据进行扫描,并根据InfoMask内置的众多隐私数据特征算法进行分析,定位哪些表哪些字段为隐私数据,属于哪种隐私数据。

根据对生产数据的定义,InfoMask会从生产数据库或真实数据库快照等数据源当中周期性地抽取真实数据,且数据源种类支持各种主流的数据库系统。根据定义好的隐私数据模型,InfoMask将已经获取的真实数据使用特定的漂白规则进行脱敏,生成伪造数据。

这样一套完整的伪造数据就存放在InfoMask设备上待用。由于设备是封闭系统,整个过程能够很好地方志数据泄漏。生成的伪数据具备以下特征具有高度仿真,同时保持数据关联性,并能做到隐私算法不可逆,保持数据的唯一性。

对于电子政务系统来说,InfoMask适用于部署专业的数据脱敏漂白系统设备,构建安全可靠的数据安全防护系统,确保本行的企业、个人等隐私数据能有效的进行漂白处理,保障用户隐私数据的泄露风险。目前,InfoMask由于其卓越性能,深受市场青睐。