对于大数据征信而言,数据的来源主要源于政府、金融机构和民营企业。
不过相对而言,中国大部分的核心数据掌握在政府部门手中,对判断个人与企业信用至关重要的相关数据亦在其中。以往这些数据大多处于沉睡状态,但是现在,越来越多的数据正在被想方设法开放出来。
这或许会给大数据征信带来新的变化。
关于大数据征信,网易科技此前已经对行业规模及参与者做了深入报道,详情请查阅:
征信系列报道(6):市场能过千亿吗
征信系列报道(5):独立第三方征信怎么做
大数据征信系列报道(4):金融系大数据征信疾进
大数据征信系列报道(3):不拼技术的考拉征信
大数据征信系列报道(2):芝麻信用如何破题
大数据征信系列报道(1):华道征信如何运作?
文/温泉
11月26日下午4点,完成了当天的授课之后,复旦大学国际关系与公共事务学院副教授郑磊匆匆打车赶往机场。
他要搭乘当天的飞机赶到北京,参加第二天国家信息中心举办的开放数据的交流会,周末还要参加在清华大学举办的大数据研讨会。
郑磊还有一个职务是“复旦大学数字与移动治理实验室主任”,这个实验室成立于2010年,致力于对政府治理在数字时代所面临的新机遇和新问题进行应用型实验和研究。这两年来,这个实验室发表了一系列关于开放数据的研究成果,郑磊也逐渐参与到各地的数据开放探索当中。
意愿和能力都有问题
让政府开放数据,并不是一件容易的事。
以中国最早的征信企业之一——中诚信征信为例。中诚信征信业务起步于2002年,其内部有一个专门的部门负责收集信息。10年来,这个部门收集的数据覆盖了约3000万家企业和逾1亿自然人,但是有合作关系的政府部门仅仅集中在东部一些经济较发达的地区。
中诚信征信执行董事孔令强告诉网易科技,就采集政府职能部门信息而言,身份认证和学籍学历信息基本全国统一,只要和相关部门商谈就可以,其他很多部门的信息是分省或者分地区的,得和各个省或地区分别谈。以往每个省市要想统筹本地区各个部门的信息也非常困难,因此这样的合作需要和各个部门分别谈。
中国软件评测中心从2002年开始做政府网站绩效评估,中国软件评测中心副主任张少彤参与这项工作十多年。他向网易科技总结,现在政府网站公开的70%—80%的信息都是“文章类信息”,而非数据。这些“文章类信息”大致可以分为三类:一类是包括工作动态、地方要闻、领导活动等带有新闻属性的信息;一类是地方发文、人事任免、招投标、财政等文件类信息;一类是办事信息,比如行政审批、公共服务指南等。
“即使是公开的数据,一般也是宏观经济运行的数据,比如GDP这类宏观数字,现在还没有深入到企业和个人的具体信息这个层面。”张少彤对网易科技坦言。
对于政府数据开放程度不高的原因,多位受访者都认为,这其中既有意愿问题,也有能力问题。
“信息就是权力,谁掌握关键信息,谁就掌握权力。数据和职能是相关的,有哪些信息,就意味着你能发挥多大作用。”国家行政学院公管教研部副研究员何哲向网易科技指出。本部门的信息掌握程度,往往决定了本部门在整个社会和政府内部链条中的作用和地位,因此,从各自利益出发,每个部门都希望将信息牢牢控制在自己手中,从而增加自身在整个体系内的地位和增大与其他部门的博弈能力。
很多时候,这样的公开还意味着权力要接受监督,这更增加了开放数据的阻力。上海金融与法律研究院研究员聂日明向网易科技举例:“别的不说,你就单看一个‘三公经费’的公开,就让多少政府部门感到狼狈。再比如,政府的失业保险、最低生活保障经费都发给了谁,这恐怕是很多地方都不敢公开的。”
主动公开的意愿不足之外,强制性的压力也不够。2014年年末,新华社参编部曾经做过一组关于大数据产业发展的调研,这次调研的成果曾经发表在《经济参考报》上。当时一位参与调研的新华社记者告诉网易科技,采访到最后发现,每个部门背后都站着一部法律,比如统计有统计法,工商有工商法,这些部门法规就要求有的数据是不能公开的。相反,要求数据公开的法律到目前为止只有一部从2008年开始实施的《政府信息公开条例》,这个条例还没有部门法规的立法层级高,一旦发生矛盾,都是按照更高层级的法律处理问题,数据开放的要求往往会败下阵来。“开放数据,需要进行整个体系的全面调整,需要进行专门立法。但是,这部法律的制定,目前争议很大。”他告诉网易科技。
除了意愿,还有能力问题。张少彤告诉网易科技,如果数据要公开到企业和个人的层面,专业性就比较强了,哪些数据可以公开、哪些数据不能公开就需要理清楚,而要弄清楚这些问题就要懂得相关业务,国家没法像要求政府信息公开一样,出一个普遍的强制性法律,必须具体问题具体分析,因为这涉及到国家安全、企业商业秘密和个人隐私。“这方面目前还没有相关的标准,还在探讨当中。”他说。
经济增长转型促进数据开放
然而,尽管开放数据的阻力和困难一大堆,郑磊这两年看到的,却是越来越多的地方在尝试开放政府数据,比较典型的是北京、上海和广东省佛山市南海区。
他本人就亲自参与了上海市“开放数据三年规划”的制定,这个课题已经做了一年,将于今年12月底结题。
他告诉网易科技,现在上海市准备推出一个开放数据的“正面清单”,就是把“哪些数据可以开放”列出来。设想中,三年以后,上海市可能会推出一个“负面清单”,就是把“哪些数据不能开放”列出来,其他数据都要开放。
这两年和政府部门接触下来,他深深地感受到,对政府部门讲“应该开放数据”这些大道理没用,必须要让相关部门意识到开放数据“对我有什么好处”。
今年8月,上海市举办了“2015上海开放数据创新应用大赛”,这个比赛由上海市经济和信息化委员会、上海市交通委员会主办,由多个政府部门和公共机构联手拿出超过1000G的交通信息数据,绝大部分属于首次对社会开放。借助这些数据,主办方希望通过吸引社会参与,从而为化解上海的“交通难”提供思路。结果,决赛上的一幕让郑磊印象非常深刻。
他回忆,当时有15个团队入围决赛,听了这15个团队报告创意思路和技术方案之后,上海市交通委相关领导当场发言“大开眼界,深受启发”。他记得当时有一个团队是利用开放出来的数据,解决新能源汽车租赁点的选址问题。上海市交通委的一位领导说:“巧了,昨天市长刚找我,问我推动新能源车应用有什么办法。”郑磊记得上海市交通委当时表态:“把这15个团队都请到交通委来,和相关处室对接,我们想办法让这些项目一一落地。”
上海市负责开放数据工作的,是上海市经济和信息化委员会信息化推进处。该处副处长裘薇告诉网易科技,开放数据目前是上海市的重点工作,当下正在进行的是对各类信息系统数据资源梳理、编目和注册,理清每项数据的开放程度。
“下一步,上海市准备出台《政府数据资源共享管理办法》,从政策层面推动数据开放。”裘薇说,“如果有的数据,相关部门认为不能开放,必须给出理由。”同时,裘薇告诉网易科技,作为这项措施的配套制度,上海市还将成立一个政府数据开放的专家组,由专家组进行对不开放数据的理由进行审核,通过审核的才可以不开放,其他的数据必须开放。
在广东省佛山市南海区,数据开放的探索更进了一步。南海区专门成立了“南海区数据统筹局”。目前大多数据开放工作是由全国各地的经信委(即“经济和信息化委员会”)负责,经信委和地方各部门属同一级别,工作推进有难度。南海区数据统筹局政务网络中心主任赵韶锋告诉网易科技,南海区数据统筹局是由区委区政府办公室牵头成立,更易于协调其他部门,再加上区委区政府的领导比较重视这方面的工作,统筹起来比同一级别的部门更有力。
他告诉网易科技,南海区数据统筹局还有一个职能,就是负责区内电子政务建设项目的审批,区内各部门的电子政务建设方面每年都要报新项目,这使得该局在与其他部门沟通时有一个有效的“抓手”。
赵韶锋同时告诉网易科技,哪些数据可以开放,开放到什么程度,是与各个部门不断博弈的过程。“比如,我们看到北京或者上海开放了某些数据,我们就去和相关部门协调,看看能不能开放同类数据,如果不能开放,理由是什么。”赵韶锋举例。
政府层面推进的压力和动力是否足够?郑磊总结,地方政府推动数据开放的压力主要来自实现经济增长方式转型和创新驱动。目前,全国各地经济增速普遍下降,如果想推动经济增长、促进创新创业,很多时候需要政府开放更多的数据。“比如上海目前就在反思,为什么互联网巨头BAT(百度、阿里巴巴、腾讯)没有一家在上海。”郑磊告诉网易科技。
今年1月底的上海政协会议上,“大力实施创新驱动发展战略、加快建设科技创新中心”被列为上海市政府2015年的1号课题,由上海市委书记韩正担任课题组组长。
而在全国层面,今年1月已有媒体报道,《政府信息公开条例》的修订已经启动。近年来,公众对信息公开的需求不断增长。在2014年中国政法大学法治政府研究院召开的《政府信息公开条例》修改研讨会上,北京市高级人民法院行政审判庭庭长程琥介绍,北京近年来关于政府信息公开的纠纷案例占整个行政诉讼的比重不断增加。2012年时政府信息公开行政案件所占比重为十分之一,而2013年时已经猛增到占比六分之一。
“一个改革能不能成功,标志之一是看它能不能上升为法律。因为一旦成为法律,就可以调动全社会的资源去推动。”何哲向网易科技指出,他相信这个过程不会太长。
信用信息共享“倒逼”数据开放
政府数据开放在全国各地有零星的尝试,但是社会信用信息共享交换的工作却已经在全国大力推进。
社会信用体系建设部际联席会议制度2007年即已建立,2012年进行过一次职责和成员单位的调整。但是,多年来在社会公众层面并未见到多大响动。
从2014年6月中国首部国家级社会信用体系建设专项规划《社会信用体系建设规划纲要(2014—2020年)》发布以来,社会信用体系建设的推进步伐明显加快,相关消息密集起来。
社会信用信息共享交换平台的建设,由国家发展改革委和中国人民银行的统筹指导,国家信息中心负责推进。
2015年2月,社会信用体系建设部际信用信息共享交换网站上线试运行,实现了10余个部门通过平台发布信用共享目录或文件。
6月1日,“信用中国”网站上线运行,公开披露企业和个人的失信行为。“信用中国”是由社会信用体系建设部际联席会议39个成员单位联合建立的信用信息共享公示平台,披露了失信黑名单,涉及税收违法、失信被执行人(老赖)、商业欺诈、学术不端、制假售假等多种失信行为。
10月30日,国家层面统一信用信息共享交换平台上线试运行,为社会信用体系建设部级联席会议所有成员单位信用信息共享和交换提供支持。
11月,国家信息中心副主任周民在接受媒体采访时表示:“目前,国家统一信用信息共享平台已经连通了39个中央部门,下一步我们将努力对接更多中央部门,以及加速与32个省(区、市)信用信息平台的对接。同时,加快与人民银行征信平台的对接。”
11月初,由国家发展改革委、国家工商总局等38个部门联合签署的《失信企业协同监管和联合惩戒合作备忘录》印发实施。
11月12日,国家发改委政研室主任、新闻发言人施子海表示,年底前我国全面实施统一社会信用代码制度,加快推进存量代码转换和基础信息共享。
在基层,这项工作的推进也有明显的感受。一位参与了多地信用信息共享交换平台建设的业内人士告诉网易科技,政务信息资源共享交换平台建设的工作已经进行了10年,但是进展并不顺利。这项工作一般由地方信息中心、经信委负责,遇到的问题就是——凭什么让各部门把信息都纳入到统一平台上。在承建各地信用信息交换共享平台之初,他们曾以为各地都已经有了一定的数据基础,后来才发现,各地的信息平台只有一堆“目录”,但是目录下面却没有数据。网易科技向更多政府及行业人士核实是否存在这种现象,得到了多位人士的认可。
前述人士认为,造成这种现象的原因在于,过去的信息共享,不是建立在需求的基础上,负责落实的各部门并不能感受到共享信息有什么实实在在的用处。
“现在社会信用信息共享交换平台的建设,正好解决了这个问题,大家非常明确,这些数据拿来是判断信用的。所以,我们在实际工作中反而是拿着《公共信用信息管理办法》去和各个部门要数据,信用信息的共享实际上反而倒逼政府开放数据。”该人士向网易科技指出。
即使是这样,数据开放的弹性也很大。该人士告诉网易科技,政府掌握的公共信息当中,和判断信用相关的一般是三类信息:身份信息、资质信息、提示信息(即欠税、欠社保、欠水电费等信息的提示)。“比如欠费方面的数据,开放的方式就有很多。一般很少直接给出具体额度,而是代之以告知‘欠还是不欠’,或者给一个欠税的额度区间。”他透露。