2015年5月27日9:00-11:40大数据时代的社会治理与政府职能转型论坛将在贵阳国际生态会议中心2楼4会议室召开。
主持人:清华大学公共管理学院副院长、中国信息协会政务大数据专委会副主任孟庆国
尊敬的各位专家,各位嘉宾,大家早上好。2015贵阳国际大数据博览会,大数据时代的社会治理与政府转型论坛现在开始。我叫孟庆国,也是中国信息协会大数据分会政务大数据专委会副主任,非常高兴主持本次的论坛,昨天和今天大家带来的数据创新进行了深入的探讨,包括两个层面,一个是大数据的机遇问题,我们社会管理和政府本身如果面对大数据的挑战,这些问题大家是充满期待的,今天我们的论坛就围绕这些内容展开。我们今天就一些智能转型的问题进行深入探讨。
北京贸促会副会长 林彬
近年来,大数据的概念,改变了人们的工作和生活方式,作为新兴技术,大数据能够有效的集成各类经济,生态领域的信息资源,为政府制定各种决策,提供技术基础和支撑,世界上越来越多的国家已经开始从战略层面认识大数据,在政府治理领域融入大数据的思维。在这个背景下,我国政府也顺应了时代发展的趋势,推进国家治理,充分利用大数据,政府的治理能力和社会管理水平,如何大数据的开发和利用,为政府提升带来了新的机遇,让历史多样的动态的数据有效的集成为对管理者有价值的信息资源,有助于政府管理理念和治理模式的转变。
利用大数据可以使政府治理,所依据的数据资料更加客观全面,也能使不同机构之间的协调更加合理,节约治理成本,和加强治理能力的现代化进程。本次题目是大数据时代的社会治理与政府职能转型,今天的嘉宾将从执行与效果评估和监督的角度,探索政府数据开放和共享平台,促进政府职能转变。
国家信息中心副主任 李凯
我非常高兴参加大数据时代的社会治理与政府职能转型的论坛,首先让我代表国家信息分会对本次活动表示热烈的祝贺以及各位的到来表示诚挚的欢迎。今天互联网正在发生新的变化,这些变化可能包括很多方面,首先是这个数据量大规模的发展,种类繁多交换速度的提高,产生了大密度的数据,相对于过去的数据相比,它隐含着巨大的价值。
另一方面技术设施也在发生变化,一体机技术,分布式技术,使得企业的数据中心从原来的机房变成了越来越社会化的集群,这个基础设施也在发生着非常快的,非常新的变化。第三就是在数据应用方面,随着技术交换集中,能够统一的调度,使得数据的这种深入的挖掘,这种跨界的分析利用成为了可能。那所有的这一切都带来了社会组织,社会的治理模式以及政府管理等等重大的变革和创新。那么大数据来到的今天,社会治理能力现代化已经成为了新的时代的一个新的课题,作为政府如何面对大数据时代的机遇与挑战,如何什么创新降低政府的运行成本,提升城市的运营能力成为了当务之急。
国家发改委也是改变了过去长期以投资项目审批为核心的这种业务管理模式,那目前也正在大规模的利用这些技术,和大数据分析,目前推出了对外的政府办公大厅,那么在线的审批,项目库,国家和社会资本融合的项目库,支持国家领导人高法的信息支撑系统,然后社会信用的这个共享系统,空间地理信息,信息交换系统,以及建立了大数据的分析中心。所有的举措,在发改委过去是很难见到的,现在随着大数据时代的推进,国家发改委的整个工作也朝着信息化,朝着大数据应用改变。大数据时代既为促进我们国家的治理方式,理念的转变,提供着机遇,也为我们社会治理创新提供了挑战,大数据时代的特点,变革社会治理的思考方式,这是大数据时代的需要。
我们在治理领域里面,大数据影响着社会治理和客观环境,逐渐成为创新的基础,成为社会治理科学化的核心。应对大数据时代面临的时代问题,关键要强化自身的大数据意识,促进公共数据更大范围的开放和共享,加强相关基础设施的建设,及人才培养,建立健全社会治理,大数据治理开发利用,共享的相关的法律法规。
在重要的机遇期,政府勇于提起政府的社会责任,以社会管理,为民服务为宗旨,实现政府向便民的服务型政府转变,政府为了实现大数据服务于民,要积极的建设政府数据开放平台,把掌握的数据开放给社会,让更多的人参与到信息创新中来,这里面有很多成功的先例。我上个月去过大连一趟,就是传统经济中受到电子商务的冲击,实体的百货商店业务下降非常快,像杭州连续三年营业额都以50%的下降,怎么利用大数据,像天津的王府井商业街,这里有大量的店铺,顾客也非常多,大量的年轻人到这里来体验,很少有人下单,所以这些商店开的变得像展览中心,中兴古安就想出一个办法,就把所有的商家最后一公里的WIFI免费建立了。
建立了以后,所有现场的顾客在商场的轨迹,他用高精度的定位系统,然后能够侦别哪个人在现场,然后有目的的,有针对性的推送商品的下单目录,体验以后,他就可以在自己特殊终端上下单,我买了鞋,他看你走了六个柜台,他就侦测到你是来买鞋的,就知道你是哪类的客户,你过去大概在哪几个城市生活,有针对性的来给你鞋。下单以后,你的销售收入就跟电子店和实体店进行分成,这样就能有机的结合,这样会加大销售额的发展,这些数据的开放,能够实现双赢的目的,我相信现实中有大量这样的案例。
国家信息中心专家委员会副主任 宁家骏
我学习了在昨天大会上马凯总理做的重要讲话,他其中第四条建议就是要信息开放,我们讨论政府信息的公开和开放,这个非常重要。这个在周日我们在一个会上,在国办召开的会上,我聆听了国务院黄秘书长的讲话,也是受益匪浅,他讲到为什么现在人要谈到数据开放,他说因为我们按照党的十八大,三中四中全会的精神就是要依法治国,就是依宪治国,公民有两大权利,一个就是知情权,一个就是参政权。
过去毛主席早就说过,我们应该相信群众和相信党。所以你怎么相信呢?你首先要透明,你没有透明,你没有公开,你怎么可能做到让百姓相信政府,所以在这个意义止说,我们说大数据时代信息开发更重要。
我简要讲一下,我们面临的新的机遇和挑战,就像刚才领导说的,现在移动化,社交化,大数据云计算成为当前发展的主要趋势,现在以平台,以基础设施,以软件作为平台,现在更催生了大数据,必须以服务的对象为目标,来实现信息共享,信息共享最好的手段就是信息的公开。所以我们认为大数据将成为政府信息化核心的驱动力,所以我们必须要进行全面的共享。我们传统方式不能比拟的,它可以提供政府的整体分析和能力,所以它成为提升政府治理能力的东西。
我们要三个环节,第一个就是公信力要从透明开始,第一个是透明,第二个是承诺,第三个是兑现承诺。怎么来兑现承诺,怎么做出承诺,很重要的就是要通过大数据应用,为我们政府的决策者提供我们这样的依据。那么现在政府正在改革之中,应该说公务员都非常辛苦,工作非常累,如果说我们能够注意数据的积累,我们可以把我们的工作变得常态化。我们当前要深刻的理解大数据发展,对影响国家治理能力的战略,成为我们国家发展战略的一个新的领域。在这种情况下,我们说大数据成为提高治理能力现代化的一个有效的途径。我们不少城市都在积极的发展,应该说我们贵阳市是走在全国的前列,把大数据引入政府治理,是我们管理现代化的必然要求。
特别是大数据与政府的创新,有很大的机遇,这个刚才也提到了,国家发改委正在牵头建立大数据的平台,利用大数据,只有这样子才能提升我们大数据的公开信,同时我们说大数据的政府公开,中央已经有了明确的规定,有相关的法律依据。去年国办发的66号文件,明确了政府信息化科学发展的意见,其中把推动信息共享和数据利用作为协调发展的重要任务,同时也要求各地各部门更加积极主动的推动信息公开,国家现在就像前面说的,昨天发改委的领导也参加会议,已经在会上说,正在研究制定战略和计划,据我个人了解,经过20多个部门协调,明确的要整合信息系统,整合各部门的信息中心,加快基础设施的建设,要更加积极主动的推动信息公开,围绕党和政府的中心工作和公众的期盼,以保障人民群众知情权,参与权和监督权为目标,这个来推动我们的信息就好有。
我个人觉得在当前推动信息公开要在五个方面,第一个要权利的信息公开,要推进财政资金信息公开,加强公共资源配置信息公开,推动公共监管的公开。最后我还想说,我们同时按照本届政府在今年的政府工作报告上,大家看到了克强总理明确提出了互联网+行动计划,这个作为部署,这个部署大家都知道,就是要发挥互联网,在实现智慧民生,促进我们各行各业和改善民生的发展,所以总理提出要站在互联网+的风口上,顺势而为,我们必须迎接这个信息的到来,也是我们通过互联网+政府,创新我们环境的改善,同时能够进一步的拉动我们的消费,正因为这样子,我们要理解互联网+的深刻意义,互联网+行动计划也包括政府信息化,实际上也必须更好的利用互联网的思维,真正的我们说互联网+不是想+就能+,也不能把这个+当成算数的加号和物理的加号,是一个化学的反应,要改变我们的传统模式,服务架构,某种意义上说是对传统的颠覆,我们不能把互联网当成工具,我们要营造新的业态,我们要提供新的服务,提升我们服务的质量和效率。
在当前,制定互联网+五大计划,提出了五个目标,第五个就是推动信息公开,改善公共服务和信息惠民,也就是要加强和改善民生工作。林主任明确提出了正在行动的计划包括三个方面,第三个方面质量要推动优势资源的开放,完善服务模式,我们说互联网+给政府信息化拓展了空间和机遇,互联网+信息化也是大势所趋,我们现在各地都有成功的经验,一是要扩展服务范畴,二是提升质量,三是更加注意保护信息的安全。
我们领导的基层管理往往是一个黑盒子,老发现上达不一,下达也不差,我们用数据管理,用数据创新,在那种情况下,按照党的精神,新时代的信息化建设必须适当新的能力需求,在这个时候,我们政府能力信息化进入了大数据时代的治理和服务现代化的一个阶段。必须看到这种信息化的建设,尽管取得了应该说非常可喜的成绩,解决了很多问题,目前还存在着我们信息闭塞和缺失,共享困难,特别是缺乏统一规范,也有安全的威胁。在当前我们社会形态在发生巨大变化,在社会管理,我们必须面临新的挑战的时候,那么这种网状的社会结构需要我们协同工作,所以我们说在互联网的时代,信息化与政府转型战略目标的融合要成为常态化,必须学会在互联网时代依靠互联网给老百姓办事,这个我们看到了很多很好的经验,包括我们贵阳市政府也是这样做的。
特别是我们要看到通过政府信息化提供公共服务,在内容和方式上也在发生着巨大的变化,要求我们服务更加精准化,更加人性化,过去我们以网站为主的政策,进入了以业务协同的阶段,政府信息化必须要做到五个新,第一个是新模式,第二个是新阶段,第三个是新领域,提升服务的新水平,第五个发挥新成效。
当前我们要高度重视大数据云服务,在推进政府信息化方面和服务模式中的转型,所以我们说做好政府大数据的应用的本质是信息化的整合,我们在考核信息惠民中间,把服务渠道的延伸和提高作为评价的核心要素,把我们过去搞机房搞工程,转向以服务为本,转向我们的信息资源为本,转向我们信息公开。所以资源的建设应该是我们政府信息化建设的工作和核心的能力,它离不开我们信息的开发,所以只有开放数据才能促进政府的服务,从被动向主动转变,才能深入基层,到社区,到村镇的转变。我们这个数据由于加深对政务数据开放创新改革的动力,就是要通过政府信息化和行政体系的改革,通过以公共信息为重点,通过业务联动为方向,建立跨部门,跨地区,按照国家大数据战略和初步的考虑,到2020年左右,建立国家的政府信息的统一开放,真正的实现统筹国家的资源,推动共享开放,释放数据的能力。
所以政府信息化的发展,我们必须考虑怎么样进一步的解决我们的数据鸿沟,把线上线下更好的结合起来,真正实现惠民群众,才能无缝覆盖,满足群众的要求。互联网+政务信息化,目前国家发改委正在建设规划,第二要拓展我们信息化的覆盖范围,加强我们技术监测和监管,同时拉动我们国内的产业,进一步的挖掘数据资源,只有这样子,我们说就可以通过加快我们的工作,包括信息惠民工程,以互联网+的部署,我们觉得在当前要更加关注公共基础设施的建设,更加重视市场的参与,引入互联网思维,更加关注我们数据的开放,这里的数据开放一样是我们可以为人加工的数据,而不是说回来还要让社会再重复看的数据,这样没有做到真正的开放。
我们说要解决社会问题为保障,以大系统为概念,以大数据的理念为核心,以服务对象为目标,以新的信息架构,我们一定能把国家的政府数据搞好,为我们国家的长治久安和繁荣昌盛做出更大的贡献。
国家行政学院电子政务专家委员会副主任 罗建中
政府职能转变,政府职能转型什么意思呢?核心就两个字,一个退,一个进,要从市场上退下来,进要从各方的职能上进上去,只有从市场上退下来才能发挥市场上的决定性作用,政府职能转型的一退一进路径,退下来就是社会的主体,自主的经济社会为主,这是一个观点。刚才马教授还跟我说,这个有点重复,我们市场主体还没有到位,到位的话就是市场的事了,市场起决定性作用,而不是行政,我们要变成市场为决定性作用还有漫长的路要走,不光是大数据庆能解决的,更好的职能就是政府的四个方面,经济调节、市场监管、社会管理、公共服务。
在政府发挥职能的时候,涉及了什么呢?涉及了数据需求和知识需求,要把握调控,市场的主体要合规,市场的主体自觉的他的行为满足了法律和技术的要求。还有就是我们要了解公共矛盾,这是政府履行职能的宿求,他要发现社会的矛盾和问题,他要分析判断各种关系,他要判断已有的政策,还要进行发挥市场的主体的主动性作用的制度安排,更好的履行职能,发挥更好作用,一进有进的地方,退有退的后路,这些就是经济社会客观存在市场的行为的市场表达,这不需要大量的信息,需要大量的数据,尤其我们过去的数据是在政府这一侧描述政府行为的,他的自主行动的数据,这两个关系,就是市场主体的经济行为和政府这一侧的信息表达怎么一致,怎么跟我们公布,这就是我们说政府的职能转变,进就是要解决资源配置,一退就要让它更规范和有序,这个是要注意的情况。
两大核心目标就是解决公平和效率,解决有序,在经济社会的客观存在,市场主体的政府这一侧的信息表达,我们说它的数据就是刚才说的信息表达是最新内容,是客观现实的分析和认识,是对我们复杂关系的分析,是对客观形势的判断,还有制定各种各样的方案。这一点我们刚才说了是资源配置的效率和公平,这是两大目标,资源配置的效率和公平,讲的是规范和有效,就是所有政府都在做的事情,外国政府和中国政府全部都在做,他们所需要的信息是不一样的。
合理化的信息就是要表达各种现象的信息,数据是什么?数据是信息的载体,信息是客观事物的表征,我们抓的是它的表征。还有经济社会的认识,就是知识,知识不是客观的,知识是人脑的产物,知识是人脑对信息的加工,在合理性管理里面,一个是现实,第二是规律,这两者的结合,合理性来讲需要这两方面。合规性管理所有国家历史以来,都要制定法律法规,这是规。它的标准的规范支持,这是规的信息,就是这个社会的规范,市场也好,另一方面的信息更重要的是市场主体和公共主体,合规的和不合规的,这是我们最缺的信息,几乎没有我们所管理和服务的社会对象和社会主体的社会行为,没有信息,主要是填报信息,主要是提样的信息,这样的信息是不足以支持政府来进行合规的行为的,主要是这些方面的信息。
合理性管理,涉及到的表征内在关系的信息,支撑我们做决策用的,合规性管理需要我们做什么,政策信息是支撑我们做判定和判断的,这些判断不光是政府的监管判断,更多的还是公民,消费者,其他市场主体来判断的,做决策的时候需要模式,做判定的时候需要规则,这些信息是什么呢?主要是群报和方案,决策是靠各种各样的情报,互联网上讲得比较多,还是情报这块。我们做合规性管理的时候,信息输出是什么东西呢?一个是判断的结果,第二个就是结果的责任,符合你是不是法律规范,就立马进入了另一个程序,就是行政执法的程序,政府就实施市场管理,这一点就是我们相关的数据。
我们输出的是这个数据,也是多领域的原始数据,特别是对象的行为数据,特别是对象规律的数据,还有行为证据合规和不合规的数据,中间是什么?是数据处理。再进一步阐述一下,我们所有的政府转型和政府的治理,或者我们政府的大数据能力,无一不是围绕一具体的经济目标来解决的,我们关于问题和目标的描述是数据,关于分析也是数据,我们就是需要支持和模式,大数据有这么一段话,以多目标为约束条件,以全量特点的,多元化采集,可视化分析,这是我理解的我们政府转型国家治理体系和治理能力的大数据能力的基本特征,这是关于政府职能转型的特征。第三个几点认识做个分享,政府目前没有大数据,只有填报数据和样本数据等小数据,不足以支撑政府的职能转型。第三条,百度阿里,腾讯,京东已经很热了,有大数据的全量对象行为痕迹的特征,但其忏悔相对简单,不能全面支撑政府转型的全领域大数据。第三个,政府转型的大数据能力,必须是多领域对象基础,数据不是随便开放的,政府是公民的数据,不是随便开放的,这有法律条件的,要么基于他自己的利益,要么基于公众安全和国家安全。
那么社会信息化普遍提高和深入发展,如果没有企业的高度信息化,不可能只是填报的那个信息。政府依托专业力量对经济社会各领域进行深入持续的专业化石,政府不具备这些能力,必须依靠专业化的分析,所以政府也不会处理。最后一条,政府的大数据能力,首先是经济社会的变革和制度的构建,不是大数据中心,不是大规模的数据存储能力,你不是建了很多大数据中心就是大数据了,它是制度的安排和本身的能力创新,现在不是把数据库和数据中心结合在一起就是大数据了。
香港城市大学教授 马建
昨天我从香港飞过来,飞机晚点,我看时间到这里来也不是特别合适,我就改变计划,我说临时想找我33年前我大学毕业的一个同学,跟我住同一个寝室,我不知道他的电话和信息,我就在微信群发一条信息,就谁知道我那同学的地址。那么这个不到一分钟时间就很多人告诉我,他的信息在哪里,我就利用他的信息,利用他的地址,就在腾讯的地图上就直接打进去,原来他那个那么近,我就立即跟他取得联系,这个我们看到如果个人如果我们把这个信息公开了,大家也参与了,像微信和社交网络,有了这个支撑。
让我们生活变得更加方便,我们试想一下,如果我们政府也是跟私人一样,他如果把这个信息公开了,然后为大众服务的话,我想我们的生活也会变得更加美好。我就利用这个机会,想分享一下香港的这种情况。
第二个就是原始性,你是什么样的我们就公开什么样的,我在香港也跟政府做项目,也
跟政府也有一些联系,那我们也看到了有时候在政府里面,也有一些观念,就是我要公布出来的数据我一定要清洗干净,要让大家看到正面的一面,从开放政府的角度,你是什么样的。
在香港,其实在2005年开始,那么它就一直是做准这种开放政府,开放数据的一个工程,你跟政府做任何的一个项目,它从一开始就有一个标准,他说你只要做,这些信息一定要公开,就有一个渠道,就一定会把这个信息公开出来,因为香港很小,所有政府的项目,都有一个政府资讯系统,所以它是比较容易来协调这个政府和政府数据公开的事情。包括政府的一些信息,包括它的账目,前面几位老师讲到公民有参与权,监督权,在香港天天看到他们吵架,政府提出来这个数据中心,一定有人反对,这个对国家没有好处,就不建了。这个是很开放的,而且这种
数据是第一次还是第二次都是记录在案的,每个人都可以看得到。
政府如何花钱,都可以是有机可藏,香港修一条深圳道路连通的高铁,原来讲17年通车,可能2020年都不一定通得了车,这个引起市民很大的反感,官员因为这些事情,就有很多矛盾。这个信息公开,这个监督是对我们有好处的,可以提高政府的实践效率。还有我们在香港的这些资源,比如说你要去订一个场地,你结婚干什么的,你都可以通过这个来做。包括政府这个数据在手机上也可以公开,我要查政府在哪里办工,我们这个要申请驾照延期都可以在网上做,我们也有这样的经历,我在深圳,比如说我要延一个营业执照,又要体检,又怎么的,这个又不知道哪里去找,我们应该从用户的角度去设置这个东西。
不是政府我把这个信息公开就行了,就不要设置任何的的障碍,你去体检,你就要交钱,交钱是小事,但是你到那里去又要一个小时,然后又要怎么的,我们读大学都可以在向政府贷款,这些信息都是公开的,你可以借多少钱,过了多少年你应该还,不还的话这个信息也可以查得到,因为我自己的专长,我是做科研创新的,我们也包括跟香港创新科技所,包括给广东省好多不同的省市做科研创新这个管理信息系统,包括给国家自然科学基金委员会做这个系统。
刚才罗老师也讲到互联网+,这个信息公开,以前啊,那它是很难的一件事情,前面也讲到政府没有大数据,政府只有表格,政府是要求这些你要做什么事情,你就填一堆表格,因为现在互联网,我们看到腾讯,它拉近了人类的距离,人获取信息是非常的方便,你打车一个按钮就可以做到,还有社交网络,这些大的变革,能真的是给人们创造一个价值。科研创新也是政府的一个资源,政府尤其是中国大陆的政府,他的投入,那么其实是以政府为主导,如何利用它这个信息,怎么把人和人联系起来,还有是帮助他成功,这个是一个最主要的目的另外还有社交,手机可以最方便的,让人提高他的效率。
还有是云端的服务,我们前面讲到,政府做了很多政务系统,那么它都是简单的做一个信息系统,每个政府只要换另外一个领导,他再进来就重新换代一次,就换一个系统,新的趋势,真正理解这个云服务的概念的话,它真的是我是建在云端的,不需要你去建系统的,我们看到微软这些世界一流的公司,都把这些资源搬到云端,政府要改变这种模式,是不是可以不用建系统,用这个云服务,这样才能达到公开的目的,你还是建系统的话,你还是那样,你讲的是信息共享,每个人都是信息就是权利,我把信息共享给你,我能得到什么好处?
利用云端服务的话,自然就做到这一点,大数据改变了人们的生活,大家可以看到未来的科研创新的趋势,也可以帮助你做一些推荐你就不要做一些以前人们做过的东西,你可以想一些新的工作,那么我们讲到政府开放数据,就像我们个人一样,如果能够达到跟个人的理解,这个我们是真的可以增加政府的透明度,也可以增加政府的公信力,最主要的是让生活更加方便,工作更加有效。未来中国一定是从制造到创新,我们也希望创新还是融入。
中国信息协会大数据专委会副主任委员文金言
大数据,大视野,我想理性的看大数据,从技术和政策几个方面我们去看,我们先看一下,各位把手里面的USBU盘,如果把你的笔记本,加起来,曾经只有企业才有的T级的数据,在你个人的手里,现在讲到政府讲到企业,已经走到E和Z,美国政府现在手里掌管的数据在Z级,这个多大,我也不知道。在现在这个数据里面,从1986年到2007年统计里面,数据爆炸,这个提出几个问题,我们现在手里拿到的数据是TB级的数据,有多少是可以用到的?还有一个,我们在这里看到,就在今天只有10%左右的结构化的数据,就算是美国大数据的发祥地,今天大数据仍然在初始阶段,数据积累的速度导致存储设备快速膨胀。
去年统计,仅美国就有290万个服务器农场,一排排像农田一样的服务器,去年就达到了670万平方米,人们产生的数据90%是在过去20年发生的。第三个,大数据是资源,如果要让大数据产生价值,工具,人开发出工具,这个包括本身的技能,工具需要更多的人会用,目前是数据以火箭的速度在增长,人们只是以火车的速度在发展。真正用到分析的数据不到5%,现在大量数据在快速堆积,这些数据没有产生任何价值,除了消耗能源。被分析的数据中间,这个有一个巨大的鸿沟,企业不管你是大企业还是小企业,我们现在在一个起跑线,在这个阶段,应该跳出基本层面,前段时间我写了一份大数据国家战略,里面谈到一些问题,以数据为起点,以人为终点,这个有四个层面,第一个物理层面第二个生产层面,第三个实用层面,第四个文化层面。从处理数据,到数据的共享,到数据最后的销毁,在物理层面上要好好考虑怎么去做,这个包括在云是分散还是集中,不同的策略可以产生不同的策略。第二个生产层面,我们的产品是数字产品,要考虑到用什么样的工具,是基于什么样的产品,从文化层面,要研究人与政府,社会与政府,我后面再谈一下。
大数据监管的四个层面,大数据要人们学会有全新的东西,工具,技能,人才,缺一不可,数据分析和软件平台,在深度学习,人工智能,自然语言处理,机器学习,数据融链,把不同精度的东西放在一起,信息处理加上原数据处理,大数据要求数十个,数百个,数千个当中进行大规模的计算,传统的数据库,和传统的软件已经远远不足,从这个角度上看,目前我们大多数人在谈大数据的时候,在过去被大量使用的数据统计和数据分析,真正的大数据在国内没有看到几个真正称为大数据的东西。
培养会使用大数据分析工具的,这个分析工具很多,用工具的人就很少,学会工具只是其中一层,还要懂业务,不懂业务,只懂数据不能做什么,要从底下看起来,新的人才培养里面,数据工程师到原来的业务分析师再到以后的数据科学家,里面的培养在很多大学里面,我至少可以举出十个大学,已经在培养这方面的人,这些人是最抢手的。
算法模式,如果没有数据模式,就像一个女孩子,全部用数据把它描述出来,数据不可能百分之百和现实重合,除了物理学之外的,我们可以把卫星送上天,但是在其他领域没有办法,这些模式非常有用,但是很有局限性,如果用不的数据模型,很多的误判来自数据的算法。图形和视觉是表现人机立化的,在市场里面融合技术和艺术,能把抽象变形象的电脑化的工具,这样的人才不多见,美国一些对金融市场的分析,做得非常非常好,所有的事情都是在小小的屏幕里面。
政府从全球统计数字而言,政府是全球最大的数据收集者和使用者,就像我们的公安,像美国的FBI,社保,医保,收集多少数据,这些数据散落在政府,运行一个政府通常50个到80个,各个部门收集不同的数据,以公安为例,有10多个警种,他们中间打通了吗?人事部和公安部打通了没有?有些打通了,有些没有打通,建立共享机制是形成大数据的第一步,开放政府数据,实现真正数据共享,体现在政府大数据价值的基础,这也就是为什么美国总统奥巴马在第一个任期就职第一个工作日,就是开放政府行政链,需要建立一个长效机制,向公民,社区,甚至其他国家开放,这个是长效的,不是一次性的。开放政府数据员相当于开放矿产资产的开发权,这和一两百年前工业开放是一样的,它创造的是新就业,它的意义非同小可。
以美国为例,如果引导大数据发展,2009年奥巴马刚上台,一系列的政策出台,到了2012年3月启动了美国联邦政府的大数据行动计划,这个涵盖很多部委,运用了联邦靠税收,启动了84个项目。时间关系,我没办法介绍那么多项目,我就讲美国安全和军事有关系的,美国卫生部下面有很多的研究机构,急迫中心,CIS是全美国最大的医疗保险的支付者,他管理药品的定价,美国国产研究院,一直往下数,在过去几十年里面,当时的美国总统叫尼克松,在宣布登月计划之后,把人送上了月球,他宣布要治疗癌症,人类从过去的寻找因果关系开始找关联关系,每天一个男人喝三杯咖
啡,前列腺癌可以降低多少,这些是关联关系,这是统计上有意义的,但是对某一个人未必有作用。
美国现在考虑说能不能在现在这个阶段,当因果关系难以寻找,在我们过去的研究过程中间,原因通常被确定,现在十万多种没有被管制的化学药品,每天都在流动,在这里面有很多的数据,散落在不同的部门,癌症的成效,因为隐私的原因都放在各个部门里面,没有办法拿出来共享。美国政府在绝对保证公民隐私的情况下,在医疗路径里面来共享它,大家知道癌症在早期诊断,治愈率是非常高的,然后再把其他的东西拿过来,把有效的东西拿过来,分析什么样的东西最好。美国的第二大杀手,是心血管,在心血管里面也是把大量的数据结合起来,这是做的能为社会做贡献的东西。美国的大数据里面遇到了我们现在还没有遇到的问题,这个在全球散布开,去年邀请各路专家来给总统一下报告,总统希望看到大数据对人类的影响,跳出这个本身,在现有技术和现有法律带有哪些挑战,这是当时提出的要求。
3月份,美国政府向全美国公开征询,希望公民提出看法,第一个数据收集分析对公共政策的影响,哪些地方有权收集,收集到怎么办。第二个,今天政府要投资,投在大数据方面,肯定要有收益的,能对政府公共政策带来什么样的挑战,第三个,哪些会影响大数据的采集,存储,分析和使用。第四个,在立法方面有什么不同,应该怎么样去对待。第五个,跨区域的大数据会带来哪些问题?现在的国际法,给大家举个例子,现在数据的本地化成为全球性的趋势,由于隐私法的影响,像欧盟,所有欧盟国家公民的信息必须存放在欧盟,或者是亚马逊,不得不在德国把这个收集起来,过去是经济考量存在云上任何一个地方。美国的隐私法,只对美国公民,就是说如果现在有政府或者是企业,特别是企业去窃听,必须要拿到法庭的许可。
现在美国在修订这个隐私法的时候,这个就有云计算带来的损失,这里是需要很多前瞻性的考虑,在5月份提出了一个建议,政府的政策应该更多的关注大数据的使用,而不是大数据的收集和分析,用在什么地方?是用在好的地方还是恶意的地方。白宫的科技办公室和政府网络计划,要求在强化和隐私和社会科技方面的研究,第四个,教育和职业教育,第五个要采用新方法,在国际法和国内法,美国认为他领先,他需要领先,这是我给的五大建议。
所以在可见和预见的未来,大数据对人们的挑战表现在法律层面,技术管理层面,我刚才讲到说有可能是个贸易壁垒,现在大数据以后,让数据氧化,实际上是系统在决策,作为领导的你,你愿意吗?当你把数据释放出去以后,实际上是分散你的权力,这是文化的变化,从伦理方面讲,几百年前,没有大数据,可是大思想源源不断出来,我们现在有多少大思想,人们的这个直觉,这个和大数据之间什么关系?这是值得考虑的地方。
技术层面,算法的错误可以导致南辕北辙出来,这是我们值得考虑的,我们中间讲了,我希望各位了解,在今天的大数据时代,它的特点是什么?超量的数据和缺量的分析,这是我们当前面临的,我们同处一个起跑线,到目前为止,我们能看到的目标还是过去的数据统计和数据分析里面。在目前全球范围内,从风投的角度来看,投资量最大的公司里面,集中在都是大数据的工具上面,再一个,值得关注几个地方,四个地方,物理层面,刚才讲过,这是技术人员考虑的,生产层面,使用层面,文化层面。
保护公民隐私,这是政府职责,政府是最大的信息收集者,政府在这里面有一个大的转变,公民相信政府,政府有义务保护隐私,如果大家都不相信外面是安全的,我为什么要把信息放在外面,主管部门现在必须关注这个隐私的问题,给大家讲一个例子,去年的这个月,欧盟最高法院裁绝的一起就是互联网上公民的被遗忘权,这是西班牙的一个公民,他在1990年代,经商和贷款被爆出来,网络就搜索,前段时间去贷款,这些东西就跳出来,政府部门要求拒绝他,他就找谷歌要求删掉,一路官司打到了欧盟,最后裁决下来,公民的隐私权叫被遗忘权,现在谷歌不得不成立一个部门,你能不能把我们那个删掉,这是在隐私保护里面。
1775年,美国邮政系统建立,在过程中邮件被打开,这是常有的事情,直到隐私保护,直到电话出现以后,开始被窃听,民码电报时代,很多人没有看到过,我们现在进入了互联网,我们的邮件,我们在网上的聊天,痕迹信息所有都在外面,这些东西属于谁,我们每天都被别人给消费,我们必须对待分析,这就带来好几个问题,政府我不侵犯你的隐私,我不收集你的数据,二次数据,政府从电信拿来数据,从第三方拿到你的数据,拼凑出你的图片,判断你是什么分子,政府没有提取你的数据,只是根据二次信息,这样法律责任是谁的?没人鉴定,再一个讲到医疗,我们都说医疗共享,我们常常讲到说医生把你的医疗资料共享到另一个医院,美国和欧盟,你的资料被共享出去,必须要经过你的同意,我打开医生才能往出放,还有医生还有个开关,这里面牵涉很多法律的问题。