邬贺铨:开放数据与智慧城市
来源:中国智慧城市论坛网 更新时间:2014-03-11

 

  尊敬的段主席,我们常主席,各位领导,各位专家,早上好!很高兴到我们智慧城市论坛,我今天的题目是智慧城市与开放数据。会讲两个问题,一个是开放数据检验智慧城市,第二是开放数据提升城市智慧。

  首先说第一个问题,开放数据检验智慧城市。

  我们现在都在谈智慧城市,智慧城市感知城市、无线城市、数字城市、宽带城市是智慧城市的必要条件。

  创新城市、绿色城市、宜居城市、平安城市、健康城市、幸福城市、人文城市等是智慧城市的应有之一,它包括大数据的含义,我们说现代城市产生大数据,像淘宝当天数据量超过50个T,像高峰期每秒100万次响应请求,就是新浪微博。百度每天约处理60亿次搜索请求,几十个PB数据。腾讯每天1千亿次服务调用、5万亿次计算、300G存储量。国家电网到2012年10月信息系统累计产生大数据2PB。联通用户上网记录83万条每秒,对应数据量3.6PB/年。交通银行,每日约处理600G数据,存量数据超过70TB。公交一卡通每天刷卡量4000万次,地铁1000万次。中山大学第一医院所存数据08年130TB,预计2015年1PB。每天产生数据超过10TB,现已存20PB这些都是我们企业的数据。

  视频监控摄像头广泛应用于主要道路、一个8M摄像头一小时产生3.6G,一个月为2.59T,很多城市摄像头多达几十万个,一个月的数据量达到数百PB。若需保存3个月则存储量达EB量级别

  政府是数据的最大拥有者和受益者,篮球这个图是美国,美国认为,行业数据存储量,第一位是制造业,因为它数量多,第二个就是政府,政府是数据最大拥有者,政府也是数据最大的受益者。

  城市数据是智慧城市的重要资产,我们可以看到城市数据库里面,人、法人库、空间地理信息库,各种各样的库这是重要的资产。

  其中监控数据将成为大数据重要组成部分,物联网的数据,其中我们可以看到,标签和分析数据里头,绿色是监控数据,你可以看到监控数据,目前占到城市数据很大的一部分,对于中国来讲,也是如此,中国政府,每一个城市都有几十万摄像头,这方面数据量很大IDC讲到,05年由机器产生的数据占到数据总量的11%,2020年将增加到42%。这些数据是政府的数据。

  政府开放数据是数据挖掘的重要来源,城市数据来自市民和政府的,城市数据服务于市民和政府。政府开放数据,才能使智慧城市的数据收集更全面,北京交通堵了,通过传感器知道,不知道原因,如果把政府数据和市民数据收集起来,我们就可以知道交通堵塞的原因是什么,这些数据的处理挖掘,只要把政府的数据加上去,整个数据处理才能更全面。

  政府开放数据,促进三元空间数据融合,我刚才说了,我们的网络上有很多数据,我们的物联网也可以产生很多数据,但是这仅仅是数据两个方面,第三放民,是政府的数据,政府掌握了大量社会的数据,包括我们人口库、企业库等等,这些数据目前都没有上网,只要把这三方面数据融合起来,才能说是完整的数据集,这里面是一项很大程度上,至少这两种,大部分都是政府掌握的,这部分政府也可以获得。所以政府是拥有最大量数据的。

  开放政府是智慧政府的前提,我们讲政府讲了很多年了,电子政府,组合的结合的政府,然后是开放政府,国外认为2010年9月,还只是开放政府,到什么时候智慧政府呢?2015年,还要往后走,开放政府是智慧政府的前提,如果说我们谈智慧城市,大家都只是说,咱们多建一点设想,多建一点传感器,那仅仅是一种物理设施,还不是政府的开放智慧,谈到开放才能谈到智慧。

  而且开放数据是智慧城市切入的重要模式,这是搜集了世界,欧洲、亚洲、非洲、美洲,他们智慧城市首先从哪切入,智慧交通、智慧环保、城市管理,开放数据。也就是说,我们谈智慧城市,首先你有没有开放数据,没有开放数据,很难说,这个城市是有智慧的。

  欧盟把智慧城市的评价有六项标准,智慧经济、智慧移动性、智慧环境、智慧人民、智慧生活、智慧治理,其中公共与社会服务,市民的参与,这才是智慧城市,仅仅是基础设施提供很好的交通,包括汽车化,这还不能说是智慧城市,智慧城市必须市民参与管理,我们常说人民城市人民管,我们人民什么时候管过城市,图除了提价的时候,把我们请去听证一下,大部分老百姓对城市的情况都不了解,怎么能参与管理呢?

  在去年6月份,在英国北爱尔兰召开了一个G8会议,签署了开放数据县长,提出了开放数据五原则,第一开放是基本原则,是必须的,还要注重开放数据的质量和数量,第三开放数据是给所有人,不是有个门槛,谁可以看这个数据,谁不能看这个数据,第四开放的目的是为了政府的治理,这是从政府角度,从社会较,是为了提供更好的创新环境。当时8个国家都签署了共同行动纲领,遵守G8行动计划,发布高价值的数据。另外元数据映射,每个国家对数据的含义不一样,要有共同可读的数据,这些数据是计算机可读的,计算机可以直接分析的,不是复杂的。有14个重点开放领域,包括公司、犯罪与司法、地球观测、教育、能源与环境,财政与合同,地理空间、全球发展,治理与民主,保健等等,涉及到方方面面。

  美国政府开放数据,不是做的最好的,英国做的最早,但是美国的力度还是很大的,从09年1月开始,奥巴马就发布透明政府的开放度,09年data.gov网站上线,美国开放政府开放计划,美国政府国家报告,还有发布总统令,还有办公室发布了政策,还有总统管理委员会制定开放数据跨部门优先目标,通过政府总统令要求开放政府的数据。

  第二点,讲讲开放数据提升城市智慧。

  我们说所谓大数据,我们现在所有数据是这么大的,大数据占到全部数据很大一个部分,大数据数量上占不了那么多,可是它每一项数据的量很大,所以大数据几乎占了整个所有数据的百分之八九十,大数据里头不是全部都开放,只要求你开放一部分,而开放一部分,政府在开放数据里占很大一部分,当然也有企业开放的,政府开放数据里头,涉及到居民一部分数据,这是可能的,但是并不等于政府开放数据就把隐私开放出来,我们会看到,开放数据和隐私能够很好处理的。

  美国联邦政府现在建立统一数据开放网站,开放政府拥有的公共数据、鼓励挖掘,提供丰富透明的公共服务。有88411个数据集、349个市民开发的应用、137个移动应用、409个政府API,地理数据386429项,还汇集了1570个数据可视化应用。

  纽约市的开放数据平台,按邮政编码分区域的人口统计信息、用电量、犯罪记录、中小学教学评估等历史数据,不是开放门牌号码,住的人有,有几口人,不是这样的。而是开放邮政编码,这个区域里头的,这个领域里面,老龄化占多大比例,最高收入多少,最低收入多少,不涉及隐私。

  另外地铁公交系统的动态实时运行数据,还有与公众生活密切相关的,小区噪音、停车位、住房租售、旅游经典汇总,还有与商业密切相关的数据,饭店卫生检查、注册公司基本信息,处理数据所需的软件工具。另外有些数据,可能它现在平台上没有,只要有公众提出,会有专门的人员帮助进行分析答复,曾有一位应用开发者希望得到具体小区的犯罪率,它这个上面没有准备,最后工作人员帮助查询以后,可以在纽约警察局获得,并提供了链接。

  美国政府开放数据里头,美国不同城市的臭氧分布图,它可以点击每一个点,可以知道每个城市的臭氧分布情况。

  政府开放数据里头,税收用到哪里?我们每天交的钱,用在什么地方,美国政府给你分类,你要查政府部门的,还查应用项目,还查政府购买的,可以分门别类的查,政府的钱用到哪里。

  这是英国,英国做的不错,你的工资多少,你们滑动这个条,比如说一个人工资是22000英镑,但是它要付出8774的税,相当于每天是24英镑的税,他的钱用在哪里?有1.69英镑用在国防,有5.86英镑用在保健,有8.6英镑社会旧制,03英镑,用于文化,1.42英镑用于社保,0.28英镑用于街道等等,政府把它的开支,把每个人的税收用在什么地方,非常详细交待出来,英国还提出来,我每年减少了,总共英国政府收到6941英镑,年度上减少了100%多了,不同部门,使用的税收的情况,实现了跟政府的透明性,有利于老百姓监管政府,现在都说人民政府为人民,究竟是不是为人民,老百姓会从这个数据里头得到很好的监管。比我们简单派纪检查一下,是不是到饭店大吃大喝了,还更有意义。

  开放数据平台有利于市民对政府更好的监督,从data.gov公布的各种数据中可找出关联,例如空气质量与工厂数量的关系、我对比其他的小区空气质量和工厂的关系,我发现这个小区胖子数量比较多,与快餐点多寡的关系,对比其他小区的胖子数和快餐店,还有天气与航班延误的关系等等,这些都能很好的监督。空中管制的话,你问空中小姐也说不出来。她也不知道。

  关于空气质量和噪音的数据可以被用来估测房价,关于对Yelp、大众点评网的饭店卫生检疫测评数据推荐可以促进环境治理、激励饭店提高卫生标准。这些对老百姓,有利于政府更好的监督。

  另外,开放数据促进公用事业效率提升,Data.gov,免费提供航班延误分析应用,帮助旅客选择正点率高的航班,而且推动航空公司提供正点率,美国航班艳舞率从08年的27%,下降到2010年的20.23。

  公共交通系统的动态数据公布后,公众其进行深度挖掘,不仅创造出了手机应用为公众出行提供实时建议,而且为地铁系统在客流高低峰时段、热点站和普通站之间的调配提出更优的方案,这些在原来警察局或交通部门各自垄断数据的情况下无法想象,每天北京公交刷卡4000万人次,地铁1000万人次,如果把这些数据公布出来,就可以知道哪些人在哪里上车,现在是有数据的不挖掘,会挖掘的没数据,你想把它优化都很难,不能得到大众帮助来进行挖掘。

  纽约市一个公司,利用政府公布的数据,从哪里打车,国外出租车不是像我们满街转的,你要找一个地方才能停的,你怎么找它,哪些点最好找,这里也有数据可以得到。

  政府开放数据帮助城市治安管理,我们随着纽约市把犯罪记录详细的开放,不仅开发出提示公众避免进入犯罪高发区并且也提高警惕的手机应用,你的手机走到某个区域,可以马上告诉你,这个地方是高发区,这样可以降低犯罪的概率。而且能够将犯罪记录和交通数据合起来,有时候犯罪跟交通似乎没有关联,但是实际上是有关联的。前年美国加州大学,洛杉矶学校,分析了洛杉矶市,政府公布的,历年来1300多万起犯罪案件,按理说这些犯罪案件是孤立的,这个和那个案件没关系,但是犯罪案件跟日期、天气、交通状况其它相关事件还是有关系的,因此加州大学分析完了以后,做出很好的算法,每天洛杉矶警察一早上上班,就去查,他告诉你,今天到哪个街区去巡逻,哪个不用去了,在警力不增加的情况下,犯罪率下降了12%到15%。

  另外完善司法系统,美国每年有1200万人服刑,其中60%的犯人在等待审判,每年为了教化他们需要花费90亿美元。万一到时候要开庭的时候不来呢?怎么甄别这些犯人呢?哪些是容易重新犯罪,哪些不来了,跑掉了,过去是根据一般的简单判断,结果发现,他以为不会犯罪的人放出去了,犯罪率很高,他以为犯罪的,关起来,并不会犯罪,后来一个公司,利用美国司法机构公布的数据,他收集了150个案例,建立了模型,发现了9个用于确定重新犯罪、暴力案和不出庭受审的因素。就很好的甄别了罪犯的情况。

  政府开放数据蕴含大商机。1983年美国将原本用于军事的卫星定位系统GP向公众开放使用,美国国内就有约三百万的就业岗位依赖于GPS。

  开放数据平台,会吸引大量的高科技人才和企业的关注,激发前沿的创新和应用。虽然Data.gov成立仅有一年多,但围绕着纽约开放数据平台而产生的应用开发团队已有一百多个。它是很好的创新平台。

  政府开放数据扶植中小企业,硅谷有个Climate公司,从美国政府获得30年的气候、60年的农作物收成和14TB的土壤历史数据,它把数据消化以后,做成模型,它跟所有的农场说,哪个农场主来问我,明年种什么能赚钱,我告诉你,我能告诉你,承诺每英亩的玉米利润增加100美元,如果遇到不可预测的天气,没有判断好的市场,我赔钱,现在赔偿率比保险公司还要高,据说这个公司没有赔,最近该公司被孟山都公司以11亿美元价格收购,说明政府开放数据,能够扶植大量创新性中小企业,最终获利是使农业生产得到利益。

  基于政府的开放数据搭建外贸平台,如果不知道对方的市场代销的是公司是谁,过去很难知道,美国有一个公司是Panjiva,利用政府开放的海关数据,海关数据每天都有,这个货物从哪发过来的货物多少,保价多少,货物品种是什么,每天发货量多少,根据这个我知道,中国的货物在美国谁是我的客户,供应链的上游是谁,甚至利用海关数据统一出来,卖LED的公司,这些公司的销售状况如何,是不是守约的,按时付款的,海关都有这个数据,根据这个数据,可以很好的找到商业合作伙伴。

  政府开放数据能带动经济效益,政府开放数据,能带动32万亿到54万亿经济增加值,政府开放数据,它是蕴含着大量的经济价值的,其中分门别类,教育的、交通的,还有消费者的,还有电力、油气的,以及保健的,还有财务等等,这个量32万到54万亿美元,仅仅在美国而言。

  这是全世界有个开放数据基金组织,它评论全世界这么多国家,在开放交通数据、开放选举数据,开放注册企业数据,开放各种数据,这个太细了,看不见,中国是排在中间,中国是415分,最高分是英国,900多分,中国的开放数据,应该说在全球上还是比较差的,还不是太好的。

  另外开放数据要标准化,对于财政数据,各国在数据管理上、发布形式上都有很大的差别,需要通过标准化来实现财政数据透明化、开放化。世界经合组织的预算透明化指南明确了哪些内容必须要包含在预算报告中,哪些细节必须做到透明化。我们很多政府部门,把数据贴在网上,我发现莫名其妙,它的口径变了,上个月有这个统计数据,下个月就没有了,我曾经有一年在工信部发现光缆的长度,5月份60万公里,到6月份变成50万公里了,统一口径老是变。

  美国还有阳光基金会倡议政府采购的透明化与开华,目标是将政府采购中标金额、中标公司等数据能够以一种标准的、开放的形式发布给民众,从而更利于民众对政府采购的监督。财政数据透明化和开放化包括企业注册信息的开放,这将有利于公司甄别僵尸企业、空壳企业,以及摸清复杂的公司结构,防止贪污、洗黑钱等犯罪行动,现在发现一些公司是空壳的,里面有很复杂的关系。

  还有政府数据开放行动,我们去年9月18日,国务院常务会议部署了进一步加强政府信息公开,完善政府部门新闻发言人制度,加强新闻发布,增加发布频次。

  主动回应社会关切,重要政策、法规出台要科学解读,对重要吁请和社会热点问题要积极回应。在这一点上,我们中国政府在开放数据上,比国外要差的很远,尽管中国现在由政府授意试点的智慧城市193个,超过了世界其他国家所有智慧城市的整合,但是中国远远达不到,所谓智慧城市基本的条件。大数据的利用,首先要求政府原则上该公开的必须公开,要保密的只是少数,而我们现在要公开的只是少数,在节点上我们有很大的差距。为什么这样呢?谁掌握信息,谁就掌握主动权,谁就掌握权力,数据公开是利益格局的一种调整,往往我们有些部门,利用手上掌握的数据,利用公众信息化的不对称来实施它的寻租,实施垄断的行为。所以在节点上,是一种革命。

  大数据的挖掘和利用需要有法可依,我们国家需要尽快制定信息保护法和信息公开发,既要鼓励面向群体而且服务于社会的数据挖掘,又要防止针对个体侵犯隐私的行为,提倡数据共享,也要防止数据被滥用。

  最后,智慧城市产生大数据,篮球城市数据是智慧城市的重要资产,政府数据是智慧城市数据的重要组成部分。

  开放政府是智慧城市的前提,政府开放数据是智慧城市建设的切入点,城市政府数据的开放性是智慧城市评价的重要指标。

  政府的数据开放有利于市民参与城市管理和对政府的监督,改进公众服务和社会管理,营造创新环境和释放商业机会,市民、企业和政府都将是开放数据的受益者。

  中国在城市开放数据方面还需要加大力度,期待通过深化改革来推动政府数据的开放和智慧城市的健康发展。谢谢大家!

  (本文是作者在第四届中国智慧城市大会上的发言)