让政府数据开放的阳光照进创新创业生态圈
来源:环球财经杂志 更新时间:2015-12-23

建议政府采用战略性系统思维,以构建和培育“生态系统”为目标,从政策法规、组织机构、数据管理、平台开发等多个层面同时推进,最终实现良性循环的、可持续的政府数据开放生态系统。

“政府数据就像封装在玻璃瓶里的苏打水,看上去安静平稳,悄无声息,但只要一打开瓶盖,就能瞬间迸发出无穷能量。”复旦大学数字与移动治理实验室主任郑磊副教授说道。

今年两会期间,李克强总理提出,“政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开,以便于云计算企业为社会服务,也为政府决策、监管服务。”为此,上海开放数据创新应用大赛(Shanghai Open Data Apps ,简称SODA大赛)应运而生。大赛由上海市经济和信息化委、上海市交通委员会主办,中国工业设计研究院承办,以政府开放数据为切入点,集聚社会智慧,激发开放数据能量,促进大众创业、万众创新。大赛的英文简称“SODA”,恰好契合了郑磊所说的苏打水的比喻。经过近三个月紧张激烈的比赛,大赛决赛于11月14日落下帷幕。

SODA大赛以城市交通为主题,运用交通管理部门和相关企业提供的海量开放数据,以产品原型为比赛对象,面向全球征集改善城市交通、便利市民出行、创新商业模式的解决方案。

SODA大赛在中国可谓首创,而在全球,从美国到德国,从新加坡到澳大利亚,这样的比赛已经层出不穷。其中最著名的是纽约市政府举办的“Big Apps”大赛,从2009年至今,已经连续举办了六年之久。

政府数据开放浪潮席卷全球

【《开放数据宪章》规定了五大原则,其中最重要的一条就是“开放为默认,不开放为特例”的原则,这要求政府部门尽最大可能地公开所有数据】

美国不仅是全球最先对大数据革命做出战略反应的国家,也是最早意识到政府数据开放对于大数据革命的重要价值并积极付诸行动的国家。与大多数国家一样,美国的政府数据开放也是从政府信息公开起步的。上世纪90年代以来,美国陆续建立了公开统计数据和预算数据的专门网站,以及为了应对金融危机而建立的公开政府经济刺激预算的网站。2009年5月,Data.goV上线,至今开放的数据集已经超过15.8万个。

2009年8月,白宫发布《开放政府令》,政府数据开放运动正式启动。之后,美国政府定期对数据开放进行阶段性回顾并制定下一阶段工作计划。例如,2013年5月,奥巴马签署《执行令——将信息开放与可机读作为默认政府工作》,该文件强调政府部门应将数据作为资产进行管理,同时对一些非常具体的工作进行了安排,例如指定部门发布数据开放工具包及指南,将开放数据政策与政府购置、拨款政策进行融合,指定部门确定跨机构的开放数据优先次序,等等。2014年5月,《美国开放数据行动计划》发布,该文件对现有的数据开放框架进行了总结,并提出改进措施,具体包括:对已开放数据定期进行可用性测试,对各政府部门进行经常性数据可用性培训与API培训,与公众、社会组织进行互动以确定数据公开的优先级,等等。

此后,超过40个州及地方政府陆续建立了独立的数据开放门户网站。2012年2月,纽约市通过了《开放数据法案》,这是美国历史上首次将政府数据大规模开放纳入立法。根据该法案,到2018年,除涉及安全和隐私的数据之外,纽约市政府及其分支机构所拥有的数据必须全部实现开放,目前已开放的数据集超过了1300个。

继美国之后,政府数据开放的浪潮席卷全球。2011年9月,巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国、美国等八个国家联合签署了《开放数据声明》,成立开放政府联盟(OGP)。2013年6月,八国首脑签署了《开放数据宪章》。依据该宪章,各国要制定开放数据行动方案,最迟在2015年末按照宪章和技术附件要求,进一步向公众开放可机读的政府数据。《开放数据宪章》规定了五大原则,即:开放为默认、为激励创新发布数据、为改善治理发布数据、注重质量和数量、让所有人可用,其中最重要的一条就是“开放为默认,不开放为特例”的原则,这要求政府部门尽最大可能地公开所有数据。截至2014年底,已有63个国家加入该宪章并制定了开放数据行动方案。

政府数据开放为市场生态体系注入新动能

【政府开放数据的意义和价值体现在经济、社会和政治等多个方面】

根据《联合国2014年电子政务调查报告》,不仅是欧美发达国家,包括印度、萨尔瓦多、格鲁吉亚、肯尼亚这样的中等甚至低收入国家,都在下大气力推进政府数据开放,其重要原因在于,政府数据开放已成为推动经济发展特别是创新创业的新动能。

一个正常运转的生态系统需要外界源源不断地输入太阳能,能量在植物、植食动物、肉食动物之间传递,最后由腐生生物分解动植物残体完成能量循环。能量流动是生态系统得以维持和发展的动力。在市场这一生态系统中,同样需要外界能量的输入,而政府数据的开放就像自然界的阳光,对于市场活动特别是创新创业活动具有重大意义。

2013年以来,纽约大学治理实验室一直致力于研究私营部门利用政府开放数据作为关键商业资源的途径。作为该领域的首次全面研究,实验室的“Open Data 500”项目已确定500多家企业利用政府开放数据开展了极具革新意义的业务,涉及农业、金融、能源、教育、医疗保健等领域。据统计,2013年,通过政府数据开放,美国在公共管理、医疗服务、零售业、制造业、位置服务、社交网络、电子商务七个重点领域所产生的直接和间接价值已达2万亿美元。

政府开放数据的意义和价值体现在经济、社会和政治等多个方面。大数据已成为国家基础性战略资源,被喻为未来的石油和金矿。然而,大数据需建立在政府开放数据的基础上,因为大数据应用需要整合和利用政府、企业、社会组织和公众等多种来源的数据,而政府部门恰恰掌握了一个国家大部分的核心数据。

如《联合国2014年电子政务调查报告》所言,“利益相关者们应积极推动和鼓励开放更多数据,参与和开发新的应用,还应促进政府机构、公民、民间社会组织和其他利益相关者之间的交流和合作的氛围”。在这些“利益相关者”中,政府的角色尤为重要。因为现代国家处理复杂的公共事务必须依靠数目字管理,因此政府拥有覆盖全国的经济数据、司法与安全数据、教育和文化数据、公共卫生数据、城市规划与环境数据,等等。政府部门汇集的数据量大、覆盖面广、系统性强、一致性高,是最重要的数据拥有者。在大数据时代,政府开放其保有的数据供社会增值开发和创新应用,为其生产、生活和经济社会活动服务,可助推经济增长和(港股103.40 +0.39%)社会发展,激发大众创业、万众创新,提升国家整体竞争力。

数据开发者在创新创业生态系统中扮演关键角色

【在创造数据价值的过程中,政府、数据开发者、普通公众和外部环境的作用共同决定着开放数据的最终效果,构成一个完整的生态系统】

2014年6月18日,白宫科技政策办公室、美国商务部和纽约大学治理实验室联合召开圆桌会议,这次会议被作为其他联邦机构的样板,用来收集政府数据开放利益相关者的反馈,使美国政府的数据开放政策更符合他们的需求。会议指出,生态系统的参与者们能够通过输入、对话、参与和伙伴关系来帮助改进政府数据的质量、存储和分发。

的确,无论是百度(美股197.03 -0.21%)这样的大型互联网企业,还是大量中小企业,在政府数据开放领域都是创业者,也都是政府开放数据的获益者。就像热带雨林生态系统中的树木一样,他们作为数据开发者,在这一巨大的生态系统中扮演着不可或缺的角色。

开放数据后,政府部门自身不再需要投入资金精力将数据开发成应用来服务公众,而是转为由开发者对数据进行开发利用。数据开发者更了解公众的个性化需求,能够提供更多、更好的公共服务。由此,政府部门不用再自己生产公共服务,却仍能通过与数据开发者的合作提供公共服务[ 郑磊,开放政府数据的价值创造机理:生态系统的视角,电子政务,2015.7。]。这也是政府职能转变和简政放权的重要内涵之一。据统计,政府开放数据每年为美国的医疗服务业节省3000亿美元,为欧洲的公共部门节省2500亿欧元。

同时,由于政府开放的数据是原始数据,普通公众难以直接利用,需要专业的数据开发者对数据进收集、清洗、挖掘、展现,从而形成具有商业价值的数据。从而,数据开发者与普通公众之间也相互依赖,前者开发的应用服务于后者,后者则成为前者的用户。在数据开发者的串联之下,政府、数据开发者和公众之间形成了合作伙伴关系[ 郑磊,开放政府数据的价值创造机理:生态系统的视角,电子政务,2015.7。]。三者间的动态互动关系共同决定着开放数据的价值创造过程。在这一过程中,数据开发者除了自身获得商业收益外,更能带来巨大的社会效益。

以百度公司在交通领域的实践为例,百度在与各地交通部门开展“互联网+交通”战略合作过程中,根据各地数据基础、交通环境和应用需求,采用了资源置换、购买服务、无偿服务等不同模式,将百度大数据技术和资源与各地交通部门和企业的数据进行融合,为公众提供综合交通出行信息服务,为交通部门提供决策支持服务,真正实现了“合作共赢、优势互补”。例如,百度地图结合江苏省交通运输厅提供的实时公交数据,为市民提供精准的实时公交服务,已覆盖南京的650条公交线路,覆盖率达85%,准确率更高达95%,将极大优化市民的出行体验。百度地图负责人介绍说,在百度地图中上线南京的“实时公交”功能,正是通过引入官方的权威数据,让乘客得到最权威的即时数据;同时,公众在交通出行的困难、建议也能及时传递给政府,帮助政府科学决策。

总之,在创造数据价值的过程中,政府、数据开发者、普通公众和外部环境的作用共同决定着开放数据的最终效果,构成一个完整的生态系统。建议政府采用战略性系统思维,以构建和培育“生态系统”为目标,从政策法规、组织机构、数据管理、平台开发等多个层面同时推进,最终实现良性循环的、可持续的政府数据开放生态系统。

“打开瓶盖,释放能量”——政府数据开放的上海尝试

【被参赛选手们提交的精彩方案所感染,上海市交通委领导临时决定脱稿发言,表示“大开眼界”“大受启发”“智慧在民间”】

目前,纽约市已经初步建立起了一个基于城市社会运行数据的“生态系统”,为打造真正的智慧城市奠定了基础;中国已经批准了上百个智慧城市试点地区,但建立政府数据开放平台的城市屈指可数。上海市在我国政府数据开放方面一直走在前列。上海于2012年6月首先上线试运行“上海市政府数据服务网”,近期举办的SODA大赛,则是一次让政府数据开放的阳光照进创新创业生态圈的很好尝试。

为了办好这次大赛,上海市有关部门和企业开放了上千GB的数据集,其中大部分数据集在国内属于首次开放。大赛吸引了近3000人参赛,征集有效创意方案总计505个。下一步,大赛主办方和承办方将对优秀项目提供投资对接和孵化落地支持,目前已对接了11家项目投资合作方,涵盖孵化器、公益性基金、商业资本等各领域,有望真正实现开放数据、大数据应用、项目落地孵化三位一体目标,体现开放数据对于促进创业创新的巨大作用。

仅仅围绕交通一个领域的数据,选手们就提交了涉及交通综合分析、公交优化、出行规划、绿色出行、交通金融(保险)模型等主题的大量方案,包括宝贝出行计划、出租车合乘、地铁运营优化、智能抑尘、骑行生活等应用。最终,CNC团队的“基于动态网络与社会激励的新能源汽车租赁系统”摘得大奖。该系统针对解决新能源汽车租赁布局冷热不均、运营成本偏高等问题设计的,在分析智能一卡通、停车场、道路指数以及自行抓取的地理信息数据基础上,重新设计了新能源汽车的动态分配系统。

被参赛选手们提交的精彩方案所感染,上海市交通委领导临时决定脱稿发言,表示“大开眼界”“大受启发”“智慧在民间”,并表示大赛的结果坚定了他们在未来开放更多更好的数据的决心。郑磊认为,“政府开放数据,让社会来开发利用这些数据,为社会创造公共价值,实现政府与社会的共创合作,众筹众包解决公共问题,同时又节省了财政资金,这正是开放数据的本意”。

以政府开放数据带动创新创业的实施路径

【建议进一步完善数据开放顶层设计,从基础层、数据层、平台层着手,多措并举、着力突破重点难点问题,加快政府数据开放工作步伐】

今年8月发布的《国务院关于印发促进大数据发展行动纲要的通知》明确提出,要“稳步推动公共数据资源开放”。但是,由于相关法律法规和工作机制不完善,各部门各地区数据基础不一、开放意识不一等原因,政府数据开放工作的推进步伐并不尽如人意。建议进一步完善数据开放顶层设计,从基础层、数据层、平台层着手,多措并举、着力突破重点难点问题,加快政府数据开放工作步伐,为推动经济转型发展提供强大动力。

(一)基础层

1.建立开放数据的组织框架和领导架构。佛山市南海区成立了数据统筹局,上海市经信委也成立了大数据发展处,但国家层面尚缺乏统一的主管部门。建议组建国家级数据开放领导机构,建立项目管理办公室,在各级政府部门设立或指定数据开放管理机构,并赋予该部门统筹协调各部门数据开放工作的职权,同时明确各相关部门在开放数据工作中的分工与职责。

2.进一步完善开放数据的相关制度设计。上海市已经建立了三年内的政府数据开放清单。下一步,上海市将按照“开放为默认,不开放为特例”的原则,建立负面清单,负面清单外的数据全部开放。建议中央和各地方政府制定开放数据战略发展计划;对开放数据的对象、形式、边界进行严格定义,保证数据开放的规范化和制度化;以“开放为默认,不开放为特例”的原则,从正面清单逐步过渡到负面清单;建立激励机制、补偿机制和绩效评估机制,充分调动各部门的积极性;进行开放数据实践试点;编订数据开放工作计划并公开发布。

3.建立可操作性强的法律法规和标准体系。建议对于“国家安全、商业机密、个人隐私”进行更加明确的界定;对数据开放的申请,获取和救济措施加以规定,对用户的自由使用权利,特别是商业使用权利予以明确清晰的保障;制定统一的数据标准,包括大数据术语、相关参考模型以及数据标准接口的规范,并在制定过程中充分参考吸收国内领先大数据企业的实践经验;建议学习并参考国际上现有的行之有效的知识共享协议、开放政府协议,因地制宜制定出适用于中国国情的开放数据授权协议条款,保证用户享有的数据访问、获取、利用和分享的权利及相应义务。

(二)数据层

1.以用户需求为导向开放数据。郑磊的研究发现,中国大部分地方的数据开放平台大都不能对数据请求进行及时有效的回应,仅有宁波海曙一个地方的平台公开罗列了收到的公众反馈意见和数据请求意见,而其他地方都将这些数据封闭在后台,不利于激发大众参与互动反馈和数据请求[ 郑磊,高丰,中国开放政府数据平台研究:框架、现状与建议,电子政务,2015.7。]。建议在开放数据的过程中,始终坚持从用户需求出发,有针对性地开放数据,而非“任性”地开放数据。建议主管部门与数据需求者(例如企业、个人开发者、媒体、公众代表等)以圆桌会议、网络论坛等形式采集公众需求,并以此激励和带动全社会的数据利用;根据公众需求调研情况,设定数据开放优先级,对于基础性数据优先开放,其他数据设定不同等级逐步开放。

2.进一步提升数据的可利用性。当前一些地方发布的政府数据存在数据量少、价值低、可机读比例低等问题。郑磊研究发现,“云上贵州”目前所提供的数据均不能下载,其门户所包含的17个数据集均为外链到原有为信息公开目的而搭建的网站,其主要服务目标是让公众知情而非增值利用,其实质并不符合开放政府数据的原则和要求。建议提升数据开放性与可机读比例,尽可能开放API接口,让企业用机读的方式直接利用数据;建议完善数据发布审核流程,以自动检查和人工审查相结合的方式,对发布的数据格式进行严格检验,确保所释放的数据满足数据格式的开放性要求;建议在数据发布时提供更加详实的元数据(即关于数据的数据),让用户根据自身需求对数据进行开发利用;建议规范数据更新周期,落实数据更新工作。

3.政企合作模式推动数据开放。建议支持互联网企业、行业组织、新闻媒体、科研机构等社会力量依法采集相关信息。引导各类社会机构整合和开放数据,构建政府和社会互动的信息采集、共享和应用机制,形成政府信息与社会信息交互融合的大数据资源。数据发布单位可先行调研和实际测试特定动态数据的价值,再由企业竞标负责相应数据API的开发和维护,通过政企合作的方式将动态数据源源不断地开放给社会、服务于公众。

(三)平台层

1.加强对政府部门数据的国家统筹管理,加快建设国家政府数据统一开放平台。目前世界上已有46个国家建立了政府数据开放的门户网站,其网址大多是“data.gov”。而在我国,目前只有北京、上海等少数发达地区建立了统一的政府数据开放平台,国家层面的数据开放平台尚未建立。建议启用“data.gov.cn”域名作为国家层面数据开放平台,由专门机构负责管理,国内领先大数据企业负责建设,从国家层面推动政府信息系统和公共数据互联开放共享。

2.降低数据获取门槛和互动交流门槛,使用户方便地获取数据并参与互动。目前,一些地方虽然建立了数据开放平台,但仍存在交互便捷性差,沟通交流缺乏有效性、公开性等问题。建议政府开放数据平台加强互动交流功能,及时搜集用户所提交的对单个数据集的评价、对数据的请求、对平台整体的意见建议等信息,并及时进行回应,不断满足企业和民众日益增长的个性化、多样化数据需求。(感谢复旦大学数字与移动治理实验室主任郑磊副教授对本文的指导和帮助)