城市社会治理的复杂性和大数据
来源:中国电子政务网 更新时间:2013-11-07

  主持人:谢谢赖主席的精彩演讲!接下来演讲的嘉宾是哈尔滨工程大学计算机学院院长、博士生导师张文燚教授,张教授长期从事国家信息化和政府信息化顶层设计和战略规划的相关研究工作,主要参与了国家信息化发展战略、国家电子政务总体框架、“十二五”国家政务信息化工程建设规划、国家电子政务工程建设项目管理办法、国家政务信息化工程绩效评价办法、国家电子政务工程建设项目需求分析指南、政府信息化顶层设计研究报告等国家政策文件的研究和编写工作,其研究成果曾获国家科技进步二等奖、国家发改委优秀研究成果二等奖、北京市科技进步一等奖,他今天演讲的题目是“智慧城市的复杂适应性探讨”,掌声有请张教授!

   女士们、先生们:大家上午好!

  我是第三次参加智慧城市建设研讨会了,来到这以后看到很多老朋友,感觉到非常的亲切,很开心,今天想和大家探讨的是智慧城市的复杂适应性。

  什么是复杂适应性呢?我不想按学术的方法去解释这个学术名词,我想讲一个故事,一个典型的例子就是孙悟空在天上玉皇、诸神、西方佛爷、菩萨、山野妖精怪物构成的复杂的共生环境下,经历了大闹天宫、被压五行行,西方取经九九八十一难,这就是复杂适应性,诸多仙家也在适应,从最开始不接受孙悟空,最后认同他斗战胜佛的地位,他们也在适应,所有成员都在适应这样一个复杂的系统。老孙的环境太复杂了,最难对付的就是唐僧,有一次一个学生问我,他说老师你知道为什么唐僧一张嘴孙悟空就头疼吗?我说他念紧箍咒,他说不是,唐僧一张嘴就停不住,孙悟空能憋疯了,所以头疼,我一听,好象是嫌我话多。指导学生时候老师得适应,指导“90”后的学生老师比较困难,现在一说话多了,他们就说师傅知道了,我就知道说我是“唐僧”,或者捂着肚子、皱着眉头说我胃疼,这就是复杂适应性。

  为什么讨论智慧城市时候要说复杂适应性呢?言归正传,今天我想从三方面跟大家探讨智慧城市的复杂适应性:一、城市社会治理的复杂性和大数据。二、如何从大数据挖掘新知识。三、智慧城市的复杂适应性和云计算支持。

  一、城市社会治理的复杂性和大数据

  社会城市、智慧城市,其实都在支持着城市的社会活动,城市社会和城市活动本身的复杂性其实不必多说,大家生活在城市里,都有体会,进入信息时代,城市社会的复杂性大幅度增加了,这是因为什么呢?因为信息时代有一个突出的特征,这个特征就是承载信息活动的网络空间(Cyberspace)已经成为和承载生产活动的物理空间、承载文化活动的精神空间、承载财富活动的市场空间成为一种同样重要的经济社会活动空间,这样的说法显得太正式,其实大家应该能够感受到越来越多的时间我们是生活在网络空间里,现在过年的时候让孩子到亲戚家拜年,首先得问一下有没有WiFi,没有WiFi连拜年都不愿意去,为什么?就是因为生活在网络空间里的时间太多了。

  在整个城市社会,很多时间生活在网络空间的时候就产生一些问题,什么问题呢?城市一些公共事件在Cyber空间的传播呈现出一种河塘效应,什么是河塘效应呢?这是一个比方,如果看见池塘里第一天长出一片荷叶,第二天长两片,第三天变成四片,如果第三十天的时候半个河塘也荷叶的话,到第三十一天你发现奇迹发生了,见证奇迹的时刻就是整个河塘都被荷叶覆满,使得城市公共管理应对很大的挑战,如果我们的城市治理部门治理公共事件候不能够及时有效,很大程度上就会激起社会公众的不满和强烈的质疑,这种情况下,会严重影响城市管理部门的公信力和社会声誉。在信息时代,大多数的城市治理活动会迁移到Cyber空间,Cyber空间的信息活动主导着现实空间的治理活动。

  为什么说Cyber空间的信息活动主导着现实空间的治理活动呢?我们现在经常谈市场化,为什么这么重视市场化?因为市场决定了整个经济的发展,为什么会有这种现象呢?就是因为人类社会的经济和社会活动涉及到交易性的财富活动在市场化的进程中整个迁移到市场空间,市场的一举一动就会产生非常大的影响,据说现在中国如果打个喷嚏全世界经济都会感冒,就是这么个影响。在信息化时代,Cyber空间是什么东西?Cyber空间是美国人提出来的,新华社翻译成网络空间,Cyberspace,网络空间的翻译很形象,但是不是特别能传达内在的意思,解释一下,Cyber这个词在希腊文中的原意是舵手的意思,上世纪40年代末威娜些控制论时候发现一个词叫Cybermetics,这个词中文翻译成控制论,Cyberspace可能是思维的新家园,像是一个控制着现实空间的空间存在,应该会成为现实空间的领航者,如果我们从这个角度来理解Cyberspace的话,就智慧城市而言,网络空间的信息活动确实主导着现实空间的城市治理活动,这种领航者其实有着重大的责任风险。

  去年我跟大家探讨智慧城市顶层设计时候说智慧城市建设意义重大,通过顶层设计要渐进的实施,别着急,让子弹飞一会儿,第二天看到网络上有醒目的标题,说张教授让智慧城市的子弹再飞一会儿,吓的我一个星期都不敢上网看,怕有人骂我,但是我今天的观点仍然是智慧城市子弹还得再飞一会儿。城市社会的治理的复杂性是非常高的,如果我们没有看清楚城市社会治理的复杂性,不能够适应城市社会治理的复杂性,智慧城市这颗子弹就会落地,不会击中目标。

  复杂性怎么理解?讲几个故事:第一个故事,西方某个城市在上世纪90年代中期出现了犯罪率大幅度下降的现象,市长就很高兴,让警察局好好总结一下你们有什么先进的经验,看看能不能宣传宣传,西方人也讲政绩,警察局总结了半天没总结出什么新的经验出来,觉得好象都是常规的做法,后来交给美国一个智库做研究,研究结果是什么呢?在上世纪70年代末这个州修改了一下法律,在基督传统文化的社会里不允许少女堕胎,于是乎许多私生子的现象很严重,十几年后可能成为犯罪的源泉,上世纪70年代末这个州修改法律了,允许少女堕胎,仇恨社会以及社会待遇不好的青少年犯罪人群大幅度缩减了,于是这个城市犯罪率大幅度下降,表面上看,犯罪少了,显然是警察的功劳,其实警察不敢认领这个认领。复杂性另外一个表达,搞IT的都知道,一说数据仓库就会说啤酒和尿布的关系,不研究数据挖掘的人可能还不一定很清楚,啤酒和尿布是什么故事呢?沃尔玛商场通常把啤酒和尿布摆一起卖,为什么呢?因为沃尔玛通过长期的对销售小票分析之后发现一个很奇怪的现象,他们发现很多买尿布的人也买了啤酒,后来就摆一起卖,果然销量大增,后来有人专门做了一个调查研究,在北美,年轻人结婚有孩子之后年轻人会更加努力工作,尤其是男性,回到家里以后,太太在照顾孩子,自己得出去给孩子买尿布,感觉自己也很辛苦,买尿布的同时顺手给自买罐啤酒喝,这是一种行为习惯,不是社会行为学研究之后得出来的,是沃尔玛销售小票中表现出来的。沃尔玛发现大家在飓风到来的时候买飓风用的手电筒、账篷设备时候同时会买一种很甜的蛋挞,也可能飓风来的时候躲在家里,用特别甜的滋味安慰一下自己,这些人的行为规律在日常感触中没有得到清晰的认识。

  更可笑的一个问题是如果你问一个孩子,尤其是在中国,一个上大学时候退学,工作时候又被公司开除,你能向这样的人学习吗?家长显然认为不应该向这样的人学,如果你说这个人名字叫乔布斯,家长都觉得孩子该跟这样的人学习,从表面现象来看,上公司退学、被公司开除以后并不意味着这个人不能成功,一些理论家也在做复杂性方面的研究,普利高津说简单的确定性终结了,马尔可夫说存在是一种在时间上展开的随机过程,波普尔说要发现真知只能试错,哈耶克说我只知道自觉形成的秩序。

  面对城市社会的复杂性,城市社会的治理就必须有能够分析城市社会复杂性的方法和技术支持,如果我们采用传统办法对事物的状态进行样本记录的方法,我们称之为小数据的方法,这种是最传统的科学分析方法,我们把很多很复杂的事物进行细分,细分成很多碎片之后,我们对这些碎片进行采样研究,形成的结果是我们得到的小样本数据,我们通常基于这种小样本数据、基于所谓的数学归纳法、逻辑归纳法对事物进行认知,这种认知是得不到真实有效认知的。现在有人提出要记录、收集事物存在和演化过程全生命周期内产生的所有数据,而不是小样本数据,这就是我们所说的大数据,用这个方法对事物形成有效的认知,大数据分析方法突出的特点是摒弃了传统的所谓的科学分析方法,这种科学分析方法就是把问题划分成很多细部,从环境中孤立出来,试图单纯性的认知这个事物。大数据是从完整的表达一个事物的角度来考虑,表达的是事物内在的耦合关系,一条大数据就很大,现在很多人说大数据时候,我经常说改个题目,叫海量数据比较合适,通常会把大数据和海量数据混同,因为大数据关注的是能否描述全景的、全生命周期,不在于组织规模多大,要想描述完一条数据,组织规模就非常大,大家一讲大数据,觉得视频录像的数据太大了。

  大数据技术的真实内涵和主要贡献。现在业界和学术界都不是越来越清晰,而是越来越模糊,我发现任何一项有潜在利益的新数只要进入我们这个社会都会被一窝蜂的各自表述的这样一种跟进淹没它的本来面目,我们关注大数据,尤其是在发展智慧城市时候我们关注大数据,为什么呢?因为我们认为大数据是事物本体的一种表现形式,是对事物概念完整的表达,全生命周期的表达,这是跟传统的小样本数据不同的地方。第二,事物的大数据显示的是场景介入信息,经济社会活动中有许多场景,介入是一个过程,能够表达城市社会的组分结构和整体的均衡性,在改革相关的研究文件中经常说尽管我们不愿意承认我们的社会现在分化为多各阶层,但事实上多个阶层已经存在了,如何认识城市社会多阶层的存在?我们需要场景介入式的信息分析,说场景介入,好象很抽象,其实很简单,上次我跟民政部的同志探讨低收入家庭信息甄别,我说你要看看人均用电量、用煤气量、日常生活垃圾处理量、网购量,然后可能就能够知道他是不是低收入家庭,如果真是很低收入的话,有些活动就可能介入不了,或者说不能深度的介入,所谓高端、大气、上档次的场景可能低收入家庭纠没法介入,如果介入了,也不应该属于低收入范畴。第三,大数据能够体现出经济社会场景耦合现象,耦合现象本身能够表达出隐藏在城市社会系统内部活动中有重大意义的事物相关关联,像啤酒和尿布就属于这样的故事。第四,从大数据场景耦合现象来看,时间分布可以体现出城市社会系统的发展和演化趋势,这些是我们关注大数据的核心原因。

  二、用大数据挖掘新知识的现代智慧

  现代城市社会越来越开放,越来越新潮、躁动、不安分,城市治理需要适应城市自身的存在和演变的规律,要适应城市自组织发展与演化的规律,城市社会自组织的特征有三个方面:第一,要想治理好城市社会,需要赋予它一种开放平权、组分自优、生生不息的组织体系。大数据分析可以帮我们展现组分结构和均衡性,通过组分结构和均衡性分析我们可以完整的刻划城市社会的组织体系,研究自组织演化的规律。第二,现代城市社会需要被赋于一种伺服新兴生态、管理突变风险、协调利益认同的协同动力大数据,分析展现的系统发展和演化趋势,支持我们有意识、有目标的聚集这样的协同动力。第三,要赋予城市社会一种自发的催化拟种,简单地讲,要想发展一个新事物,咱们先得试点,试点的方法就是催化拟种的方法,这个种如果活下来了,而且活的很好,说明这种方法不错,有的时候催化拟种之后还要有自洽的催化循环,拟种要想活下来必须在开放的循环机制下能够吸收营养,这样才行,如果靠政府精力养着,那这个种就不是好种,自主模式要能够优化,我们要赋予城市这样的治理机制,如果我们能把开放平权这样的特征、伺服新兴这样的生态、自发催化拟种的机制能够赋予城市,这个城市就能够在整个大的经济社会循环中呈现出自主发展的勃勃生机。

  大数据怎么能够支持组分均衡性的分析呢?如果做理论阐述,太复杂,举几个例子,比如甲型H1N1流感爆发的前几种,互联网巨头谷歌公司在《自然》杂志上发表了一篇文章,引起了轰动,他们预测流感在北美会怎么怎么流行,能够精确到每个州、每个城市,而且也就一天之内就能预测出来,非常及时,比美国卫生部的预测还要及时、有效、准确,为什么呢?把五千万条美国人最频繁检索的词搜索出来,城市里的人因为自己问题上网搜索,政府轻易是感知不到的,搜索引擎可以很容易的感知到,他的预测比美国部疾控中心预测的还要准确,感冒人群的分布就是一种典型的组分均衡性的分析。

  大数据支持的趋势规律性分析,美国联邦政府为了管理自己的社会经济和金融的发展,他们在全美90个城市采集8000种商品价格的变动情况,这个项目每年花联邦政府2.5亿美金,2008年美国发生金融危机,2008年9月份雷曼兄弟公司破产,11月份美国出现了通缩的趋势,觉得好象还是很成功的,但是与之相比较,麻省理工学院的两个经济学家有了一个自然科学基金支持的项目,在互联网上搜集全美50万种商品价格的变动,在开放网络上搜集的信息都是不准确的,但是由于采集的量是50万种商品,具有全景性,不是采样性的,通过大数据分析,在雷曼兄弟公司破产之后的一个星期之内就发现了通货紧缩的趋势,大数据显示出了超能力。

  大数据支持隐含相关关系的分析,刚才举了一个啤酒和尿布的例子,还有一个故事,商家营销策略是多种多样的,通过营销过程的分析,可以得出一些有意思的营销策略,比如说他们经常通过一些女性购买相应的商品的组合和时间上展开的规律来分析能够发现这些人在这个阶段购买这些商品预示着他可能已经怀孕了,在接下来的时间里,他可以推销保胎的知识,如果预测到已经生孩子了,就会推销婴儿用品,有些时候会产生一些误会,据说在美国的某个城市塔吉特就被一个中年男人袭击了一把,很生气,我的女儿还上高中呢,你怎么给她推销婴儿床,你鼓励她上高中就怀孕吗?后来经理就过来道歉,道歉的时候中年男子说看来是我搞错了,我跟女儿谈了一下,她确实怀孕了,预产期在8月份,自己上高中女儿怀孕的现象做父亲的不知道,但是塔吉特商店已经知道了,这都是大数据在相关关系分析上带来的一种支持。

  我们利用大数据这些支持技术支持我们的智慧城市建设,跟我们智慧城市的顶层设计有什么关系呢?我们在做智慧城市发展时候,刚才已经讲了,是基于自组织的历年来进行城市社会系统的顶层设计,这种自组织的模式需要我们对城市发展的全景、全生命周期进行分析,需要通过顶层设计能够使得我们达成对城市社会系统开放、组分自主、伺服新兴、自恰循环、模式优化的总体性支撑,推动智慧城市发展时候必须认识到智慧城市发展是社会工程,必须要面对着开放与垄断的持续博弈,必然面对着组分与系统的持续博弈,必然面对着新兴与传统的持续博弈,我们推进社会工程时候,必须采取零星渐进式的方式推进,坦率地讲,现在用运动式的方法发展智慧城市显然是不妥的,怎么样才能用零星渐进式的方法发展智慧城市呢?我们无外乎做几件具体的工作,我举几个例子,比如城市管道的维护、沙井的维护,这是城管典型的内容,曼哈顿就有过这样的专项工程,不解决完整的事情,能够非常有策略的、准确的管理这些公共设施,UPS快递公司在处理城市物流时候也有一个很好的优化案例,UPS公司感觉如果自己的快递运输车在路上发生故障,然后导致自己还要临时调换车,成本会非常高,他们有一个策略,每隔三年就把相应的运输车关键部件更换一遍,带来了很多的维修成本,同时,也不一定能够真正全面的解决问题,后来他们采取了物联网加大数据的方法,把每辆运输车关键部件上贴上传感器,在车上加装上移动互联的设备,把关键部件的数据信息传输到控制中心,这样就可以很轻松的判断出准确的维修时间,据说一年可以省好几百万美金,优化城市的物流服务是智慧城市典型的发展工程。下面是金融服务领域的例子,通过交易数据,发现了一些失信问题。

  三、智慧城市的复杂适应性存在形态

  感谢大家耐心地听完我的介绍,祝大家一天好心情。

  谢谢大家!