“大数据”才有“大智慧
来源:信息化建设 更新时间:2014-01-01
大数据的内涵有四个“大”:数据量很大,数据的形式非常丰富,数据能够进行大汇聚,数据已经呈现出了大的价值。
       智慧城市建设已经成为国内外讨论的热点话题,也是各个城市把握新一轮信息技术变革机遇,推动城市数字化、网络化向智能化发展、向信息化社会迈进的一个必然的趋势。第三届中国(宁波)智慧城市技术与应用产品博览会的重头戏——智慧城市发展高峰论坛于9月6日举行,海内外专家、学者、行业精英500多人齐聚一堂,围绕“大数据与城市发展”主题,对大数据的特点与趋势、大数据研究与实现、大数据平台、大数据对智慧城市建设的影响等议题进行交流和探讨。本刊整理了其中的精彩发言,以飨读者。
杨学山:智慧城市,中国跟世界一起往前走
       智慧城市从2008、2009年提出到现在,不到五年的时间,却能在全球快速地普及和发展。为什么?原因很简单。我想,它代表了信息技术发展和综合利用的方向。
       信息技术从上世纪40年代计算机诞生到现在,经历了70年的快速发展。最近十几年来,除了处理技术、传输技术高速发展之外,我们还看到一系列新的发展。特别是传感技术、显示和反应技术、内容处理技术、软件和复杂系统技术,它们结合在一起,使得信息技术形成了一个完整的体系。这个体系需要有新的应用把它综合起来体现,这个点就聚到了智慧城市。
       信息技术的应用经过了半个多世纪的发展,越来越成熟、越来越广泛、越来越深入。而这个发展的一个新方向、新焦点,就是要更加综合、更加集成、更加适合经济社会发展和百姓生活中各种实际事务和发展的需要。而这个需要,也会聚焦到智慧城市。
       多年来,无论是信息技术、信息产业还是应用,我们都是跟在别人的后头。我们和发达国家、国际先进水平,都有比较大的差距。但是在智慧城市这个方面,我感到我们的确是和世界在一起往前走。在这个方面,我们有可能实现弯道超车,因为中国智慧城市的建设,有着最好的实践土壤。为什么有最好的实践土壤?因为中国人口最多、城市最多,发展的速度特别快,面临的问题特别多,要解决的问题特别多。所以在这样的时候,我们这块土壤是应该能够,不仅是跟着别人走,而且倡导出具有世界典型意义的先进经验。
       (杨学山:工业和信息化部副部长)
潘云鹤:大数据有“大”内涵
       我们先来了解下什么是“大数据”,依我看,大数据有“大”内涵:
       第一,是数据很大,数据增长很快。我们可以看到,2010年英特网产生的数据量是0.9个ZB(十万亿亿字节),一个Z等于10的21次方。这个数字已经大过人类过去五千年的积累。到了2011年翻了一番,到了1.8个ZB。我们如果查一下这个数据快速增长的时间,大概是从2005年开始。
       第二,数据可以大汇聚。如果数据很大,分布在各个地方,不能聚在一起,大数据也不会像现在那么吸引人。现在数据很大,再加上互联网的应用和普及,所以数据汇聚起来很快。现在的电子政务、物联网、云计算、数字图书馆、智能城市等系统正在大数据和互联网的促进下相继涌现。
       第三,数据形式多样化。这里面首先包含各种各样的媒体信息,有文字的信息,有视觉的信息,有听觉的、时间的、空间的信息等等。其次这个数据是多视角的,不光有正规的数据、媒体新闻数据、时效性的数据,还有带着个人情感的数据都出现了,它有多种来源。这些数据在处理的时候有一个很大的特点,就是非结构化。什么是非结构化?就是传统数据库二维逻辑很难表达,需要用另外的方法把里面的内容抽取出来。
       第四,数据呈现出大的商机。如果没有最后一个特点,大数据不会像现在那么引人注意。这个特点在12年以前大家还不清楚,但是现在已经越来越明显。大家可以想一想,在本世纪初的时候,经济学家曾经发明了两个词,一个叫注意力经济,一个叫点击率经济。他们当时就感到很奇怪:你如果开办一个公司,只要点击率高,不需要赚钱,风险投资就愿意投资,就愿意对你这个公司入股。这个事情一直到了google、facebook的兴旺程度超过了微软,全世界才领悟了,这个世界已经从软件为王转到了数据为王。
       (潘云鹤:中国工程院常务副院长,中国工程院院士)   
郑纬民:大数据要“高可用、不丢失”
       我是在清华大学做系统的,因此我从系统的角度来看这个大数据,谈谈大数据存储。
       大数据存储有四个要求:第一,高可用,数据能够随时访问,不丢失。也就是数据存起来以后,你什么时候来都给你,这叫高可用,这是第一个要求。第二,成本低,对磁盘容量要求低,这么多数据尽可能少用一些硬盘。第三,性能,访问速度快。第四,低开销,不是说价钱,说的是对CPU、网络资源自占用少。
       我们做了一个云存储(MeePo系统),物理上来说买了非常多的硬盘,分别放在清华大学东主楼、西主楼、图书馆三个地方,软件上主要做了一个分布式文件系统。实际上对用户来说,如果你是我们MeePo系统的用户的话,我们给你20G的空间。你的笔记本打开以后,过去能看到C盘和D盘,都在你的笔记本硬盘里面。现在还能看到一个M盘,这个M盘实际上不在你的笔记本里头,而在我们云上。你写一个文档,过去可以放在C盘,有一个电影可以放在D盘。现在可以存一个电影到M盘,有一张照片可以放到M盘,感觉跟你放在C盘、D盘是一样,使用也一样。
       (郑纬民:清华大学计算机系教授,中国计算机学会理事长)