上海交通大数据研究与应用探索
来源:上海市浦东新区科学技术协会网 更新时间:2014-03-02

 2014年1月8日,149期Italk论坛活动如期在张江传奇广场的IC咖啡举行。尽管天气阴沉,小雨不停。Italk论坛活动还是吸引了四五十位听众冒雨赶来。

 

 上海市城乡建设和发展研究院交通信息中心何承主任开门见山地介绍了上海市城乡建设和发展研究院的由来,话锋一转就转入了对上海交通大数据相关的数据采集,数据处理,数据应用的介绍。活动最后。何主任和相关的企业代表做了一些交流。

 何主任:今天很高兴来到这里,今天我感到非常贴近市场和贴近大家,因为交通问题是大家的问题,都会碰到的。城乡交通发展研究院也是刚刚成立一年。原来叫上海市交通信息中心,有几家交通相关机构合并并成了研究院。

上海交通整体的信息化开始于2004年。大家最初的印象,就是高架上出现情报版,这是第一期做的工作。经过这几年建设,特别是在世博会之前持续投入的,我们上海整个路网的交通信息初步建成了。

 交通信息采集通常的是这几个方式,既有地址的,也有出租车的GPS的,包括视频图像的,还有上海的信号控制系统。目前平台上汇集的数据项目还是很多的,像交管部门的交警,事故、事件、信号控制、相位等等都汇集了。这些信息汇集到一个平台上面,目前有140多项大项,大项下面的小项上面会有更多的信息。

平台汇集数据分三步走,第一步首先登记道路交通的跟车类有关的信息,第二步是客流,第三步是货流。如果把这三个流掌握了以后,城市交通整体情况大概就可以搞清楚了。

上海整个城市路网分成三大路网。第一张路网是城市的快速路,就是高架道路。第二张就是中心城区的地面道路,第三张就是郊区的公路体系。在这三张路网上面,采用了采集的手段,包括交通状况的手段都是不一样的。这个是目前采集的状况。目前数据更新频率周期是两分钟一次。

原来在高架上看到的情报红绿黄,可能开车的时候会看到。但是每过两分钟就变新的了,这个数字怎么存储呢,交通信息中心做了一个交通指数。这两张图就是显示下面的两种道路的交通指数,这张是快速路网交通指数,这张是地面道路网交通指数。如果看得仔细的话,就会发现快速路网平均的拥堵要比地面道路网要好。但是上高架的时候,就会发现高架上也堵的不得了。那么为什么会做出来这样,主要的原因是指数是把整个路网进行了平均。在快速路网上每天拥堵的点超过总里程的15%,高架基本就瘫痪了,基本上每天拥堵点在10%到11%左右,平均以后就会产生这样的一个交通指数。

关于这些大数据的运用,今天只能简单地介绍一下,交通数据平台也分成了两个,一个是内网系统的综合评价,还有一个外网系统的应用服务。在这个应用服务平台上可以对外提供虚拟情报、交通拥堵指数等交通数据。

 以下是精彩的交流环节。

 提问1:何主任,数据开放当中有没有一套APS的结构。现在在可以拿到百度的APS。交通中心把数据开发出来以后,我们也可以做这种后续开发。

何主任:下一个阶段对数据的开放就想朝这个方向做,原来就把这些数据输出的时候,都是有针对性的地图公司。用来做导航软件。原来着重在数据开发上靠近地图应用上面。

 提问2:何主任,您觉得这些数据最好的应用场景可能有哪些,您能大概说两个吗?

 何主任:目前平台大部分还是在用于管理和决策,并不清楚市场怎么用,大家现在在百度、谷歌还有好多网站上看到的上海交通的数据,应该都是我们提供的。

提问3:关于交通数据存放,包括历史数据的存放,是怎么考虑的,有没有考虑过这个问题?

何主任:存放的时候对数据的类型,我们是做过一些工作。但是随着大数据要求,包括交通的相关因素越多以后,感到传统的140几项的数据放进去,也完全不能适应目前的需要。

提问4:一个小时后的交通预测比较难,但是一般人在开车的时候,他更关注比如说二十分钟或者半个小时,一个小时之外并不是很关注?何主任:因为有各种各样的突发事件的变化会引起整个交通状况的变化。如果说每天状况都是一样的,那交通预测也相对容易。但是由于开车还有驾驶员的开车行为,事故、事件和突发事件造成的一个小时以上预测难度比较大。但是三张路网也有不同,比如地面道路跟快速路不同。

提问5:如果说对于堵车这种现象,历史数据的价值大不大?

何主任:因为历史数据越早准确度就越高,规律都是很明显的,不会有很大的变化。