当前位置: 首页 > 在线访谈

李萌:大数据交通管理决助力智慧出行

时间:2018-06-05     来源:      作者:

  5月29日,在2018中国国际智能交通展览会“智慧出行”专题报告会中,清华大学交通工程与地球空间信息研究所副所长、清华大学-戴姆勒可持续交通联合研究中心执行主任李萌做了《大数据交通管理决助力智慧出行》的主题演讲。

  6.PNG

  以下内容为安徽省智能交通协会整理发布,未经李萌本人审核。

  背 景

  越来越多的数据可以应用于我们的管理、服务和出行,移动互联网技术、物联网感知技术及多种交通信息来源的涌现,为我们决策分析提供了基本的工具和基础。

  如何在车辆数据和基础设施的数据基础上提升我们的交通数据?

  我们围绕交通网、交通设施、管理部门、交通场站、交通工具、交通事件和交通相关的一些信息来提升数据。

  我想强调一点,随着新技术的不断发展,我们看到了新兴的互联网企业在资本的推动下,让很多的数据成为了可能。

  近几年,我们看到交通信息从数字化向数据化过渡,数据化向数据服务转化。我们发现,在这里仍然存在一些缺陷和病毒。目前的政策没有完全基于量化的分析和量化的管理,车辆画像难以建立,警卫部署缺乏量化的支撑,我们应该要把数据去落到实处。

  数据已经出现却帮不上忙,为什么会存在这样的问题呢?我们列举了以下几点:

  ▼数据孤岛

  许多行业中数据确实出现了,各个部门的数据也出现了。但是许多人认为数据是“新的石油、新的资产、新的金矿”,大家都想去挖取。许多管理部门过高地估计了数据的价值,他们普遍存在管理的屏障和管理的困难。

  ▼无法便捷提取并分析

  一方面,数据本身没有足够的工具去保证,包括个人隐私问题。我们并不能因为隐私问题而不去分析数据,我们有一些分析办法,它可以在保障个人隐私的情况下,让数据本身的价值发挥出来。

  另一方面,它和交通学界有关,长期以来,我们的数据系统帮助我们的规划、我们的管理、我们的决策。这样的模型实际是基于小样的数据,所以我们在彻底变革交通的建模手段,这也是一个过程。

  另外, 在我们这个行业,许多人认为我们是交通行业,交通行业在发展交通大数据的时候,我们更多的不是提及数据科学。

  我们的优势是对行业的理解、对行业的深度把握、知道行业的需要,在这里更多需要的是决策科学。

  怎么样基于这样大量的数据,用数据驱动的方法、数据的思维模式去改变我们现在的一些思维和决策的方法,这是我们想去推动的。

  数据模型支撑交通管理决策

  从2012年开始,随着跟各方面的合作和中心重要人员的加入,我们的数据开拓了一个新的市场。很多传统的、单独管理部门的检测数据和社会、企业相结合。

  我们的拓展数据,包括和高德浮动车的数据合作、公交集团公交车的数据和公交刷卡的信息、交通事故以及地磁检测的数据,这样的数据汇总起来,融合交叉碰撞进行一系列研究。

  我们研究包括拥堵机理及治堵建议、交通事故分析、公交线路优化研究、交通需求分析、信号评价方法研究以及交通流最基础的理论。

  原来基于小样本数据基本的理论,如何在大样本数据的情况之下提升、改善?我们原来宏观的交通流以及交通拥堵的成因分析,包括面向未来新能源车辆会在未来的交通信息里边造成怎样的影响?现有的场设数据是不是可以帮助我们做一些帮助分析?我们做了一系列研究。

  我重点介绍以下几个方面:

  ▼基于可预测性的旅行时间可靠性度量

  旅行时间的预测在交通服务中是关注的要点,所以我们对此做了一个根本性的研究。

  例如:一周旅行时间,分为周一至周五,在特定的场景和特定的时间下,不同的旅行时间波动大不一定意味着旅行时间的不可靠,周一至周五的旅行时间虽然变化很大,但是像以上情况每周基本不变,它是可以提前感知到每天的行程,是可以预测的,根据合格时间可以做哪些是可预测的哪些是不可预测的分析。

  如果用可预测性的方法,可以有效对这两个信息进行交流,这样就可以区别于传统,只看波动性,就认为系统稳定性差,为此做出很多的纠正。

  另一方面,我们可以指出标准差的变化跟时间的序列有关系,所以我们任意调整他们的关系不会影响功能性,但是我们调整这样的顺序对我们持续变化的模式产生巨大的影响。如果我任意调整他们的顺序,我原来可以去判断它是这样的模式发展的过程。所以我们做了一些实验去随机任意的调整数据的顺序和次序,发现调整的越乱可预测性的部分就会变得越来越差,整个模式也变得越来越差。

  我们同时对道路也做了分析,同时我们对不同的道路例如快速路、高速路、主干路和次干路做了不同的数据分析,他们代表了不同的波动性,快速路上是没有信号灯的,主干路和次干路是有信号灯的,次干路又有很多的交叉,此时对我们的交通影响是不同的。

  我们对道路的整集进行了分析,通过不同的计算方法发现了UBP它对异常的波动越少,可预测性越高。对高频的扰动越少对可预测的部分预告。

  ▼基于深度学习模型的旅行时间预测

  旅行时间预测面临诸多挑战,它对比于高速路、快速路、城市路网交通流的特性更为复杂。

  我们引用了卷积神经网络和圈卷积神经网络,在此基础之上新一代基于无卷积神经网络更适合我们交通,一方面我们应用了人工智能的方法,另一方面融入了我们对交通的深入理解。

  我们选取交通指挥网络,通过传统的交通流理论,提出了关键的特征,在此基础上搭建无卷积神经网络的模型,我们现在能够通过无卷积神经网络的模型,有效的提升了整个网络预测的准确度。虽然提升的比较有限,这跟我们选取的网络是否是一个非常稳定的网络有关系。本身旅行时间是一个比较有效的场景,通过一系列模式的尝试可以进一步提升旅行时间的预测。

  ▼城市动态特征分析—非直线系数分析

  城市中小汽车的绕行是广泛存在的,基于大数据不同城市的分析,我们将中国北京、广州、天津、成都的数据融合在一起,同时把纽约的数据也整理出来,在纽约的路网里是不是也存在为了减少旅行时间去选择大量绕行的相关分析。

  在这个分析中我首先对比北京、广州和成都最短路平均值以及默认路线的差别。超过最短路的比例是北京高2.73% 广州高1.64%,额外的绕行三个城市对比北京超过广州广州超过成都。

  我们可以看到,绕行的原因跟路网相关,北京的路网尺度较大,一旦绕行相对于其他城市绕行时间更多一些,路网的密度也是一个关键指标,路网密度在北京5.59/平方公里、广州7.02/平方公里、成都8.0/平方公里,成都是最为密集的路网,选择最短的时间之后绕行的距离较短。

  绕行不一定会导致旅行时间缩短,我们期望未来一些新的数据和技术科学可以推动我们智慧化出行服务,让更多人开始使用智慧化出行服务的功能,整个交通网络的预测将会产生不同的影响。

  数据分析能力平台化

  我们正在尝试把分析合作工具化、把服务进行平台化,我们希望以平台作为一个载体,数据作为一个基础,对已有的数据,利用工具去挖掘,希望做一些相关的服务支撑。

  基于我们对行业、对交通管理的理解,我们提出这种报告分析的体系。这个报告的体系基于不同的数据,包括互联网数据、各类的交通的数据以及我们建立的大数据的平台。我们提出一系列管理职能相关的工具和分析手段,可自由地选取分析目标的区域、参数、时段及展示方式,从而得出有效的分析结果标准化的工具。

  数据辅助决策案例

  1、针对大型事件分析及警力部署

  在天津全运会主要场馆区域之内,我们通过历史数据的变化分析他们常态化的数据,然后累加上可能会发生的事件,在通过有效的优化管理决策实现整个区域的优化。

  2、 交通组织辅助决策

  针对施工占道等问题,我们有一系列的组织方案和预案的分析,整个工具包和工具箱去帮助管理决策,进行有效的分析和仿真的分析等。

  总 结

  数据移动互联网技术、物联网感知技术推动多种交通信息来源的涌现,决策分析已具备数字化基础,缺乏数据驱动的决策科学思维与研究,需要一系列数据模型支撑交通管理决策。

政讯通•全国交通运输资讯发布中心 政讯通•全国交通运输调研中心 政讯通•全国交通运输舆情监测中心