基于深度学习的城市路网交通预测分享之总结

Posted by 无限可能的想象力 on December 4, 2018

最近,我听了DT财经-数据侠实验室第75期:解析基于深度学习的城市交通预测。张博士对于他们所做的工作介绍的非常详细,直播结束时,我提了几个相关的问题,在此进行简单地记录,并进行相应的扩展,这些问题都是深度学习中常见的问题。

接下来,从以下几个方面进行总结:首先,对该分享进行总结;其次,整理一下提问内容,并对提问内容进行扩展;最后,进行总结。

对分享进行总结:

  1. 背景介绍:交通路况(交通拥堵)影响日常出行,基于过去的交通路况进行交通状态预测:基于路况预测的旅行时间估计;基于路况预测的动态路径规划。
  2. 问题描述:基于路网T时刻之前的交通状态,预测之后一段时间内的交通状态。这里的一段时间可以是1分钟、5分钟等等。
  3. 挑战及其对应的解决方案:使用深度学习进行预测
    • 交通状态变化呈现非线性特征:使用序列模型Seq2Seq来解决
    • 多步预测误差估计,预测准确度低:使用注意力机制Attention来改进模型
    • 交通状态空间关联性复杂:使用图卷积网络来处理空间信息
    • 交通状态受天气、时段、周次影响:构造多维度的特征向量
    • 基于海量的路网数据
  4. 算法实验:基于以下标准进行算法对比实验。
    • 平均绝对误差
    • 平方根误差
    • 平均绝对百分误差

提问内容

  1. 从数据的角度来看,如何避免梯度消失和梯度爆炸问题?

    梯度消失和梯度爆炸问题很大程度是由于模型导致的,数据的影响不是关键

  2. 如何从GPS数据角度来描述交通拥堵

    使用GPS数据进行地图匹配;使用聚类算法对路段进行交通拥堵预测

  3. 对于时间序列的数据预处理,您能给一些建议吗?

    • 异常值的检测
    • 数据缺失:附近数据的差值补全
  4. 如果在时间序列数据考虑周期性,如节假日、工作日等特征

    分别增加两个特征节假日、工作日。

  5. 如何选择特征,以及特征冗余如何处理

    使用决策树来计算特征的重要性,从而进行特征选择

    从结果导向来考虑特征冗余,在添加某个特征,去掉该特征之后,模型的预测结果有下降,说明该特征存在一定的冗余性。

梯度消失和梯度爆炸:https://www.jianshu.com/p/243ab5aff906

异常值的检测

数据缺失的处理方法:https://www.cnblogs.com/xiaohuahua108/p/6237906.html

决策树的特征选择算法:ID3、C4.5、CART算法

总结:

通过听该分享可以发现,特征的选择很重要,不同类型的特征要使用不同的方法进行处理,这样才能最大化地利用特征所包含的信息。从深度学习来看,对于时间序列问题,这是一种比较常用的解决方法;其中,具体使用的深度学习模型以及模型的融合,需要进行定制化处理。

基于深度学习的城市交通预测是一类时间序列的预测问题,因此,该分享同样适用于天气预报预测、股票预测等问题。

参考

  1. 清华团队·解析基于深度学习的城市交通预测 数据侠实验室 75期
  2. https://blog.csdn.net/panda_zjd/article/details/71810859/
  3. https://www.cnblogs.com/xiaohuahua108/p/6237906.htmlhttps://www.cnblogs.com/xiaohuahua108/p/6237906.html)