文丨五年宝
编辑丨五年宝
前言
交通预测在智能交通系统中发挥着至关重要的作用,有助于交通部门更好地管理和控制交通拥堵,交通数据一般以地理定位的多元时间序列(MTS)为代表。
不仅表现出MTS的典型特征,即时间依赖性,而且还集成了交通网络的空间信息,即道路网络上传感器交通节点之间的空间依赖性。
交通数据和网络的先进结合
近年来,通过利用交通数据中的时空模式,许多基于循环神经网络(RNN)、时间卷积网络(TCN)、图卷积网络(GCN)等已应用于流量预测任务并取得了最先进的性能。
他们都有一个强烈的假设,即数据是完整的或已经过良好的预处理,然而,由于交通数据通常是从地理定位传感器收集的,传感器故障或通信错误将导致收集的数据丢失值。
从而降低预测模型的性能,研究人员应该指出,缺失的度量通常在流量数据中标记为零,这应该与非缺失度量但值为零的区别。
一个典型的例子来自交通流数据:夜间没有检测到车辆,则交通量被标记为零而不是被视为失踪,这通常可以从现实生活中的交通数据中观察到,丢失率在一天中定期变化。
缺失值可以在计算损失函数时在学习模型中忽略,也可以在训练过程之前或期间考虑,忽略缺失值,尤其是当缺失率较高时,会阻碍模型从丰富的数据信息中获益以获得更好的性能。
在考虑交通数据中的缺失值时,大多数工作在预处理步骤中进行数据插补,然后将完整的数据导入训练步骤,即两步处理。
最近的工作倾向于在训练步骤中联合考虑缺失值和预测模型(即一步处理)并宣称比两步处理有更好的性能。
然而,上述工作面临三个主要问题,先是缺失值和零值通常被认为是相同的,导致不必要的、甚至有害的数据插补,从而与原始数据信息相矛盾。
还有大部分工作从时间角度考虑缺失值,忽略空间角度的丰富信息,还有它们通常被设计用于处理一些基本场景中的缺失值。
比如说随机缺失值或时间块缺失值,但对于这些表示的复杂场景缺乏能力外,在现实世界中,交通数据中的缺失值既发生在远程和短程设置中。
也发生在部分和整个交通网络中,所以需要一种整体方法来处理复杂场景中各种类型的缺失值。
为了处理交通数据中的时空模式和复杂的缺失值场景,研究人员提出了使用M进行交通预测的图卷积网络发行值(GCN-M)。
这是基于图神经网络的结构允许在一步过程中对时空模式和缺失值进行联合建模,研究人员又从空间和时间的角度构建局部统计特征来处理短范围缺失值。
内存模块进一步增强了这一点,以提取全局历史特征来处理远程丢失块,而组合的局部-全局特征不仅可以从固有的零值中识别缺失的度量,还可以丰富流量嵌入。
从而生成动态流量图来模拟流量节点之间的动态空间交互,最后可以从空间和时间的角度考虑部分和整个网络上的缺失值。
用于流量预测的图卷积网络
图卷积网络(GCN)是一种特殊的卷积神经网络(CNN),适用于图结构数据,GCN相关工作都集中在图表示上,它根据给定的图结构集成节点本地邻居的特征来学习节点嵌入。
交通数据显示出空间节点之间很强的依赖性,GCN自然适合这种情况,各种工作在GCN的支持下。
在进行交通预测任务时,依赖于数据的空间和时间完成,或者计算非零条目的损失函数,即仅计算包含有效传感器读数的条目的损失,取得了显著的性能。
但这些技术在对传感器节点之间的时空关系进行建模时可能会引入推导,简单来讲,在需要非缺失测量来表征每个时间戳的动态图的情况下,缺失值可能会阻碍流量图学习。
缺失值处理
MTS中处理缺失值的最简单解决方案是数据插补,比如说统计插补、基于EM的插补、K最近邻和矩阵分解。
人们普遍认为这些方法无法对时间序列中的时间动态进行建模,它们不适用于处理长范围缺失值,而且最近的生成模型显示出长期时间序列插补的可靠性能。
如果将插补模型与预测模型分离会导致两步处理,就有可能产生次优结果,为了解决这个问题,最近的研究在一步处理中对缺失值和预测任务进行联合建模。
比如说,GRU-D考虑附近的时间统计特征来在GRU内进行插补,而LSTM-I从先前的LSTM单元状态和隐藏状态推断当前时间步的缺失值。
SGMN通过图马尔可夫过程改进了状态转换过程,但这仅限于短期缺失上下文,这些方法通过LGnet 和LSTM-M进一步增强,具有全局时间动态来处理长期缺失问题。
通过多尺度建模来更好地探索历史信息,上述模型通过关注时间方面来处理缺失值,而没有考虑交通数据中复杂的时空特征。
简单来讲,传感器节点之间强大的空间连接应该为我们提供更多信息来处理缺失值,一步处理模型通常是为单步预测而设计的,而不考虑多步设置。
GCN-M
交通数据是在复杂的城市条件下收集的,除了交通数据中的时空模式之外,研究人员还考虑复杂缺失值的场景。
他们设计了一个解决方案,以动态方式模拟局部时空特征和全球历史模式,建立预测模型时考虑了复杂的缺失值,即一步处理。
GCN-M的全局结构在研究中证明,集成了多尺度记忆网络模块、输出预测模块和时空块,每个ST块都集成了三个关键组件:时间卷积、动态图构建和动态图卷积。
输入流量观测值 M被输入到多尺度记忆网络中,以提取局部统计特征和全局历史模式,从而丰富流量嵌入。
在另外的方面,丰富的嵌入RN×F×τH,在每个ST块上的标记用于标记动态流量状态,从而通过结合静态节点嵌入和预定义图信息来生成动态图。
另一方面,学习到的动态图通过动态图卷积与时间卷积模块相结合,以捕获流量嵌入中的时间和空间依赖性。
研究人员在每个ST块的输入和输出之间采用残差连接来避免梯度消失问题,输出预测模块采用最终ST块的输出上的跳跃连接以及每个时间卷积后的隐藏状态来进行最终预测。
多尺度记忆网络
为了提取局部统计特征和全局历史模式,然后形成丰富的嵌入,研究人员采用了记忆网络的概念,该概念首次在中提出,主要应用于问答(QA)系统。
之后研究人员的记忆网络的主要思想是从历史记忆组件中学习,这些组件保存了长期多尺度模式,即最近、每日周期和每周周期依赖性。
比例范围取决于数据特征,研究人员首先提取局部时空特征作为查询内存组件的键,加权的历史长期模式将与本地统计特征配合,以消除缺失值的副作用。
动态图构建
预定义的图通常是用空间节点之间的距离或连通性来构建的,而最近的研究表明,对于那些物理上没有连接但具有相似模式的节点确实存在跨区域依赖。
学习动态图应该比学习静态图或采用预定义图表现出更好的性能,考虑到流量数据中的缺失值,研究人员没有使用原始流量观测来标记动态流量状态。
而是使用丰富的流量嵌入构建动态图在每个ST块中,它在每个时间步集成了局部和全局多尺度模式。
这允许稳健地捕获交通节点之间的空间关系,这里的主要思想是根据预定义图和流量嵌入,应用于随机初始化静态节点嵌入来构造动态邻接矩阵。
时间卷积模块
时间卷积网络(TCN)由多个扩张卷积层组成,可以提取高级时间趋势,与基于RNN的方法相比,扩张因果卷积网络能够以并行方式处理长范围序列。
最后一层的输出是捕获历史中时间动态的表示,考虑到流量数据中的时间动态,研究人员采用时间卷积模块,并考虑丰富的流量嵌入的门控机制H和Hi。
一个扩张的卷积块后面跟着一个正切双曲激活函数来输出时间特征,而另一个块后面是一个sigmoid激活函数作为门,以确定可以传递到下一个模块的信息比例。
特别是,S形门控制当前状态的哪些输入与发现时间序列中的成分结构和动态方差相关,在输入状态上应用sigmoid非线性与其他众所周知的架构不同。
后者忽略了时间序列中的组合结构特征,而经典的时间卷积模块在每个时间步t堆叠时间特征,上层比下层包含更丰富的信息。
门控机制允许通过对不同时间步上的特征进行加权来过滤较低层上的时间特征,而不考虑每个时间步上的空间节点交互。
除此之外,交通数据中的空间交互总是表现出动态性质,设想了动态空间方面的门控机制,以更好地捕获时空模式。
交通节点之间的空间交互可用于提高交通预测性能,动态空间交互导致考虑图卷积的动态版本,以在不同时间点的不同图上进行。
与之前的工作使用原始流量观测来标记动态流量状态不同,研究人员采用丰富的流量嵌入,考虑缺失值问题来生成鲁棒的动态图。
之后研究人员对时间卷积模块的输出应用动态图卷积,以进一步从空间角度选择每个时间步的特征。
结论
在这次研究中,研究人员提出了GCN-M,一种基于图卷积网络的模型,用于处理流量预测中的复杂缺失值。
他们还研究了短距离和长距离,以及部分和整个交通网络上都会出现交通量缺失的复杂场景,时空内存模块学习到的丰富的流量嵌入。
允许处理复杂的缺失值并构建动态流量图以提高模型的性能,应用联合模型优化来考虑一步处理中的缺失值和流量预测。
之后研究人员将GCN-M与专门为处理不完整流量数据,而设计的一步处理模型以及最近的先进流量预测模型进行了比较。
在两个具有12个基线的基准流量数据集上进行的大量实验表明,与先进的流量预测模型相比,GCN-M在各种复杂缺失值的场景下表现出明显的优势。
同时在完整的流量数据集上保持了可比较的性能,这些实验还提供了有或没有缺失值的流量预测模型的最新比较。
在未来的工作中,研究人员将探索上述优化以降低计算成本,从更长远的角度来看,他们可以考虑可能影响预测的噪声数据或外部事件。
同时在完整的流量数据集上保持可比较的性能,这些实验还提供了有或没有缺失值的流量预测模型的最新比较。
而在未来的工作中,他们将探索上述优化以降低计算成本,再从更长远的角度来看,他们还可以考虑可能影响预测的噪声数据或外部事件。
同时在完整的流量数据集上保持可比较的性能,这些实验还提供了有或没有缺失值的流量预测模型的最新比较。
在未来的工作中,研究人员将探索上述优化以降低计算成本,从更长远的角度来看,他们可以考虑可能影响预测的噪声数据或外部事件。