基于自编码和门控回归单元网络的轨迹预测研究

2021-07-28张浩刘大明

现代信息科技 2021年2期

张浩刘大明

摘要：针对传统的轨迹预测存在精度低和计算较复杂的问题，文章提出一种基于自动编码器（AE）和门控循环单元（GRU）模型的数据驱动方法，利用历史信息和各种轨迹属性预测轨迹位置。该方法将数据预处理层、AE层和GRU层与定制的批处理过程融合在一起。该模型在真实轨迹数据集上训练。通过与现有预测方法进行比较，结果验证所提模型性能相比于RNN，AE-RNN，LSTM和GRU有显著的提高。

关键词：轨迹预测;自动编码器;门控循环单元;数据驱动

中图分类号：TP183 文献标识码：A 文章编号：2096-4706（2021）02-0149-05

Abstract：Aiming at the problems of low precision and computational complexity in traditional trajectory prediction，a data driven method based on auto encoder（AE）and gated recurrent unit（GRU）model was proposed，which used historical information and various trajectory attributes to predict trajectory location. This method fuses the data preprocessing layer，AE layer and GRU layer with the custom batch process. The model is trained on real trajectory data sets. Compared with the existing prediction methods，the results show that the performance of the proposed model is significantly better than that of RNN，AE-RNN，LSTM and GRU.

Keywords：trajectory prediction;AE;GRU;data driven

0 引言

城市公共出行是非随机和周期性的，人们总是频繁地出现在特定的地点。同时，随着移动定位技术[1]和通信传输技术[2-4]的发展，越来越多的移动轨迹数据被记录下来，这使得分析人类在城市中的移动模式成为可能[5]。车辆轨迹预测作为移动数据管理的一个重要研究分支，在智能交通系统中发挥着重要作用[6]，在真实的交通环境中具有很高的应用价值。

目前关于车辆轨迹预测的研究主要分為两步。第一步是根据原始轨迹数据建立交通网络模型[7]。轨迹数据是时空数据，由语义相关的点组成。每个点都记录了运动物体的位置和时间信息，反映了物体在一定时空环境中的运动模式。交通网络的基础是轨迹预测模型，包括轨迹分割、地图匹配[8]等问题。该过程将轨迹数据转换为符合预测模型输入的规范化数据。交通网络模型可以在一定程度上反映运动物体的运动模式。然而，目前的研究往往只是对轨迹数据进行简单的格式化，忽略了轨迹数据所包含的深层信息，给基于位置的数据服务分析带来了困难[9]。因此，选择一种高效的交通网络建模方法会影响预测模型的效率[10]。此外，选择合适的预测模型也非常重要。模型驱动方法通过寻找轨迹数据的规律来建立数学模型，将轨迹数据归纳成公式来预测轨迹，并通过一系列的组合来拟合真实模型。然而，这些方法需要大量有代表性的数据来完善模型。同时，以这种方式建立的模型往往是单调的，不能反映运动模式的多样性。因此，预测模型需要基于真实轨迹数据建立数据驱动的预测模型。随着计算机计算能力的提高[11，12]，深度学习算法得到了迅速的发展[13-15]，在处理大量复杂数据方面表现出了显著的优势。一方面，深度学习算法可以对含有大量变量的数据集进行隐藏特征提取，提高泛化能力，使用自动编码器（auto-encoder，AE）网络提高模型训练效率。另一方面，深度学习算法在处理大型时序数据集时效率更高。门控循环单元（Gated Recurrent Unit，GRU）网络可以提取时间特征并在下一个时间对轨迹做出预测。因此，通过对模型的训练和调整，深度学习算法可以达到最优的性能，从而减少预测误差，适合解决轨迹预测问题。

在本研究中，我们提出了一种新的基于深度学习算法的数据驱动预测方法，它结合了一个AE层和一个GRU层来预测轨迹。提出了AE层的模型学习和压缩预处理数据减少复杂性，而AE层的输出作为输入数据到GRU层进行训练，提高预测效率和准确性。针对GRU模型的非均衡输入数据集，提出了一种新的定制批处理方法。在一个真实的数据集上实现了AE-GRU模型，实验结果表明，该模型优于现有的一些传统方法和深度学习方法。

1 相关理论

AE是一种神经网络，其目的是实现维数的减少和数据去噪。近年来，AE在模式识别[16]、故障诊断[17]和特征学习[18]中的应用取得了较好的效果。AE层可以学习从输入数据集中压缩原始数据并生成原始数据的表示（编码），然后将表示解压缩（解码）为与原始数据紧密匹配的东西。在本研究中，我们提出利用AE从时空矩阵中提取隐式数据特征，这些从AE层提取的特征将作为GRU层的输入数据。

给定轨迹数据T={tc1，tc2，…，tcn}，我们的第一个目标是通过对数值数据进行归一化处理并且记录非数值数据来预处理每个tci∈X。下一个目标是减少数据维数，并通过自动编码器提取隐式特征，随后是定制的批处理过程，以使特征序列达到相同长度。最后，利用定制的批数据进行基于GRU模型的预测层训练。

式中tci中的行表示轨迹数据，列表示一组有序的时间戳T={t1，t2，…，tm}。

GRU神经网络以门控循环单元代替传统的循环单元来解决RNN（Recurrent Neural Network）中容易出现的梯度问题，相比于LSTM（long-short term memory）神经网络的门控循环单元，GRU神经网络仅需要两个门控循环单元便可解决梯度问题，在一定程度上节省了内存，加快了运行速度，GRU神经网络循环单元的结构如图1所示。

其中ht-1为上一时刻隐含层状态，rt为重置门，zt为更新门，σ为sigmoid激活函数。为当前时刻隐含层的激活状态，ht为当前时刻隐含层输出状态，GRU神经网络的循环单元中有两个门，即重置门rt和更新门zt。

GRU主要通过两个门对输入信息进行更新，重置门rt主要影响上一时刻信息的保留情况，更新门zt主要对当前时刻隐含层状态进行更新。GRU循环单元最大的改进就是仅通过一个更新门zt以及1-zt就能同时实现对信息的遗忘和保留，从而提高了训练速度。

2 预测模型

本文提出了一种基于AE神经网络和GRU神经网络的轨迹预测深度学习模型。模型由三个部分组成，首先数据进行预处理，然后将预处理后的数据输入AE层，其次AE层可以提取特征并生成特征向量。第三部分以AE层生成的特征向量作为数据输入，训练GRU预测层，流程图如图2所示。

预测时间序列数据最简单的方法是直接训练预处理的矩阵X′。然而，这种方法有两个缺点。首先，经过扩充轨迹数据的原始特征很大且难以判断特征之间的相关性，训练速度会变慢，性能会显著降低。其次，当使用具有多个特征的数据预测几个参数时，模型可能会出现过拟合的问题，导致泛化能力差。而AE神经网络可以自适应地发现数据特征，并有效地表示复杂数据，提高训练速度和精度。因此，我们在预测模型中提出AE层，从预处理数据X中提取特征。AE层的具体工作机制如图3所示。

它包含一个编码器过程和一个解码器过程。这两个过程是具有相同结构的神经网络。输入和输出层具有相同的含义和相同的节点数量。编码器层可以将输入数据X的维数减少到一个隐藏层，解码器层将隐藏层解码到，其中和X之间的误差需要尽可能小。编码器过程的数学表示为：

此外，解码器过程的数学表示为：

式中（ω1，ω2，…，ωn）和（b1，b2，…，bn）为编码器编码过程中的权重和偏差，和为译码过程中的权值和偏差，n为译码层数和解码器层数。为了训练出合适的参数，目标函数如式（3）所示，其中N为批量处理的输入数据个数。最后，在接下来的过程中，将隐含层En作为GRU层的输入。

针对轨迹预测，我们针对GRU层设置了定制的批量技术。在一般的深度学习算法中，采用小批量技术对输入数据进行处理，不仅可以提高模型的训练速度，还可以通过在训练过程中引入随机性来处理过拟合问题。一般的小型批处理技术是不合适的。为此，本文提出了一种新的基于文献[19]的定制批处理技术，以适应轨迹数据特征。

每一批次的数据集由多段数据组成且每一段的数据长度皆不同，需要将其转化成统一长度的数据段，然后将定制的批处理数据作为输入数据应用到GRU层进行模型训练。GRU层有一个更新门和一个重置门，见图1。在本实验中采取正向传播的运算方法，具体结构如图4所示。更新门是LSTM模型的输入门和遗忘门的组合，用于保留以前状态的历史信息。重置门决定了多少先前的信息需要与新的输入相结合。

更新门由式（4）计算，其中σ为一个sigmoid激活函数，En，t为时间戳t的输入向量，ht-1为t-1时最后一个GRU细胞的输出向量。uz，wz，bz为线性变换的权值和偏差参数。En，t和ht-1经过线性变换后，信息通过一个更新门相加，再由一个sigmoid激活函数激活。最终，信息被压缩在0和1之间。

复位门通过式（5）计算。这个方程与更新门相似，只是线性变换的参数wr，ur，br不同。

计算出复位门的输出rt后，可由式（6）得到候选状态，其中时间戳t-1处的隐藏状态和时间戳t处的复位门信息通过Hadamard积进行处理。然后，乘积被时间戳t处的输入向量En，t加上权重w，再加上偏置的b。最后，利用tanh激活函数对-1到1之间的信息进行压缩，生成。

最后，利用更新门zt进行Hadamard积，得到历史状态ht-1和候选状态。然后将结果相加，如式（7）所示。在此基础上计算得到当前时间戳t的状态信息ht。

3 实验结果及分析

本文实验采用微软研究GeoLift项目的真实轨迹数据集。该数据由经纬度、瞬时速度、偏移角、时间等要素组成。预测算法均采用Python语言实现，在Keras深度学习框架下实现，所有实验均在CPU为Intel Core i5-8250和内存为8 GB的计算机上运行。

3.1 评价指标

本文分别通过RMSE和准确率MAPE对模型预测效果进行定量评价。

式中，yi和分别为实际值和预测值。

3.2 实验分析

实验所使用的轨迹数据集，其中70%作为训练数据、20%作为验证数据、10%作为测试数据。为了验证本文模型的效果，对實验迭代过程所产生的误差进行分析。如图5所示。

从图5中可以看出随着迭代次数的增加预测模型所产生的预测误差逐渐减小至平稳，可以验证本文所提模型的适用性。

为了验证本文所提模型的精度，在随机抽取的10，50，100条轨迹中分别与RNN、AE-RNN、LSTM、GRU进行误差比较。

如表1和表2所示，RNN的预测误差最大，AE-RNN相对于RNN添加了AE环节，从而优化了对冗余信息的选择。LSTM预测模型克服了RNN神经网络的梯度爆炸问题，在原有的预测精度上有了进一步的提升，GRU预测模型的误差由于门结构的减少使得误差相对LSTM神经网络更加小，加入AE结构的预测模型的预测误差相对GRU模型更小。从中发现本文采用的预测模型的精度显著提高。从表中可以看出随着轨迹条数的增加误差略有增大，到达一定数目后误差趋于稳定，可以体现出本文算法具有强大的泛化能力，更加适用于预测。

图6和图7是不同模型的预测曲线图，本文所提出的AE-GRU算法的预测曲线图波动幅度更小。在长序列时间数据的问题上可以克服现存算法的不足，优化后的模型预测性能明显提升，说明AE-GRU模型能够发掘轨迹的深层规律，在预测结果的稳定性和精准性上有明显的提升。

4 结论

在本文中，我们提出了一种基于AE和GRU的深度神经网络融合的轨迹预测方法。该模型的AE层可以从预处理数据中提取一些属性因子和轨迹特征。消除了数据冗余，提高了模型的泛化能力。然后利用GRU层从时间序列数据集中提取非线性和复杂的时间特征，进而预测轨迹。但是该预测模型仍存在计算耗时长的问题，仍需不断地优化模型。

参考文献：

[1] ALAHI A，GOEL K，RAMANATHAN V，et al. Social LSTM：Human Trajectory Prediction in Crowded Spaces [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition（CVPR）.Las Vegas：IEEE，2016：961-971.

[2] 尹博南，艾元，彭木根.霧无线接入网：架构、原理和挑战 [J].电信科学，2016，32（6）：20-27.

[3] PENG M G，LI Y，JIANG J M，et al. Heterogeneous cloud radio access networks：a new perspective for enhancing spectral and energy efficiencies [J].IEEE Wireless Communications，2014，21（6）：126-135.

[4] ZHANG Z F，ZHANG P R，LIU D，et al. SRSM-Based Adaptive Relay Selection for D2D Communications [J]. IEEE Internet of Things Journal，2017，5（4）：2323-2332.

[5] ZHANG F S，JIN B H，WANG Z Y，et al. On Geocasting over Urban Bus-Based Networks by Mining Trajectories [J].IEEE Transactions on Intelligent Transportation Systems，2016，17（6）：1734–1747.

[6] SCHWARTING W，ALONSO-MORA J，RUS D. Planning and Decision-Making for Autonomous Vehicles [J] Annual Review of Control，Robotics，and Autonomous Systems，2018（1）：187–210.

[7] ZHU L，XU C Q，GUAN J F，et al. Finding top-k similar users based on Trajectory-Pattern model for personalized service recommendation [C]//2016 IEEE International Conference on Communications Workshops（ICC）.Kuala Lumpur：IEEE，2016：553–558.

[8] ZHENG Y. Trajectory data mining：an overview [J].ACM Transactions on Intelligent Systems and Technology，2015，6（3）：1-41.

[9] HOUENOU A，BONNIFAIT P，CHERFAOUI V，et al. Vehicle trajectory prediction based on motion model and maneuver recognition [C]//2013 IEEE/RSJ International Conference on Intelligent Robots and Systems.Tokyo：IEEE，2013：4363–4369.

[10] GIACOMETTI A，SOULET A. Frequent Pattern Outlier Detection Without Exhaustive Mining [C]//Advances in Knowledge Discovery and Data Mining.Berlin：Springer-Verlag，2016：196–207.

[11] LI Y，LIU J，CAO B，et al. Joint Optimization of Radio and Virtual Machine Resources With Uncertain User Demands in Mobile Cloud Computing [J].IEEE Transactions on Multimedia，2018，20（9）：2427–2438.

[12] PENG M G，ZHANG K C，JIANG J M，et al. Energy-Efficient Resource Assignment and Power Allocation in Heterogeneous Cloud Radio Access Networks [J].IEEE Transactions on Vehicular Technology，2015，64（11）：5275–5287.

[13] CAO B，XIA S C，HAN J W，et al. A Distributed Game Methodology for Crowdsensing in Uncertain Wireless Scenario [J].IEEE Transactions on Mobile Computing.2020，19（1）：15–28.

[14] CAO B，ZHANG L，LI Y，et al. Intelligent Offloading in Multi-Access Edge Computing：A State-of-the-Art Review and Framework [J].IEEE Communications Magazine.2019，57（3）：56–62.

[15] ZHANG Z F，ZOU Y，GAN C Q. Textual sentiment analysis via three different attention convolutional neural networks and cross-modality consistent regression [J].Neurocomputing.2018，275：1407–1415.

[16] LIU T，LI Z R，YU C X，et al. NIRS feature extraction based on deep auto-encoder neural network [J].Infrared Physics & Technology，2017，87：：124-128.

[17] SHAO H D，JIANG H K，ZHAO H W，et al. A novel deep autoencoder feature learning method for rotating machinery fault diagnosis [J].Mechanical Systems and Signal Processing，2017，95：187-204.

[18] MENG Q X，CATCHPOOLE D，SKILLICOM D，et al. Relational autoencoder for feature extraction [C]//2017 International Joint Conference on Neural Networks（IJCNN）.Anchorage：IEEE，2017：364–371.

[19] HIDASI B，KARATZOGLOU A，BALTRUNAS L，et al. Session-based Recommendations with Recurrent Neural Networks [J/OL].arXiv：1511.06939 [cs.LG].（2016-03-29）.https：//arxiv.org/abs/1511.06939.

作者簡介：张浩（1996—），男，汉族，安徽蚌埠人，硕士研究生在读，研究方向：轨迹预测，物联网技术;刘大明（1971—），男，汉族，上海人，副教授，博士，研究方向：物联网技术，嵌入式系统与设计，智能工业机器人等。