随机人体轨迹预测的非概率抽样网络

170 浏览量更新于2023-10-26 收藏 1.05MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

6477∼随机人体轨迹预测的非概率抽样网络Inhwan Bae，Jin-Hwi Park and Hae-GonJeon*韩国GIST AI研究生院{inhwanjin，jinhwipark} @ gm.gist.ac.kr，haegonj@gist.ac.kr摘要捕获多模态性质对于随机行人轨迹预测是必不可少的，以推断未来轨迹的有限集合推断出的轨迹基于观察路径和潜在决策的潜在向量在推理步骤中的行人。然而，由于对潜在向量的随机采样，随机方法对于相同的数据和参数设置在本文中，我们分析了这个问题，重建和比较概率分布预测样本和社会可接受的路径，分别。通过这一分析，我们观察到，所有的随机模型的推理偏向于随机抽样，并未能产生一组现实的路径从有限的样本。除非有无限数量的样本，否则无法解决这个问题，而这在实践中是不可行的本文介绍了准蒙特卡罗（Quasi-Monte Carlo，QMC）方法，它保证了在抽样空间上的均匀覆盖，可以替代传统的随机抽样方法。在有限样本数相同的情况下，QMC改进了所有的多模态预测结果。我们通过将可学习的采样网络整合到现有的网络中进行轨迹预测，向前迈出了额外的一步。为此，我们提出了非概率采样网络（NPSN），一个非常小的网络（5K参数），使用行人的过去路径和他们的社会互动产生有目的的样本序列。大量的实验表明，NPSN可以显着提高预测精度（高达60%）和可靠性的公共行人轨迹预测基准。代码可在https://github.com/inhwanbae/NPSN上公开获取。1. 介绍预测行人轨迹的目标是根据先前的步骤推断社会可接受的路径，同时考虑其他移动代理的社会规范。许多早期关于人类轨迹预测的工作[15，39，44，59]都是基于确定性方法，*通讯作者图1.随机轨迹预测的概率分布和从每种采样方法中选择的路径虽然来自随机抽样的轨迹是有偏差的，因为它们没有考虑所有可能分布的空间，但我们的NPSN有目的地生成准确的路线，转向SHOP，即使概率很低。最有可能是单一路径。[15]中最早的作品之一使用行人之间的吸引力和排斥力来建模社会力量。从那时起，运动时间序列和智能体交互已被应用到轨迹预测。随着递归神经网络（RNN）的发展，Social-LSTM [1]和Social-Attention [56]等开创性工作已经采用了空间邻居之间的社会池和注意力机制。这些方法已经成为空间关系聚合[13，17，40，48，50，53]和时间关系聚合等领域的基线模型。未来预测[23，35，36，52，63，64]。最近，推断潜在未来轨迹分布的生成模型可能会激发一个主要的范式转变，远离单一的最佳预测方法[6，10，13，17，18，22，23，26，27，30生成模型表示所有可能的路径，使得行人可以直行，在十字路口左转/右转为了有效地建立这种多模态，将随机过程引入轨迹预测[13]，其对每个时间帧中行人运动的推断不确定性进行随机轨迹预测模型从生成随机假设开始。由于随机抽样的不确定性，假设的质量取决于样本的数量理想情况下，无限数量的假设将能够表征行人的所有可能的运动，但这是不可行的。在实践中-6478∼图2.随机人类轨迹预测和我们的NPSN方法的说明。红色框表示潜在向量。Tice，使用Monte Carlo（MC）方法随机抽样固定数量的多个轨迹，并且所有现有的随机模型都遵循这种随机抽样策略。然而，样本的数量通常太少，无法代表社会可接受的行人轨迹，因为它们偏向于随机采样，如图所示。1.一、在本文中，我们重新审视了采用随机过程进行多模态预测的最新作品（图2-（a）（c））。我们证明了生成的轨迹分布中的所有期望值都与生成的广告网络（GAN）[6，13，17]，条件变量，常规自动编码器（CVAE）[32，35，48]和高斯方法[40，50]都有偏差。之后，我们引入了一个准蒙特卡罗（QMC）抽样方法，有效地解决了这个问题，使用低差异序列，而不是随机抽样。最后，我们用一种可学习的方法推进随机抽样：非概率抽样网络（NPSN），一个非常小的网络，使用图中的观察和代理交互生成有目的的2-（d）. 在不以任何方式对现有模型进行结构性这是通过用我们的NPSN替换一行关于随机采样有趣的是，使用我们的NPSN作为辅助模块的现有模型之一在所有评估指标中实现了最佳性能与以往的方法不同，该方法侧重于采样方法，以产生一组随机的潜在向量。据我们所知，我们的工作是第一次尝试采用QMC抽样，并提出了一种可学习的方法，有目的的抽样在轨迹预测图。1.一、2. 相关作品2.1. 随机轨迹预测基于高斯分布的卷积神经网络（CNN）方法提高了行人轨迹预测的效率。Social-LSTM [1]是该领域的一种pi- oneering模型，它预测了由观察到的行人轨迹的五个参数组成的二元高斯分布。然而，它有一个局限性，当推断单路径时，因为它在推断时间内仅从分布中选择最佳的一个样本。后续工作[40，50，51，56]通过基于预测分布对多个下一个坐标进行采样来预测多个路径作为另一种方法，引入生成模型来预测现实的未来路径。Social-GAN [13]首先使用递归推断未来轨迹的生成框架GAN的好处是它根据潜在向量生成各种输出。因此，在行人轨迹预测中考虑了人与人之间的、社会可接受的和多模态的人类行为。这样的研究流鼓励定义一种多样性损失，该损失计算多个样本中的最佳预测，以生成不同的样本[6、10、17、22、47、52]。类似地，已经有人尝试使用CVAE框架来预测不同的未来世代。EQUIPRE [23]使用一个潜在变量来解释未来路径的模糊性，并学习一个采样模型，以根据给定的观察结果产生未来轨迹的多个假设。这种方法提供了一组多样的合理预测，而不会损失多样性，并在许多基于CVAE的模型中分享目标的灵感[18，32，35，48，61]。所有这些方法都包括随机抽样过程，并且如上所述，由于样本数量固定，因此对偏倚敏感。此外，目前最先进的CVAE框架模型优于基于高斯分布的方法[40，50]。在这项研究中，我们分析了这些现象与随机轨迹预测的偏差，并表明，高斯分布为基础的方法实现了显着的性能改善，通过最大限度地减少偏差，甚至比CVAE为基础的方法。最后，我们提到最近的一种确定性方法[64]，它预测多个轨迹，这超出了本文的范围。2.2. 学习潜变量有些作品占潜在空间的转换，通过使用先验轨迹信息。例如，PECNet [35]在潜在空间中使用截断技巧来调整保真度和样本种类之间的权衡。在他们的学习方法中，IDL [28]和Tra- jectron++ [48]都在推理步骤中预测潜在分布的平均值和标准差。AgentFormer [62]不是直接预测分布参数，而是使用高斯噪声的线性变换来产生潜在向量。由于潜向量的随机采样，在目前的工作中，我们的目标是减少偏差使用一组采样的潜在向量的2.3. 基于图的方法开创性的工作已经引入了社会汇集[1，13，52]和社会关注机制[27，56，63]的概念，以捕捉行人之间的社会互动，6479≤ ≤LL∫L不L不不∫−L·LN，sN我N3.1.问题定义我们制定行人轨迹预测任务作为一个多智能体的未来轨迹生成问题的condi-他们过去的轨迹。具体而言，在观察时间帧1t Tobs期间，场景中存在L个行人观察到的轨迹序列表示为：表示为X 1：Tobs={Xt|t∈[1，…， Tob s]}，其中n∈[1，...，L]，图3.真实似然轨迹分布的概率图和N= 20的生成分布的示例样品Y-1：在PECNet上使用MC和QMC方法进行测试[35]。其中Xt是每个行人L在时间帧t的空间坐标。对于给定的观测序列，轨迹预测的目标是学习潜在的分布，生成N个合理的未来序列Y= 1：Tp re d={Y= t|t∈场景最近，基于图神经网络（GNN）的AP-L[1，…， T pred]，n ∈ [1，...，对于所有L个行人。l，n已经引入了方法[2，17，22，27，30，40，50]来用基于图的策略对代理-代理交互进行建模。在基于GNN的作品中，行人被视为图的节点，他们的社会关系表示为边权重。Social-STGCNN [40]提出了一种基于图卷积网络（GCN）[21]的轨迹预测，它聚合了行人之间距离的空间信息图注意力网络（GAT）[55]隐含地为行人图上具有高社会亲和力的边缘分配更多权重[17，22，50，53，61]。Multiverse [30]和SimAug [29]利用二维网格上的GAT来推断可行的轨迹。与以前的作品不同，GAT在编码过程中使用，我们将GAT框架应用于潜在空间的采样过程，使解码器更准确地预测未来的路径。2.4. 蒙特卡罗抽样法（准）蒙特卡罗是一种使用随机数进行数值实验利用随机数允许人们近似积分，3.2. 随机轨迹预测是有偏的。所生成的轨迹Y1 ：Tpred来自于可能轨迹的分布，这些可能轨迹是由基于社会力的步行者的运动构造的（图3）。真值是用一个合理的轨迹分布计算的期望值，gen 的计算公式为 Y= 1 ： Tpred其中 N 是独立同分布（IID）随机样本，即，如果使用不同的样本来生成轨迹，则该术语是随机的期望值gen是积分的MonteCarlo估计，即相关期望。假设我们要计算的期望轨迹分布为I（τ）=[0，1]sτ（x）q（x）dx，它是随机变量x在s维单位立方体[0，1]s上的密度为q时τ（x）的期望值。然后，蒙特生成的轨迹分布的Carlo估计，N个样品可按如下公式配制：I（τ）=I（τ）=1τ（x），（1）i=1但这是非常容易出错的。误差直接取决于从概率分布的随机抽样方法Pr（limn→∞ I（τ）=I（τ））=1，（2）QMC采样是用准随机序列开发的，称为低差异序列[41]，并以确定性方式生成。它被广泛用于许多计算机视觉任务，例如深度完成[57]，3D重建[11，58]，运动跟踪[66]和神经架构搜索[8，9]。我们首先应用QMC采样来保证均匀覆盖的采样空间的步行轨迹预测。注意，如果差异趋于零，则序列是均匀分布的，因为样本的数量趋于无穷大。3. 生成的轨迹有偏差在本节中，我们从第二节中行人轨迹预测第3.1条然后，我们从理论上证明，从随机轨迹预测模型生成的轨迹偏向于随机采样，在秒。3.2.我们还介绍了一种方法，以减轻与随机预测的低差异序列的偏见，其中Pr（）表示概率。根据强大数定律[12]，当样本数N无限增加时，MC估计收敛于I（τ）。现在，我们假设τ（x）具有有限方差K（τ），并将误差α定义如下：α=I<$N，s（τ）−I（τ），（3）E[α]= 0，var（α）=K（τ），（4）N哪里 E是一个预期且K（t）为（τ（x）I（τ））2q（x）dx。注意，K（τ）是非线性的，并且取决于被积分的函数。算法的目标是指定导致积分的较低方差估计的过程现在考虑生成元F的一个函数，它在蒙特卡罗积分I（τ）中是足够光滑的。我们应用F（I（τ）+α）的泰勒级数展开如下：F（I<$N，s（τ））=F（I（τ）+α）（5）F′′（I（τ））3在Sec。三点三<$F（I（τ））+αF（I（τ））+α+O（α）。26480N不→∞√因此，F（IN，s（τ））的期望值可以如下公式E[F（I）M1（1）A（1）A（2）A（3）A（）、（6）N，sN N2其中M = K（τ）（F ′′（I（τ））/2），M是偏置。由于gen项是用MC积分估计的，估计值必须有M+ O（1）的偏差。注意，N N2生成的轨迹消失N然而，实际上利用所有无限可能的路径是不可行的。由于M取决于生成器，因此所生成的轨迹根据生成的样本的数量以及生成器而不同地偏置，这在第2节中得到验证五点二。3.3. 弹道预测的拟蒙特卡罗方法QMC方法使用低差异序列，包括Halton序列[14]和Sobol序列[19]。受[43]的启发，我们选择了一个Sobol序列，它不仅表现出比Halton序列更好的性能，而且比MC方法快5倍，即使错误率更低。从数值分析的观点出发，文[42]中的一个不等式证明了低偏差序列保证了Eq.（2）积分误差小，如下：|V（τ）D N|≦V(τ)DN∗,(7)其中V（τ）是有界变差函数τ的全变差，DN 是样本数N的序列的离散度。这个不等式表明，对于有限变差的函数，确定性的低偏差序列在数学界，已经证明Sobol序列的收敛速度接近O（（log N）s/N）;对于随机序列，它是O（log（logN）/N）[42，43]。为了更快的收敛， s 需要小而 N 需要大（例如，N>2s）。因此，对于相同数量的点（N = 20），低差异序列具有较低的误差，如表1所示。1.一、作为示例，由于xi是来自用于MC估计的均匀分布的单元盒的IID样本对于QMC，由于xi来自一个确定性的拟随机序列，其点样本是独立的，所以它们可以是均匀间隔的。这通过连续构造更精细的均匀分区来保证行人轨迹预测的合适分布。图4显示二维空间中我们观察空的空间区域，其中没有从均匀分布生成的点，这产生了向特定目的地倾斜的结果然而，Sobol序列产生均匀分布的点，以强制预测结果接近社会可接受的路径。图4. (Top)：1，000个点的二维散点图，包括MC、QMC和NPSN。星号表示GT目的地在采样空间中的坐标。（下）：每种方法的1,000个点的前20个样本的随机轨迹预测结果。不幸的是，低差异序列，如Sobol序列是确定性地产生的，并使轨迹预测棘手时，表示行人的运动与各种社会互动的不确定性。通过对序列的基数进行置乱来向Sobol序列中添加随机性所得序列保留了QMC方法的优点，即使具有相同的期望值。因此，我们利用加扰的Sobol序列来生成行人轨迹，以说明人类行为的可行性，多样性和随机性。4. 非概率抽样网络在本节中，我们提出了NPSN，它扩展了基于观察轨迹的行人轨迹预测的采样技术与以前的方法不同，这些方法以随机方式对N条路径进行采样，我们构建了一个模型，该模型使用图1所示的非概率采样技术有效地选择目标样本。2-（d）.4.1. 非概率抽样在多模态轨迹预测与随机抽样不同，有目的抽样是最常见的非概率抽样技术之一[4]，它依赖于专家的主观判断来选择最有效的样本，而不是随机选择。在深入的定性研究中研究复杂现象时，这种方法是有利的[38]。由于大多数人使用最短路径步行到目的地，因此公共数据集中的大部分标记属性[25，44]都是直线路径。生成属性模型学习直线路径属性的社会亲和度特征的概率分布然而，由于人类路径的多模态性质，模型必须生成尽可能多的多样性和可行的路径，只使用固定数量的样本。作为一种可能的解决方案，我们可以有目的地包括各种各样的样本，左转/右转和绕过障碍物。有目的地6481LL{1}|}E{|}V{|}G V E√√−DistLl，nn∈[1，…，N]L盘LNj∈[1，…N]l，jΣΣ采样，最大变化是有益的多模态轨迹预测，当检查不同的范围of pedestrian行人's移动. 我们把这个过程变成一个学习-L=1μmin||Y1 ：Tp red−Y1：Tp red||.（八）l=1能够的方法，旨在生成N个异构的轨迹样本与过去的轨迹的先验知识。4.2. NPSN架构我们提出了NPSN，它用一种可学习的方法代替了现有模型的随机采样过程。NPSN作为有目的的抽样工作，它依赖于然而，我们观察到所有N个样本点都是一些-时间密切位于其地面附近的真理作为学习进展。这是有目的抽样中的一个常见问题，因为某些样本可能由于数据不平衡而产生过偏，即：轨迹的大部分沿着走道的一个方向出于这个原因，我们引入了一种新的差异损失，以保持N个样本点具有低差异，如下所示：当在1中选择样本时，行人的过去轨迹LN分布因此，当预测一个可行的未来时，L=− logmin||S- S型||.（九）轨迹，过去的轨迹可以用于采样过程，同时还嵌入信息特征作为指导。与现有的作品[28，35，48，62]不同，这些作品通过限制分布来限制采样空间，我们以可学习的方式设计所有过程。行人图表示。NPSN首先使用GAT捕获社会关系以生成社会可接受的样本。对于输入轨迹X1：Tobs，定义一个行人图=（，）为一组行人节点=v l l[1，…，L] 以及它们的关系边=ei ， ji ， j[1 ， . ， L] 。利用节点特征H=h11[1，...，L]，社交关系的学习特征图在场景中的不同行人节点之间共享。我们利用注意力机制对社会互动进行建模，其有效性在以前的作品中得到了证明[17，50]。GAT允许NPSN通过向它们的边缘ei，j分配不同的重要性来聚合邻居的特征。这里，使用两个节点特征（hi，hj）之间的关注分数来计算重要性值。有目的抽样。通过交互感知节点fea-我们预测每个行人的N个样本特别是，我们使用三个MLP层后的GAT层的NPSN。NPSN预测模型通过学习更多关于感兴趣样本的先验信息，生成更好的样本。每个轨迹预测模型附加地接收s维随机本征向量以及观察到的轨迹。因此，NPSN必须预测一组输出S1=[S1，1，...，Sl，N]。输出通过预测模型为每个行人生成N个最终轨迹。为了时间一致性，我们对所有预测时间帧[1，.，每个行人节点的T pred]。对所有行人节点重复此过程， NPSN 的输出形状为 S =RL×s×N。损失函数为了用我们的NPSN优化轨迹预测模型，我们使用两个损失函数来生成分布良好的有目的样本。首先，赢家通吃过程[46]生成最接近其地面实况的路径，被训练以回归行人的准确位置。类似于[13]，我们测量N个预测路径和地面真实值之间的L2距离，并仅使用一个误差最小的路径进行训练：l=1i=1j i差异损失的目标是最大化N个样本的最近邻居之间的距离。如果距离更近，则损失施加更高的惩罚，以确保它们均匀覆盖采样空间。最终的损失函数是距离损失和差异损失的线性组合L=Ldist+λLdisc。我们设置λ=1e−2来平衡两项的规模4.3. 实现细节从一个分布到另一个分布的转换。虽然大多数人类轨迹预测模型使用正态分布，但Sobol序列和我们的NPSN旨在产生均匀分布。我们通过在均匀分布和正态分布之间的转换来弥合这一差距。有一些代表性的方法包括Ziggurat方法[37]，逆累积分布函数（ICDF）和Box-Muller变换[5]。在这项工作中，我们利用Box-Muller变换，该变换是可重构的，并且能够在具有最低QMC错误的GPU上高效执行，如[16，67]所示Box-muller变换的公式如下：Zodd=−2ln（Ueven）cos（2π Uodd），（10）Zeven=−2ln（Ueven）sin（2π Uodd），其中U是来自均匀分布的独立样本集，Z是来自标准正态分布的独立随机变量。培训程序。我们的NPSN嵌入到最先进的行人轨迹预测模型中[6，13，17，32，35，40，48，50]，只需替换其随机采样部分。模型的参数使用作者提供的权重进行初始化，除了两个模型[17，35]使用从作者我们的NPSN在s=2和N=20时只有5，128个可学习的参数。我们使用AdamW优化器[34]使用NPSN训练预测模型，批量大小为128，学习率为128 epochs。我们降低学习率，每32个epoch增益0.5在配备NVIDIA 2080TI GPU的机器上，训练时间约为3小时。l我6482社会-STGCNN [40]（s=2）SGCN [50]（s=2）MC（基线）ADE ↓FDE↓ TCQMCC↑ ADE↓ FDE↓ TCC↑增益↑NPSNADE ↓FDE ↓TCC↑增益↑MC（基线）ADE ↓FDE↓ TCQMCC ↑ADE ↓FDE ↓TCC↑NPSN增益↑ADE↓ FDE↓ TCC↑增益↑ETH0.6501.0970的情况。5100.6111.0250.579百分之六点五0.4430.6520.56540.6%0.5670.9970的情况。5450.4950.8100.596百分之十八点八0.3570.588零点六二四41.0%酒店0.4960.8580的情况。2700.3420.5170.289个单位39.8%0.2130.3420.298百分之六十点二0.3080.5330的情况。2950.2120.309零点三一四42.0%0.1590.2530.355百分之五十二点六Univ0.4410.7980的情况。6370.3640.6280.725百分之二十一点三0.2780.4430.762百分之四十四点五0.3740.6680的情况。6890.3100.555零点七三七百分之十六点九0.2290.394零点八二41.0%ZARA10.3410.5320的情况。7100.3150.5260.775百分之一点一0.2480.4300.802百分之十九点一0.2850.5080的情况。7460.2450.446零点八零三12.1%0.1820.318零点八五四百分之三十七点三ZARA20.3050.4820的情况。3940.2880.497零点四六七-3.2%0.2170.3790.439百分之二十一点四0.2250.4220的情况。4910.1930.3590.50314.9%0.1380.2450.73541.8%AVG0.4470.7530的情况。5040.3840.6390.567百分之十五点二0.2800.4490.573百分之三十七点二0.3520.6260的情况。5530.2910.4960.591百分之二十点七0.2130.3600.678百分之四十二点五SDD20.7633.180的情况。47119.2131.810.4984.1%11.8018.430.551百分之四十四点五25.0041.520的情况。57021.9738.04零点六零四百分之八点四17.1228.97零点六五百分之三十点二GCS14.7223.870的情况。69813.4222.18零点七二四百分之七点一9.7215.690.760百分之三十四点三11.1820.650的情况。77710.1018.690.795九点五厘7.6613.410.789百分之三十五点一社会-GAN [13]（s=8）STGAT [17]（s=16）MC（基线）ADE ↓FDE↓ TCQMCC↑ ADE↓ FDE↓ TCC↑增益↑NPSNADE ↓FDE ↓TCC↑增益↑MC（基线）ADE ↓FDE↓ TCQMCC ↑ADE ↓FDE ↓TCC↑NPSN增益↑ADE↓ FDE↓ TCC↑增益↑ETH0.7671.3970的情况。5920.7601.3790.596百分之一点三0.7181.2640.539九点五厘0.6791.2030的情况。5760.6681.1750.576百分之二点四0.6121.0200.602百分之十五点二酒店0.4340.8760的情况。3220.4310.8700.323百分之零点七0.3850.7200.311百分之十七点八0.3460.6610的情况。3380.3420.6630.351- 百分之零点三0.3080.5660.301百分之十四点四Univ0.7451.4970的情况。6860.7441.4940.690百分之零点二0.7111.4270.715百分之四点七0.5451.1640的情况。7590.5411.1520.763百分之一点零0.5351.1330.795百分之二点六ZARA10.3460.6930的情况。8010.3430.6860.805百分之零点九0.3440.6830.798百分之一点四0.3450.6870的情况。7910.3430.6830.818百分之零点六0.3380.6780.822百分之一点四ZARA20.3560.7210的情况。4740.3540.7160.476百分之零点七0.3450.6960.491百分之三点五0.3040.6200的情况。5080.2880.5880.484百分之五点二0.3040.6210.557- 百分之零点一AVG0.5301.0370的情况。5750.5261.0290.578百分之零点八0.5010.9580.571百分之七点六0.4440.8670的情况。5940.4360.8520.598百分之一点七0.4190.8040.616百分之七点三SDD13.5824.590的情况。59813.4124.240.601百分之一点四13.0323.040.6306.3%14.8528.170的情况。59014.8228.120.594百分之零点二13.6725.240.613百分之十点四GCS15.8532.570的情况。78315.8032.440.785百分之零点四15.7832.170.798百分之一点二15.5731.820的情况。79815.5531.800.798百分之零点一15.7132.120.798负百分之零点九Trajectron++[48]（s=25）PECNet [35]（s=16）MC（基线）QMCNPSNMC（基线）QMCNPSNADE↓FDE↓TCC↑ADE↓FDE↓TCC ↑增益↑ADE↓FDE↓TCC↑增益↑ADE↓FDE↓TCC↑ADE↓FDE↓TCC↑增益↑ADE↓FDE↓TCC↑增益↑表1. MC、QMC和NPSN w.r.t.的比较结果STGCNN [40]，SGCN [50]，SGAN [13]，STGAT [17]，Trajectron++ [48]和PECNet[35]，N= 20。在ETH [44]，UCY [25]，SDD [45]和GCS [60]数据集上评估模型。(Gain：业绩改善基线模型上的FDE，ADE和FDE的单位：米，粗体：最佳，下划线：次佳）5. 实验在本节中，我们在公共基准数据集上进行了全面的实验，以验证采样策略如何有助于行人轨迹预测。我们首先简要介绍我们的实验装置（第二节）。5.1），然后提供与各种基线和最先进模型的比较结果（第5.1节）。5.2）。此外，我们进行了广泛的消融研究，以证明我们方法的每个组成部分的效果（第二节）。5.3）。5.1. 实验装置数据集。我们评估了QMC方法和我们的NPSN在各种基准数据集上的有效性[25，44，45，60]超过最先进的方法。 ETH [44] 和 UCY 数据集 [25] 分别包括 ETH 和HOTEL，以及UNIV，ZARA 1和ZARA 2场景。这两个数据集都包括具有复杂社会互动的行人的各种运动。斯坦福无人机数据集（SDD）[45]包含了具有各种对象类型的隐蔽场景（例如：pedes-trian，biker，skater，andcart），而Grand Central Sta- tion（GCS）[60]数据集由行人行走的高度拥挤场景组成。我们观察3.2秒的轨迹ETH0.4320.8570.5670.4250.8410.572百分之二点零0.3970.7610.576百分之十一点二0.6101.0730.5960.6011.0360.602百分之三点五0.5500.8820.618百分之十七点八酒店0.1210.1910.3500.1190.1860.352二点八厘0.1160.1760.357百分之七点九0.2220.3900.3350.2140.3690.336百分之五点三0.1880.2880.359百分之二十六点一Univ0.2200.4280.7890.2160.4200.790百分之一点八0.2150.4140.787百分之三点三0.3350.5580.7520.3260.5330.759百分之四点五0.2890.4390.765百分之二十一点四6483（ Tobs=8 ），然后预测接下来 4.8 秒的未来路径（Tpred=12）。我们遵循留一交叉验证评估策略，这是许多作品中使用的标准评估协议[13，17，35，40，48，50]。评价指标。我们使用三个指标来衡量轨迹预测模型的性能：1）平均-年龄位移误差（ADE）-预测和地面实况轨迹之间的平均欧几里得预测和地面实况最终目的地; 3）时间相关系数（TCC）[54] -预测和地面实况轨迹之间的运动模式的皮尔逊相关系数这些指标评估N=20个轨迹输出中最好的一个此外，为了减少随机模型预测结果的方差，我们重复评估100次，然后对每个指标进行平均基线。我们使用代表性的随机行人轨迹预测模型评估QMC和NPSN采样方法：1）基于高斯分布的模型-Social- STGCNN [40]，SGCN [50]; 2）基于GAN的模型-Social-GAN [13] ， STGAT [17] ， CaCl_2-STGAT [6]; 3 ）CVAE-基于模型 - Trajectron++ [48] 、 PECNet [35] 和 NCE-Trajectron++ [32]。为了验证QMC和NPSN的有效性，我们用我们的QMC和NPSN抽样方法代替了作者提供的代码中的随机抽样部分5.2. QMC和NPSN方法MC和QMC的比较。我们比较MC与QMC方法，将它们纳入基线模型的抽样部分。如Tab.所示。如图1和图5所示，QMC方法在所有评估指标上都明显优于MC在图5中，我们报告了错误6484图5. MC和QMC上每个随机模型测量的平均ADE、FDE和TCC的箱形（a）STGCNN [40]，（b）SGCN [50]，（c）SGAN [13]，（d）STGAT [17]，（e）Trajectron++[48]，（3）（4）（5）（6）（7）（8）（9）（10）（11）（12）（13）（15）（16）（17）（19）（10）（15）（19）（10）图6.在SGCN中使用MC、QMC和NPSN对采样轨迹进行概率分布和最佳预测的可视化[50]。测试阶段基线模型的分布。QMC方法通过缓解第二节中提到的偏差问题，实现了一致的较低误差和变化。3.2.我们还观察到，基于高斯的模型显示出比基于GAN和CVAE的模型更大的性能增益。QMC方法带来的性能增益有两个原因：1）基于高斯模型的采样空间维数（s=2）相对于其他模型（即，高斯模型）要小得多。s=8、16或25）。根据[24]，对于大维度s和少量样本N，来自低差异生成器的采样结果可能在随机生成的样本上不够好。因此，基于高斯的模型产生有前途的结果相比，具有较大的采样尺寸。2)性能的提高取决于网络中的层数（越浅越好）：基于CVAE和GAN的模型由多层组成。相比之下，基于高斯的模型只有一个层，该层充当预测轨迹坐标和最终坐标之间的线性变换。具体地说，在变换中，采样的独立 2D 点与Cholesky分解的协方差矩阵相乘，并通过均值矩阵移位。在这里，基于高斯的模型的浅层直接反映了QMC采样方法的优点，而不是在推理步骤中几乎不受随机特征向量影响的深层NPSN的评价我们将NPSN应用于所有三种类型的随机轨迹预测模型。如Tab.所示1、根据类型有不同的性能增益特别是，高斯分布方法（社会-表2.NPSN与其他最先进的随机模型（ADE/FDE，单位：米）的比较评价结果直接参考[6，33，48]。粗体：最好，下划线：第二好。STGCNN [40]，SGCN [50]）显示出最高的性能改善（高达60%），这可以通过s=2时QMC方法的优势进行分析。目前，高斯分布方法由于易受采样偏差的影响，其性能一直被低估我们的NPSN最大限度地提高了能力的高斯分布的方法，通过一个有目的的采样技术。在基于 CVAE 的方法中， PECNet [35] 显示出比Trajectron++ [48]更大的性能改进（高达41%）。由于PECNet通过潜在向量直接预测一组目的地，因此NPSN与其推理步骤兼容。另一方面，NPSN似乎对Trajectron++的推理步骤产生较少的益处，因为它递归地预测下一步骤，并且其样本维度相对较大（s=25）。具有多样性损失的生成模型，Social-GAN和STGAT，显示相对较小的性能改进，相比其他。对于某些数据集，当使用我们的NPSN时，STGAT的FDE值低于MC和QMC这似乎表明，由于潜在空间的常见纠缠问题，NPSN无法学习接近地面真实轨迹的样本[7，20]。定性结果。图6显示了NPSN和其他方法的预测之间存在差异的几种情况。由于NPSN采用观测轨迹以及QMC方法的低差异特性，因此与其他方法相比，NPSN的预测路径更接近社会可接受的路径。正如我们在图中所描述的4. QMC方法比MC方法生成更真实的轨迹分布。然而，由于数据集的限制，基线网络的生成轨迹偏向于直线路径，而NPSN采样方法通过在潜在空间中选择接近地面真实值的点来解决问题结果表明，基于NPSN的人体运动轨迹模型不仅能够在有限采样路径下生成分布均匀的样本，而且能够代表人体运动的可行范围ETH酒店UnivZARA1ZARA2AVG[13]第十三话0.87/1.620.67/1.370.76/1.520.35/0.680.42/0.840.61/1.21STGAT [17]0.65/1.120.35/0.660.52/1.100.34/0.690.29/0.600.43/0.83[40]第四十话0.64/1.110.49/0.850.44/0.790.34/0.530.30/0.480.44/0.75PECNet [35]0.61/1.070.22/0.390.34/0.560.25/0.450.19/0.330.32/0.56[48]第四十八话0.43/0.860.12/0.190.22/0.430.17/0.320.12/0.250.21/0.41SGCN [50]0.57/1.000.31/0.530.37/0.670.29/0.510.22/0.420.35/0.63[6]第六章0.60/0.980.30/0.540.52/1.100.32/0.640.28/0.580.40/0.77[33]第三十三话0.39/0.790.11/0.180.20/0.440.15/0.330.11/0.260.19/0.40NPSN-SGAN0.72/1.260.38/0.720.71/1.430.34/0.680.34/0.700.50/0.96NPSN-STGAT0.61/1.020.31/0.570.53/1.130.34/0.680.30/0.620.42/0.80NPSN-STGCNN0.44/0.650.21/0.340.28/0.440.25/0.430.22/0.380.28/0.45NPSN-PECNet0.55/0.880.19/0.290.29/0.440.21/0.330.16/0.250.28/0.44NPSN-轨迹++0.40/0.760.12/0.180.21/0.410.17/0.310.12/0.240.20/0.38NPSN-SGCN0.36/0.590.16/0.250.23/0.390.18/0.320.14/0.250.21/0.36NPSN-因果-STGAT0.56/0.900.25/0.400.51/1.090.32/0.650.27/0.560.38/0.72NPSN-NCE-Trajectron++0.36/0.680.11/0.180.18/0.390.14/0.290.11/0.230.18/0.356485ETH酒店UnivZARA1ZARA2AVG基线0.57 / 1.000.31/0.530.37/0.670.29/0.510.22/0.420.35/0.63不带L直径0.39 / 0.610.23/0.450.26/0.470.20/0.360.16/0.310.25/0.44不带L盘0.38/ 0.610.16/0.250.23/0.390.18/0.320.14/0.250.22/0.37不含GAT0.36/0.570.17/0.280.23/0.390.18/0.320.14/0.260.22/0.37+NPSN0.36/0.590.16/0.250.23/0.390.18/0.320.14/0.250.21/

下载后可阅读完整内容，剩余1页未读，立即下载