智能城市数据的时空建模与分析

101 浏览量更新于2023-10-16 收藏 13.37MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

18410智能城市数据的时空分析 �0Maria Bermudez-Edo西班牙格拉纳达大学mbe@ugr.es0Payam Barnaghi英国萨里大学p.barnaghi@surrey.ac.uk0摘要0智能城市收集的数据可以帮助市民和城市规划者了解他们应该在何时何地关注城市不同部分发生的事件的后果。大多数智能城市数据分析解决方案都集中在城市作为一个整体的事件和发生情况上，这使得很难确定特定事件的确切发生地点和时间的后果。我们提出了一种新的方法来对城市中的事件进行时空建模。我们将我们的方法应用于车辆交通数据，基于（卷积）神经网络构建我们的模型。0CCS概念0• 信息系统 → 数据流； • 计算方法学 → 神经网络；0关键词0时空分析；深度学习；智能城市；物联网；神经网络0ACM参考格式：Maria Bermudez-Edo和PayamBarnaghi。2018。智能城市数据的时空分析。在WWW'18Companion：2018年Web会议伴侣，2018年4月23日至27日，法国里昂。ACM，纽约，美国，5页。https://doi.org/10.1145/3184558.319164901 引言0智能城市使城市管理者能够积极规划、管理和应对城市环境中的不同事件、变化和事件。然而，这需要城市周围事件和变化的时空和主题信息。例如，在发生交通事故或道路施工时，城市管理者应该知道这起事故或工程将如何影响未来一段时间内其余道路的情况，并通过准确的替代路线调整交通。大多数智能城市研究旨在在每个时间点上创建城市事件和变化的快照，并／或根据历史数据预测城市的未来状态。例如，现有的道路交通预测是基于每条道路及／或相邻道路的交通情况的历史数据。然而，城市的一个地点的事件可能会在一段时间内影响城市的另一个地点的状态。例如，一个区域的事故可能会影响其他地区的交通。0� 生成权限块和版权信息0本文根据知识共享署名4.0国际许可证（CC BY4.0）发布。作者保留在个人和公司网站上传播作品的权利，并附上适当的归属。WWW'18Companion，2018年4月23日至27日，法国里昂。© 2018IW3C2（国际万维网会议委员会），根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5640-4/18/04。https://doi.org/10.1145/3184558.31916490在未来五分钟内，城市的某些部分将发生变化，而在接下来的一个小时内，城市的另一部分将发生变化，以此类推。本文的主要贡献是识别智能城市数据流中的时空相关性，并将相关性指标纳入适当的实际数据流分析中。这种分析提供了城市网络内部变化的视图；人们、交通、电力等不同数据在城市道路或水电网络周围的变化。通过对这些变化的适当观察，城市议会、规划者、开发商、工业界和市民可以更好地管理和利用他们的时间和资源，更好地规划设施，并管理城市中的事件。传统的智能城市数据分析方法往往忽视了与数据的空间组成部分相互关联的时间组成部分。仅仅进行空间分析将无法对城市数据的变化及其相关性进行建模。我们通过在空间数据分析中添加时间组成部分来展示一个更加通用的模型。我们建议不将城市数据作为整个城市的快照来分析，而是以一种可以将数据在时间上移动的方式来更好地解释经过的时间和一个城市的某一点事件与该事件在城市的另一部分产生的后果之间的时空相关性。所提出的方法可以用于不同环境中的时空网络建模。我们使用（卷积）神经网络（C）（NN）来构建模型。神经网络在计算机视觉、语音识别或自然语言处理等许多应用中一直被广泛应用。交通数据也可以通过序列分析等方法进行分析，以及卡尔曼滤波等解决方案。由于交通流的性质复杂，一些研究开始使用无需先验知识即可帮助表示交通特征的深度学习算法。这些最近的研究取得了有希望的结果。在本文中，我们应用（C）NN模型构建了一个用于智能城市数据的时空数据分析模型。本文的其余部分组织如下。第2节描述了以前的工作。第3节介绍了所使用的方法。第4节展示了使用某个城市的车辆数据评估该提案的初步实验。第5节承认了当前实验的有希望的结果和局限性，并讨论了未来工作的挑战。最后，第6节总结了本文。02 现状0虽然神经网络传统上用于计算机视觉、语音识别或自然语言处理，但近年来它已成功应用于其他领域，如文本分析。例如，在[7]中，Severyn等人使用CNN进行Twitter情感分析。他们使用了一个卷积层，后面跟着最大池化、非线性和软最大分类层。0Track: 个性化实时监测业余自行车手在低端设备上的概念验证和性能评估 WWW 2018，2018年4月23-27日，法国里昂18420通过最大池化、非线性和软最大分类层。Moraes等人对支持向量机（SVM）和人工神经网络（ANN）分类器进行了情感分析的比较，并得出结论，除了不平衡数据的情况外，ANN的性能更好[8]。在车辆交通分析领域，一些研究开始使用神经网络，特别是用于短期交通预测。交通流包含由自由流、崩溃、恢复和拥堵之间的转变引起的尖锐非线性，深度学习架构可以捕捉这些非线性时空效应[9]。在[9]中，作者开发了一个深度学习模型，结合线性模型和tanh层来预测极端交通条件下的交通流量，如暴风雪和拥挤的足球比赛。在[6]中，作者使用基于堆叠自动编码器模型的深度学习方法来学习通用交通流特征。作者使用该模型进行短期交通预测。在[5]中，作者还使用遗传算法和交叉熵进行短期交通预测。然而，所有这些工作都显示了城市某一点的交通情况或城市的快照，但没有同时显示时间和空间上的差异。Dia在[1]中使用了一个时间滞后循环网络TLRN，通过使用具有时间滞后的循环NN来预测一个区域的交通情况，以实现时间平移不变性。然而，这些时间滞后在神经网络内部使用，并且输出是具有该点历史数据的交通预测。03 方法论0城市中的大部分数据变化发生在节点网络中并传播开来；例如，水的分配通过管道网络进行，社交媒体数据可以分布在几个热点之间，人员或车辆通过街道和道路网络移动。这些节点和网络具有固有的空间组成部分，每个节点都有相邻节点，并且通过其他节点连接。然而，数据变化也具有时间组成部分，人员、车辆或水等元素具有不同的模式，不能简单地通过网络拓扑来建模。我们提出使用时空分析来识别和表示可以增强城市未来移动管理的相关模式。通过我们的模型，我们不仅解决了空间拓扑问题，还解决了城市中实际模式和数据变化的问题。通过这种方法，我们可以知道网络的一部分状态如何影响另一部分在过去的一段时间内的状态。例如，我们可以推断城市某一点的密集车辆交通将在几分钟后影响到城市的另一点。在分析车辆交通数据时，研究人员使用城市交通的快照。总体而言，预测通常基于先前的交通数据，并按顺序采用值，显示每个时间段的交通情况作为一系列序列和变化。我们提出的方法将时间序列传感器流解耦。我们使用(C)NN来训练不同的交通数据模型。然而，在将数据输入到NN模型之前，我们对数据的每个段进行时间偏移（即通过移动时间段）。因此，每个流中的时间解耦 (∆ t ) 是不同的。0为了阐明我们的方法，我们只使用四个流（三个输入和一个输出），并且我们只解耦第一个交通流X1，如图1所示，该交通流对应于图2中显示的交通流X1。使用不同的（∆t）值对第一个交通流（X1）进行网络训练会得到具有不同性能的模型。该模型使用流X2和X3在t时刻的输入以及t+∆t时刻的流X1进行训练。我们使用不同的∆t测量不同模型的性能（准确预测Y0），以找到最佳模型。具有最佳性能的模型（即最小误差和最佳性能指标值的模型）将提供事件在流X1（或城市的X1区域）中发生时，在流Y0（或城市的Y0区域）中显示响应的时间（∆t）。0图1：神经网络显示对第一个交通流进行的时间偏移0用例：初步实施和评估0（C）NN模型通过使用一个数据集来控制，该数据集由位于奥胡斯市不同点的135个传感器之间每5分钟测量的交通数据组成。该数据集可在CityPulse项目参考数据集网站1上获得。数据以传感器对的形式组织，提供有关两个传感器的地理位置、时间戳和交通强度（如平均速度和两者之间的车辆计数）的信息。图2显示了以红点表示的传感器在Google Maps2中的位置。原始数据集包含两个半月的车辆交通值，每个传感器恰好包含17,474个样本。然而，我们需要同步所有传感器的数据并丢弃错误值。因此，一个错误值要求删除该时间的所有值。在清理数据之后，尚未应用任何时间偏移，我们得到了14,150个四个传感器值的元组样本。有关详细信息，请参见表1。在每个时间偏移之后，我们需要重新对齐四个传感器的数据并相应地清理数据。因此，对于每个时间偏移，样本值会略有变化。然后，将清理后的数据分为训练集和测试集，其中约70％的数据用于训练，30％的数据用于测试。为了构建模型，我们使用具有不同层和参数的（卷积）神经网络架构，包括一个深层01 http://iot.ee.surrey.ac.uk:8080/2 https://maps.google.com/0Track: 个性化实时监测业余自行车手在低端设备上的概念验证和性能评估 WWW 2018年4月23日至27日，法国里昂MAE = 1nn�i=1��yi − �yi��(1)MSE = 1nn�i=1(yi − �yi )2(2)18430表1：在没有任何时间偏移的实验中使用的数据0原始数据清理后的样本训练样本测试样本02个月 17,474个 14,150个 10,000个 4,150个081％原始数据 70.77％清理后的数据 29.33％清理后的数据0图2：实验中使用的车辆数据地图。红点是传感器。箭头表示两个传感器之间的交通。X1，X2和X3是NN的输入，Y0是输出。我们将X1在时间上进行偏移，以分析与Y0的时间关系0由三个隐藏层组成的网络，每个隐藏层有300个隐藏单元，一个只有一个隐藏层的浅层网络，有三个单元，以及一个卷积层和一个有300个单元的隐藏层的CNN模型。激活函数使用softmax，因为我们的问题是一个多分类任务。我们发现，优化得分函数分类交叉熵在我们的数据集上比广泛使用的平方误差回归表现更好。为了评估提案的有效性，我们使用两个性能指标：平均绝对误差（MAE）和均方误差回归损失（MSE）。它们的定义如下：0其中: • Y 为真实值0• ˆ Y 为期望值0其中 y 为观测到的交通流量，每个观测值为 y i ，而 � y为预测的交通数据，每个预测值为 � y i。MAE和MSE的值越低，准确性越好，意味着预测值更接近真实情况，因此模型更准确，而较高的值意味着模型效果较差。实验仅使用城市各区域的车辆计数变量。我们使用大约一个半月的数据来训练每个模型，并使用两周的交通数据来测试模型。实验中的神经网络模型的输入是四个区域的车辆计数变量（见图2）。在这个初步实验中，我们将重点关注 Y 0 和 X 1之间的交通流如何在时间上相关。为此，我们提出了一个基准，其中（C）NN的输入是变量 X 1 ， X 2 和 X 3 ，输出为 Y 0。我们建议仅在时间上移动变量 X 1 ，并保持 X 2 和 X 3不变，以简化初步实验，并仅关注 Y 0 和 X 1之间的时间相关性。在这个实验中，空间组成部分是数据固有的，因为这些流属于城市的不同空间区域。我们通过对地图进行目视检查来选择空间流。通过仅移动部分流来测试时间组成部分。这些模型涉及信号 X 1 与其他信号（ X 2 ， X 3 和 Y 0）的解耦，其经过不同的时间间隔。首先，我们计算所有流在 t时刻的模型。然后，我们将流 X 1 向后移动5分钟，并再次计算 X 1( t + 5分钟 ) ， X 2 ( t ) ， X 3 ( t ) 和 Y 0 ( t )之间的模型。选择5分钟的滞后是因为这些流每5分钟读取一次数据。我们对不同的时间滞后重复了这个过程。我们还对深度和浅层神经网络以及CNN进行了不同节点结构的实验，结果相似。在所有实验中，我们注意到性能指标在大约10分钟的时间滞后时改善，并且当时间滞后超过10分钟时，性能开始下降。显然，时间滞后阈值将取决于数据和事件的性质以及其对其他来源的影响。在这项工作中，我们通过使用不同时间滞后实验的启发式方法来获得这个值。然而，该值也可以通过分析不同来源之间的相关性值来估计。后者需要进一步的研究和部署。表2显示了具有三个隐藏单元的浅层NN和具有卷积层后跟的三个隐藏层，每个隐藏层有300个隐藏单元的CNN的结果。图3显示了CNN中两周半的测试数据中的实际交通流量（蓝色）和预测交通流量（红色），当经过的时间为10分钟时，算法的性能最佳。尽管在图3中，性能并不特别好，因为模型对交通流量进行了过高的估计，但我们的目的是比较不同模型在有无时间滞后的情况下的性能差异，而在这个目的上，模型已经足够好，因为它能够跟踪每天的小时交通流量的增加和减少。我们在图3中可以看到的主要问题是，模型在周末时跟踪得很准确（例如在时间1500附近的两个峰值），但在工作日时过高估计了交通流量。0论文标题: 业余自行车手个性化实时监测在低端设备上的概念验证和性能评估 WWW 2018, 2018年4月23日至27日，法国里昂18440不同模型在有无时间滞后的情况下的性能差异，而在这个目的上，模型已经足够好，因为它能够跟踪每天的小时交通流量的增加和减少。我们在图3中可以看到的主要问题是，模型在周末时跟踪得很准确（例如在时间1500附近的两个峰值），但在工作日时过高估计了交通流量。0图3：蓝色为实际交通流量，红色为预测交通流量，经过10分钟的比较0图4：Y0区域车辆数量的绘图0为了进一步分析结果，我们需要参考值。我们在图4中绘制了Y0区域车辆数量的实际值的放大图。该图显示了用于训练和测试模型的值的放大图。图5显示了Y0区域车辆数量的箱线图，包括最小值、最大值、中位数和四分位数。从这些图中，我们可以看到最大值为45辆车，最小值为0。在考虑这些值的情况下，结果如下所示：0图5：Y0区域车辆数量的箱线图0表2显示，MAE约为9对于道路上的最大和中位数车辆数来说并不是最佳值，如图5所示，模型需要改进。我们可以看到MSE的结果较高，这是因为MSE惩罚较高的误差值。因此，我们可以从表1和图3推断出，尽管模型在车辆较低值方面表现得相当好，尤其是周末的数据，但在跟踪车辆较高值方面存在困难。我们可以看到模型对交通流量的估计过高。尽管如此，在这些初步实验中，我们的主要目的是比较不同时间偏移的不同模型，以验证我们的想法是否得到支持。进一步的研究将尝试改进模型，如第5节所述，特别关注高交通流量和工作日。表2中不同模型的比较结果显示，当数据的经过时间约为10分钟时，性能指标达到最佳值。这表明X1受Y0的影响，因此，在Y0区域的某个时间点发生的交通情况将在10分钟后反映在X1区域。05个限制、挑战和未来工作0我们的初步结果是有希望的。它们表明，通过将城市建模为具有空间和时间组成部分，通过将数据流在时间上移动，可以提供关于城市不同部分的事件如何在经过一段时间后影响其他部分的增强信息。然而，这些只是初步结果，因此它们有一些限制。需要进一步的研究以便0论文：个性化实时监测业余自行车手在低端设备上的概念验证和性能评估 WWW 2018，2018年4月23-27日，法国里昂[1] Hussein Dia. 2001. An object-oriented neural network approach to short-termtraffic forecasting. European Journal of Operational Research 131, 2 (2001), 253–261.[2] Şefki Kolozali, Daniel Puschmann, Maria Bermudez-Edo, and Payam Barnaghi.2016. On the Effect of Adaptive and Nonadaptive Analysis of Time-Series SensoryData. IEEE Internet of Things Journal 3, 6 (2016), 1084–1098. https://doi.org/10.1109/JIOT.2016.2553080[3] Daniel Kuemper, Ralf Toenjes, and Elke Pulvermueller. 2017. An infrastructure-based interpolation and propagation approach for IoT data analytics. In Inno-vations in Clouds, Internet and Networks (ICIN), 2017 20th Conference on. IEEE,349–354.[4] Kranti Kumar, M Parida, and VK Katiyar. 2013. Short term traffic flow predictionfor a non urban highway using artificial neural network. Procedia-Social andBehavioral Sciences 104 (2013), 755–764. https://doi.org/10.1016/j.sbspro.2013.11.170[5] Pedro Lopez-Garcia, Enrique Onieva, Eneko Osaba, Antonio D Masegosa, andAsier Perallos. 2016. A hybrid method for short-term traffic congestion forecastingusing genetic algorithms and cross entropy. IEEE Transactions on IntelligentTransportation Systems 17, 2 (2016), 557–569.[6] Yisheng Lv, Yanjie Duan, Wenwen Kang, Zhengxi Li, and Fei-Yue Wang. 2015.Traffic flow prediction with big data: a deep learning approach. IEEE Transactionson Intelligent Transportation Systems 16, 2 (2015), 865–873. https://doi.org/10.1109/TITS.2014.2345663[7] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado, and Jeff Dean. 2013.Distributed representations of words and phrases and their compositionality. InAdvances in neural information processing systems. 3111–3119.[8] Rodrigo Moraes, JoãO Francisco Valiati, and Wilson P GaviãO Neto. 2013.Document-level sentiment classification: An empirical comparison between SVMand ANN. Expert Systems with Applications 40, 2 (2013), 621–633.[9] Nicholas G Polson and Vadim O Sokolov. 2017. Deep learning for short-termtraffic flow prediction. Transportation Research Part C: Emerging Technologies 79(2017), 1–17.[10] D. Puschmann, P. Barnaghi, and R. Tafazolli. 2017. Adaptive Clustering forDynamic IoT Data Streams. IEEE Internet of Things Journal 4, 1 (Feb 2017), 64–74.https://doi.org/10.1109/JIOT.2016.2618909[11] Yu Zheng, Licia Capra, Ouri Wolfson, and Hai Yang. 2014. Urban Computing: con-cepts, methodologies, and applications. ACM Transaction on Intelligent Systemsand Technology (ACM TIST) (2014). https://doi.org/10.1145/262959218450表2：第一个交通流不同经过时间的性能比较，使用两个性能指标0经过时间 NN CNN0MAE MSE MAE MSE00分钟 9.42203259763 176.315432851 9.41518072289 176.059518072 5分钟9.33664767278 174.201821193 9.33717012914 174.202975856 +10分钟9.31253814673 173.290368391 9.31815626757 173.302979202 +15分钟9.40423733065 176.162459046 9.40787981859 176.172052154 +20分钟9.41930152975 176.4947619 9.41932749364 176.4947725350为了准确评估我们的方法，在我们初步实验的开发过程中，我们遇到了几个需要在未来的扩展研究中修复的问题。我们发现的第一个限制是模型对交通流量的过高估计。我们可以从图3中看到，周末的交通流量被准确地跟踪，但工作日的交通流量没有被准确地跟踪，尤其是在高交通流量时期。因此，我们计划在未来创建两个不同的模型，一个用于工作日，一个用于周末，因为它们遵循不同的交通模式。接下来，我们将研究时间相关性是否仍适用于这两个模型（工作日和周末），或者它们是否遵循不同的时间偏移相关性。我们还计划通过尝试进一步改进模型的参数估计来增强模型。我们将尝试不同的参数和算法组合。另一个未来的工作是研究各种性能指标，并选择最能评估和解释我们特定实验的指标，考虑到数据类型。第二个限制是我们只移动了一个流，其他流被视为基准，以了解这个特定流的移动如何影响模型或神经网络的输出。然而，在未来，我们计划研究同时移动不同流如何影响整个模型。有多种移动组合，对这些组合进行初步研究以了解它们如何影响模型将是有趣的，以避免进行无数次实验。第三个限制是我们关注不同时间偏移下结果的差异，但我们未来的工作需要仔细研究每个变量的影响以及每个变化的统计显著性。第四个限制是通过对地图的目视检查，我们推断出了空间组成部分，并猜测哪些交通流可能受到其他交通流的影响。对某些区域的交通如何影响其他区域的仔细研究可能对我们的研究很有意义。我们可以将我们的方法与道路基础设施相结合，如[3]中所述。06 结论0本文提出了一种分析物联网数据和智能城市数据流中的时空模型的方法。该方法的创新之处在于时空分析，并使用位置上数据点之间的时间间隔及其对另一个位置的影响。以往的研究主要只涉及空间或时间。现有的研究主要关注的是模式在同一时间的相关性，或者流在特定位置的相关性。为了评估我们的提议，我们使用（卷积）神经网络。我们的初步结果是令人鼓舞的，我们相信我们的方法可以帮助市民和城市管理者更好地了解事件和城市不同部分的变化对城市其他部分的影响，并知道事件的后果何时会在城市的其他部分出现。0我们的工作得到了欧洲委员会在FIESTA-IoT项目下的支持，合同号为CNECT-ICT-643943，以及欧盟H2020IoTCrawler合同号为779852的支持。此外，该工作还部分资助于西班牙经济和竞争力部（AEI/FEDER, UE）的研发项目Ref.TIN2016-79484-R。0致谢0参考文献0论文标题: 个性化实时监测业余自行车手在低端设备上的证明性概念和性能评估 WWW 2018, 2018年4月23日至27日, 法国里昂

下载后可阅读完整内容，剩余1页未读，立即下载