没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报利用物联网和基于集成的模型Stéphane Cédric Koumetio Tekouaboua,El Arbi Abdellaoui Alaouib,c, Alaoui,Walid Cherifd,HassanSilkanaa摩洛哥El Jadida科学院计算机科学系LAROSERI实验室bEIGSI,282 Route of the Oasis,Marif,20140卡萨布兰卡,摩洛哥cE3MI Research Team,Department of Computer Science,Faculty of Sciences and Techniques at Errachidia,University of Moulay Ismaïl,Route Meknes,52000 Errachidia,Moroccod摩洛哥拉巴特国家统计和应用经济研究所SI2M实验室阿提奇莱因福奥文章历史记录:收到2019年2020年1月10日修订2020年1月17日接受2020年2月1日网上发售保留字:智能城市停车场可用性IoT回归包络模型A B S T R A C T智慧城市是技术不断进步的一部分,旨在为居民提供更好的生活质量。城市交通是智慧城市最重要的组成部分之一。由于这些城市的车辆数量不断增长,城市交通拥堵变得越来越普遍。此外,即使在停车场找到停车的地方,对于绕圈行驶的司机来说也不容易研究表明,寻找停车位的司机对交通拥堵的贡献高达30%在这种情况下,有必要预测驾驶员在他们想要停车的停车场中可用的空间。我们在本文中提出了一个新的系统,该系统集成了物联网和基于集成方法的预测模型,以优化智能停车场停车位可用性的预测。我们对伯明翰停车数据集进行的测试允许使用Bagging Regression(BR)算法因此,这一结果将现有的最佳性能提高了6.6%以上,同时大大降低了系统复杂性。©2020作者(S)。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍大量农村人口外流所带来的城市人口的持续增长在这方面,城市行为体的意愿以及信息和通信技术的进步催生了智慧城市的出现是一个日益增长的全球趋势。他们的目标是整合信息和通信技术解决方案,以改善其公民的生活质量和他们与政府官员的互动。因此,交通和城市流动性是城市发展的主要问题之一。他们面临着许多可持续流动性的挑战,面对日益增长的停车位需求,特别是那些与城市的交通,交通和停车系统的能力有限智慧城市的典型例证之一是使用公共交通应用程序并向用户提供自定义信息例程对于这些应用程序的设计(通常支持移动设备),用户必须提供有价值的信息,以优化他们的运动。与此同时,*通讯作者:EIGSI,282 Route of the Oasis,Marif,20140 Casablanca,Morocco.电子邮件地址:abdellaoui. gmail.com(东Abdellaoui Alaoui)。运输公司被迫提高服务质量,以应对智能城市交通的挑战。智慧城市中的城市交通突出了几个以可持续发展为基础的问题,旨在使其更具吸引力,更具生态性和更经济,同时加强社会联系。目前,一些智能工具通过报告诸如交通堵塞、事故或甚至道路状况等现象来帮助驾驶员(Tang和Gao,2005; De Fabritiis等人,2008年)。城市流动性的增加是由于与通常不太方便的公共交通相比,越来越多的个人交通工具的旅行。城市交通的增长导致了大量的车辆,在面对这些可持续发展问题时,交通甚至停车都变得更加乏味(Jin例如,2014年)。这直接影响到驾驶员的活动,因为他们浪费时间寻找可用的停车位,扰乱城市交通流量和增加城市污染。根据(Zheng et al.,2015年,30%的交通堵塞是由寻找停车位的车辆造成的。在这方面,提前知道可用的停车位将克服这一问题。机器学习技术将是以极高的精度预测这种可用性的最佳工具(Zantalis等人,2019; Camero等人, 2018年)。在文献中已经提出了不同的机器学习应用来预测停车位,这些方法在收集的数据类型以及所使用的分析方法方面有所https://doi.org/10.1016/j.jksuci.2020.01.0081319-1578/©2020作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.com688S.C. Koumetio Tekouabou等人/Journal of King Saud University这些数据。一些作品使用实时捕获的图像作为数据(Xiang等人,2017)与简单的传感器系统相当。这些图像总是通过深度学习等算法进行实时处理(Amato,2017; Almeida等人,2015;Bachani等人,2016;Amato等人,2016年,为用户提供实时可用性。这些基于实时的模型已经有几个缺点,即:图像分析更加复杂。我们的系统通过引入用于数据收集、分析和处理的数据中心物联网来克服这个问题。我们的预测数据分析系统必须不时通过最新数据来加强,以调整和更新预测。作者(Stolfi等人,2017; Camero等人,2018)不得不通过使用非常复杂的算法来处理这种类型的数据,这些算法通常专门用于图像处理(卷积神经网络“CNN”)。简而言之,即使性能得到改善,它们仍然需要优化,不仅在复杂性方面,而且在性能和执行时间方面。在本文中,我们介绍了一种基于集成方法的模型,它能够克服上述问题。基本上,在这项工作中,我们提出了一种以数据为中心的方法,旨在预测给定城市停车场的停车位可用性。该系统使用机器学习技术,还集成了不同的连接信息源(IoT)。用于测试我们的模型的数据的主要来源来自伯明翰市的停车场。对于预测,使用不同的回归技术来预测给定时间的停车场可用性。基于不同的回归技术的预测得到有趣的结果。1.1. 研究贡献这项工作的主要贡献是:在智能城市中集成基于物联网的系统,特别是在智能停车场的情况下;全局系统采用集合模型预测智能停车场的车位可用性;智能停车场本文的其余部分组织如下:第2节解释了相关的工作。第3节将介绍物联网和智能城市挑战的预测分析。第4节详细介绍了所提出的方法学。第五节对所得结果进行了分析和讨论。最后,第6节结束了这项工作。2. 相关工作这部分是文献回顾,目的是通过阅读材料,澄清与停车领域相关的主要术语、概念和思想潮流停车是一个非常大的主题;为此目的,本节着重讨论与本文件具体目标有关的要素在Seong-eun等人(2008)中,停车管理系统被分解为两个子系统。第一车辆检测系统(VDS)和第二车辆管理系统(VMS)。VDS检测停车位的状态,并将收集到的信息发送到VMS子系统以提供给驾驶员。Kumar等人(2007)提出了另一种智能停车管理系统。Kumar等人(2007)的作者比较了不同类型的传感器(声学,光传感器和磁性)用于停车管理。来自不同类型的传感器的信息在有限的时间内被发送到中央服务器一些作者,如(Gandhi和Rao,2016)开发了使用传感器电路,RFID和物联网来检测汽车细节的原型,然后使用IR传感器来查找汽车的存在,以便从远程通过IoT。Pawowicz等人(2019年)也使用了基于RFID的技术来改善智能城市的交通控制管理,但预测问题仍然存在。在Giuffr等人(2012)中,作者提出了一种智能停车系统,称为智能停车助理(IPA)。他们的系统主要依赖于智能停车管理中传感器网络的使用。然而,这项工作没有考虑到机器学习算法和物联网的优势Alkheder等人(2016年)为阿布扎比市的购物中心引入了一种智能 停 车 系 统 , 特 别 是 在 周 末 、 假 日 甚 至 工 作 日 。 在 这 篇 文 章(Rajabioun和Ioannou,2015)中,作者开发了一种自回归模型时空向量,可用于预测在驾驶员预期到达时间的街道和街道外停车的停车可用性该项目考虑了停车可用性的时间相关性以及空间相关性。它用于推荐具有最高概率的停车位置他们使用旧金山地区的实时停车数据Bachani等人(2016)对智能停车系统设计的关键方面进行了全面分析,即传感器的选择及其部署的最佳位置,以实现准确检测。Amato(2017)提出了一种基于计算视觉的智能停车系统,他们使用深度学习来确定停车场中的空间可用性。将他们的系统与文献PKLot( Almeida 等 人 , 2015 ) 和 CNRPark-EXT ( Amato 等 人 , 2016年)。Xiang等人(2017)提出了一种使用Haar-AdaBoosting和CNN算法检测加油站实时停车占用率的方法。深度学习的另一个案例研究(Shoeibi和Shoeibi,2019)介绍了一种基于智能停车中的混合机器人代客泊车的自动代客泊车,并通过深度Q学习作为强化学习方法来帮助优化停车位的使用。该论文(Mago和Kumar,2018)提出了一种基于先进视频处理技术的优化停车管理系统设计模型,该模型将有助于将车辆分配到入口处可用的室外停车位。他的方法允许实时口述,这与旨在预测实时的预测分析的目标相去甚远。在Camero et al.(2018)中,作者提出了一种基于深度学习和递归神经网络的新技术来处理停车占用率预测。Stolfi等人(2017年)的同一作者提出了一项停车占用率数据的研究,以测试几种预测策略,例如:多项式调整,傅立叶级数,k均值分组和时间序列。这些不同的作者构建的模型仍然是关键的,没有考虑到物联网等新兴技术,可能是改进的主题;这导致了这项工作的其余部分。在本文中,我们提出了一个停车管理体系结构在那里,我们提出了一种新的方法来预测可用的停车位,使用智能城市,物联网和机器学习,它们是在上述工作中提出的被忽视的停车管理体系结构。3. 物联网和预测分析,以应对智慧城市的挑战3.1. 智慧城市挑战智慧城市的概念是相当新的,代表了城市发展的新方法。这一倡议促进将新的信息和通信技术纳入城市管理,以有效满足公民的需要●●●S.C. Koumetio Tekouabou等人/Journal of King Saud University689因此,城市智能化的理念是提高服务质量和城市互动性,同时最大限度地减少成本和资源。例如,智慧城市有助于改善公民、服务提供商和管理当局之间的关系。一般来说,智慧城市依赖于以下三个流,如图所示。一 曰:物流:“智慧城市”中的物流能量流:在城市地区,它们对应于从生产源到分销商,然后到使用实体(车辆,家庭,公共照明,充电站等)的所有能量转移。数据流:随着城市中新技术的到来(智能手机、传感器网络、车辆、民用和建筑系统等),来自不同应用的大量数据被存储并可以转化为知识。智慧城市可以通过物联网和智能交通系统(ITS)的机制来改善事实上,物联网和ITS的概念可以为智慧城市参与者提供有价值的实时信息例如图 2、阐述了智能城市中ITS提供的各种服务。在这些挑战中,许多都与智能停车问题有关,因此挑战物联网和预测分析。3.2. 物联网和智能停车挑战物联网(IoT)正在加快交通领域的创新步伐,特别是在智能停车和城市交通方面。如今,许多智能停车场都配备了互联系统,允许司机查看他们的智能手机应用程序,设置方向,使用道路救援,远程打开车门以及定位免费停车位。因此,物联网也将为汽车行业带来我们还没有丝毫想法的新奇事物然而,任何新技术都涉及新的挑战 , 包 括 : 技 术 复杂 性 、 安 全 性 、 隐 私 性 、 数 据管 理 和 分 析(Arasteh等人,2016;Mainetti等人,2015; Kubler等人, 2016年)。我们不是已经被数据淹没了吗?物联网将产生更多的数据,为我们的企业信息管理系统增加额外的复杂性。事实上,智能停车系统等功能齐全的物联网可以生成大量数据。这些所谓的以数据为中心的物联网专注于数据流的各个方面,包括收集、处理、存储和可视化(Jin等人,2014年)。海量数据带来了与这些数据的收集、处理、存储和管理Fig. 1. 智慧城市的组成部分。图二、ITS提供的服务类型和操纵将需要先进的扫描技术它还将为优化业务流程开辟新的机会,为电子政务,供应链和城市交通管理提供新的功能。如果捕获、分析和交付是从基于云的系统完成的,则数据捕获和分析将最有效以智能停车场自动管理系统为例在下一节中,我们将介绍我们的基于集成的模型,以优化智能停车场空间可用性的预测(Arasteh等人,2016;Mainetti等人, 2015年)。4. 方法4.1. 智慧停车智能停车系统是一种利用检测设备来定义停车位占用率的智能停车系统。它帮助驾驶员安全停车,并通过适当的车辆管理告知他/她停车位的可用性。得益于智能技术,优化的停车场可以到达市中心。一个传感器系统向司机指示最近的免费停车位的位置,已经在多层停车场成功地进行了测试。目前正在进行街头测试。在加利福尼亚州的旧金山,6000个传感器已嵌入沥青中,并与应用程序和GPS一起工作(Lin等人,2017年; Rodier和Shaheen,2010年)。一个先进的智能停车系统架构需要具备以下要素:i) 传感器,ii) 网关硬件;iii) 服务器/云;iv) 移动应用程序。如图所示。3.第三章。4.2. 关于集成模型基于集成的预测方法结合了几个独立的基本模型,在大多数情况下是决策树或神经网络。这些基本模型中的每一个都提供了一种替代方案●●●690S.C. Koumetio Tekouabou等人/Journal of King Saud UniversityXXð Þ2ð Þ图三. 智能停车系统。问题的预测和最终预测是备选预测的通过组合一组单独的基础模型的预测的预测技术通常允许更稳定和准确的输出预测,因为误差比由形成整体模型的单独的基础模型之一提供的误差小得多实际上,最终的基于集成的模型校正了基本模型单独产生的误差,以大幅降低总误差。要使基本模型有效,必须满足两个条件,即独立和弱模型。最初的想法是将训练数据D划分为n个基本数据以训练n个模型m1;m2,. . mn. 但这种技术很快就被超越了,因为当n变高时,它会促进欠拟合为了克服这一限制,有方法将训练数据重新采样为n个独立的更大的数据子样本,以生成弱模型。要做到这一点,各种技术,其中最常用的已知的是:装袋和提高。因此,对于这些条件,最有利的算法是不稳定的算法,例如决策树和神经网络,在数据集中对其进行轻微修改可以获得不同的模型。图5示出了来自基于集合的模型的预测系统的流程图。其他地区这一部分我们将介绍我们的基本模型,即决策树,然后是两种抽样技术(bagging和boosting),最后是我们的三种集合模型,即随机森林回归器,梯度boosting回归器和Adaboost回归器。4.3. KNN回归KNN是一种惰性学习算法,其使用非参数方法来解决分类或回归问题(Pow等人, 2014年)。对于数值实例,它通过平均最近的k个邻居值来分配类或回归值,或者如果实例值是cetical,则对k个在选择k个最近的邻居之后,可以通过对k个邻居输出进行平均(均匀加权)或通过由函数定义的加权和来预测值(Sinta等人,2014年;Imandoust和Bolandraftar,2013年)。4.4. 决策树预测树技术依赖于使用树来表示初始总空间的递归分区。树的每个终端节点或叶子代表分区的一个单元,并与一个简单的模型相关联,到那个牢房为了更好地理解,考虑具有连续输出变量Y和两个自变量X1和X2的回归问题。我们的灵感来自于这样一个事实,即我们必须划分以更好地统治,首先将我们的空间划分为两个区域,并在每个区域中单独建模Y响应(Y的平均值)。然后,我们继续将每个单独的区域分割成另外两个区域,并继续该过程,直到满足停止规则(Faris等人,2019年)。为了推广前面的情况:考虑一个回归问题,由p个条目和一个输出变量组成。例如,我们有k个实例,每个实例例如被组成对于i^l; 2;.,;k;j; 1; 2;. ;p. 在预测智能停车场的可用率方面,yi可以是停车场i的可用率; 10x i1;x i2;. ;x ij;. ;xipp p是相关的用于预测可用性的速率时间的变量,诸如时间、日期、容量、标识符或其他因素。特征空间被划分为M个区域E1;E2;. Em.换句话说,回归树将交通状况划分为基于输入参数的值,并为每个类别单独建立响应(依赖变量)模型。每个区域的答案通常被视为一个Cm常数。Emn最小化最小化最小化Ek¼1i¼1最小化SSEajTj2由于优化准则在于最小化平方和,因此最佳Cm仅是Rm区域中yi(Zhang和Haghani,2015)。为了找到最优区域,我们使用成本复杂度参数a,其惩罚我们在等式中的目标函数。(1)树的终端节点数不如Eq。(二)、为了选择最佳的分割变量和分割点,实现了贪婪算法。对于每个分割变量,可以通过扫描所有可能的值来确定最佳分割点,这应该非常快地完成通过浏览所有输入S.C. Koumetio Tekouabou等人/Journal of King Saud University691nð ÞX1条评论BðÞEm^xEmx5B2k¼12变量,可以找到最佳的分裂变量和分裂点对单一回归树是强大的随机森林和梯度提升回归树方法的基本模型。4.5. 基于集成的回归因此,总模型的偏差与m^k的偏差相同,但方差减小了es。当然,实际上几乎不可能考虑独立的模型m^k,因为它们都依赖于相同的样本Dn。Bagging方法试图通过在Bootstrap样本上构建模型来减轻聚合模型之间的依赖性整体的总体思路总结在图。 4的这些模型是基于三个主要阶段,即:自举,中间建模和聚合。引导包括将所有数据D分成n个数据D1;D2,、Dn.从每个数据集Di,我们将构建一个中介回归-和最终回归量将是中间回归量Ri的聚合。从这个一般的想法将诞生几种方法,其中最强大的是随机森林算法中使用的装袋和梯度算法1 Bagging Regressor(BR)输入:● x要预测的观测值;● dn观察;● B.树木的数量;● m2N是要切割一个节点的候选变量的数量。输出:估计量m^k^k^k^k增强和自适应增强。1:对于k1至B,B千 分之四4.6. Bagging方法4.6.1. Bagging回归(BR)术语bagging来自Bootstrap Aggregating的缩写。我们在回归环境中提出了这一系列方法,但它们也很容易扩展到监督分类,第我们用X;Y表示一个表示学习数据的随机向量,其中X在R p中取值,Y在R中取值。 我们表示D n=X1;Y1;.. . ;<$Xn;Yn)样本独立且均匀分布。 并且具有与回归函数相同的规律,对于x2Rp,我们考虑均方估计量m的误差及其偏差方差分解如下:2:在dn中绘制一个自助样本dk3: 调整这个自助样本m^x上的回归量。4:结束4.6.2. 随机森林回归(RFR)随机森林只不过是一种特殊的装袋方法,由基于随机变量的树的集合组成。大多数情况下,树是用分类和回归树(CART)算法建立的,其原理是以二元方式递归地划分解释变量生成的空间。更准确地说,在划分的每个阶段,空间的一部分根据变量Xj被分成两个子部分(Zhang和Haghani,2015)。m^它们包括集合B个模型m^1;m^2,. . . ,m^B使得:Bm^xm^X4Bk¼1我们有:算法2随机森林回归(RFR)输入:● x要预测的观测值;● dn观察;● B.树木的数量;● m2N是要切割一个节点的候选变量的数量。输出:h×1PBhx;y1和Vm^x1Vm1x6见图4。 基于集合的模型。1:对于k1至B,2:在dn3:在该自助样本上构建CART树,每个截止点通过在一组m个随机选择的变量上最小化CART的成本函数来选择。p.我们记h:;k为已建树。4:结束4.7. Boosting方法在机器学习的现有技术中,提升被证明是过去三十年中最有效的想法之一,并且继续成为大量文献的主题(Freund等人,1999年;Freund和Schapire,1996年)。顾名思义,Boosting的一般原则是构建一系列模型,然后通过估计值的加权平均值(回归)或多数投票(分类)进行聚合。与上面的bagging方法不同,在经典的bagging方法中,增加子集的创建不是随机的。大多数提升方法的总体思路是按顺序训练预测器,每个预测器都试图纠正其前任(Géron,2017)。性能取决于以前模型的性能,因为每个新子集都是在以前包含的元素上迭代的,这些元素可能被以前的模型错误分类。AdaBoost和Gradient Boosting是最流行的增强方法之一。692S.C. Koumetio Tekouabou等人/Journal of King Saud UniversityPnwii¼1ð ÞMð ÞPwω1M@yð Þ ¼ ð Þ þð ÞN0Xn我1:Pm¼4.7.1. 自适应Boosting回归自适应提升方法基于这样的事实,即用于校正其前任的误差的新预测器简单地对预测器已经适应的训练实例给予更多的关注。结果是新的预测器越来越多地关注困难的情况。例如,要创建AdaBoost分类器,请考虑第一个分类器,它只不过是一个决策树。形成的这个原始树用于对形成的集合进行预测。然后增加与误分类的训练实例相对应的权重。然后基于这些更新的权重形成第二分类器(Mishra等人, 2017年)。第二个分类器再次对训练游戏进行预测。一旦所有的预测指标都形成了,这个集合就可以做出非常相似的预测用于装袋或粘贴操作。唯一的区别是,所得到的预测因子根据其在加权训练集上的总体准确度具有不同的权重(Géron,2017)。自适应提升的过程在算法3中给出。算法3 AdaBoosting Regressor(ABR)输入:● x要预测的观测值;● d n¼x1; y1;. n;● 弱规则;● M是迭代次数。输出:估计量g^Mx1:1:2:算法4(续)2:对于m1/4至M,3:调整样本d n上的弱规则,该样本d n由权重w1加权;.我们注意到从该调整得到的估计量。N4:计算m²1/1我yi¼gmx5: 计算m/loglog1-eem/log。6:重新调整权重:wi¼wiωexpwiω1yi<$gmx;i<$1;. . . ;N7:结束5. 实验结果与讨论在这一小节中,我们将详细介绍基于集成方法的停车可用性预测过程的实验5.1. 数据集如图5所示,我们的全局预测系统由几个阶段组成。第一步是从安装在不同智能停车场的传感器收集数据。 在这一层,数据以csv文件的形式收集在停车场数据库g/L:0.00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002:对于m1/4至M,3:计算梯度的相反方向@Ly;g-并在点gm1xi处进行评估:本文分析的数据来自伯明翰停车场,并首次用于Camero等人(2018)和Stolfi等人(2017年),包括英国伯明翰市NCP(国家停车场)运营的29个停车场的有效占用率。伯明翰是英国西米德兰兹郡的一个主要城市,英国,站在小雷阿河是Ui¼-@lyi;gmxi;i ¼ 1;.. . ;n:伦敦以外英国最大、人口最多的城市,@gxig/m2截至2016年,估计人口为1,124,569人(Camero等人,4:调整样本上的弱标尺x1; U1;. ; x n; U n,我们注意到h m是这样定义的规则。5:更新:gmx gm-1xkhm x6:结束锻造4.7.2. 梯度提升回归(GBR)另一个非常流行的增强算法是梯度增强。Gradient Boosting的工作原理类似于AdaBoost,它顺序地将预测器添加到一个集合中,这样每个人都会尝试纠正其前任的错误然而,与AdaBoost在每次迭代时调整实例权重不同,这种方法试图将新的预测值拟合到前一个预测值所产生的残差(Géron,2017)。2018年)。英国的几个城市。一直在发布他们的开放数据,不仅供研究人员和公司使用,也供公民更好地了解他们居住的地方。伯明翰数据集在开放政府许可证v3.0下许可,并且从上午8:00到下午4:30每15分钟更新一次(每个停车场和每天18个占用值)。 在我们的研究中,我们使用了从Oct4,2016年12月19日(11周),可在UCI机器学习库(Camero et al.,2018; Stolfi等人,2017年)。相 关 数 据 的 选 择 包 括 消 除 不 相 关 和 冗 余 的 信 息 ( Khurana 和Saxena,2018; Sharma和Mir,2019)。对于伯明翰停车场数据库,被认为与问题相关的特征是:SystemCodeNumber是识别停车场的字母数字代码。最后更新:包含每次更新占用数据的日期和时间算法4梯度提升回归(GBR)输入:● x要预测的观测值;● 一个薄弱的规则,● d n¼x1; y1;. n;● k是正则化参数,例如0k 1;<<● M是迭代次数。输出:估计量g^MxM1amgmx:初始化训练数据的权重分布为w i1; i 1; 2;.. . ;N停车场。时间表记录在上午8点到下午6点之间。容量:包含每个停车场的容量Occu-:包含每个停车场的占用情况,每30分钟更新一次。在这项工作中,没有考虑每个停车场的占用率和退出率等其他特征从这些特征中,我们生成了一个称为可用率的特定特征,我们注意到AVR,它是停车场容量减去日期d的时间t时的占用率的比率。在我们的情况下,它是通过以下公式计算的:m¼1S.C. Koumetio Tekouabou等人/Journal of King Saud University693R2¼1-Xi¼1我我ð10Þ图五、基于全局集成的停车场可用性实时预测系统AVR单片机容量p-占用率ð7Þ不同地区的实际和预测停车可用率pÞ ¼容量P方面它们的计算方法如下:(Xu和Ying,2017)例如,停车场sXNAVR;p-AVR2停车位,04/10/2016在07:59:42它有一个占用61,因此我们可以推断此时的入住率为61/577,为10.57%。这个停车场的可用率RMSE¼1/1我我N-1ð8ÞXN j AVR;p-AVRj该日期的时间为89.43%,表明用户可以轻松停车在不影响交通的情况下停车图6显示了公园可用率按白天时间的分布。6 a,然后按周的天数计算。 6 b最后根据每个停车场图6c.实时了解这些可用率,MAE¼第一季第1集NXN 对-主动脉瓣返流率Nð9Þ我们现在希望预测未来的可用率,使用机器学习算法来了解职业。停车位的可用率是我们问题的第五个变量,也就是我们的标签。5.2. 业绩计量为了建立最佳方法,我们使用三个主要指标比较了不同模型的性能:绝对误差(MAE)、r平方(R2)和均方根误差(RMSE)。这三个术语可以判断i¼1AVRi;p-AVRi其中N是实例的总数,AVRi;p是实例i的预测可用率,AVRi是该实例的实际可用率选择单一措施可能并不总是允许分离模型。如果RMSE将通过有利于高偏差的影响而显示由预测和真实之间的方差和平均值表征的误差,则绝对误差可以反映等待预测中的精度的影响计算时间和R2将显示我们正确预测的实际等待时间的比例。最佳模型将由这三个度量之间的同质性产生。694S.C. Koumetio Tekouabou等人/Journal of King Saud University图六、公园可用性的分布S.C. Koumetio Tekouabou等人/Journal of King Saud University6955.3. 优化模拟参数我们想比较第4节中讨论的不同学习方法的性能,以预测停车位的可用率。我们在第5.1节中公开了数据库。我们将这些数据分为训练集(80%)和测试集(20%),训练集用于构建模型,测试集用于评估构建的模型,然后比较它们的性能。首先,我们寻找参数来建立稳定和最佳的模型。对于装袋方法,最重要的是迭代次数、袋外误差(EOOB)和最佳弱学习器。对于boosting方法,需要找到迭代次数、学习率和最佳弱学习器。图7示出了使用简单决策树作为弱学习器来选择这些参数所执行的测试。图图7a和图7b提供了升压方法的最佳参数。从图7a中,我们发现,与默认值学习率(0.1)不同,梯度增强的最佳速率大约为0.5。AdaBoost也可以采用相同的速率。图7b显示,梯度提升的最佳估计器数量至少为300,而对于Adaboost,它不是很重要(大约为300)。40估计器)。 图7c示出了从估计器开始,构造基于装袋的稳定的最优分类器。袋外误差几乎等于0。在图8中,我们示出了四种算法GBR、ABR、RFR和BR的数据库的200个第一实例的回归分布的形状。从该图中,我们可以看到BR然后RFR的分布表明,与效率相对较低的GBR和ABR不同,它更有利于获得更好的性能。对结果的分析将减轻这一趋势。5.4. 结果分析和讨论5.4.1. 全球停车场首先,我们在所有停车场的整个数据库上测试了我们的方法。我们考虑将变量“SystemCodeNumber”作为一个id,该id由29个停车场的0到28的数字编码,以预测整体停车可用性。所进行的测试包括分析和比较四种方法的性能。我们说明了两种算法,使用装袋优化方法(BR和RFR)和其他两个使用提升(ABR和GBR)。获得的结果示于表1中,从中我们生成了图9,其清楚地说明了这些比较性能。总体而言,对于三种测量,与提升方法相比,装袋方法(BR和RFR)给出了最佳结果。对于RMSE和MAE分别为0.001823和0.000673,BR给出了这两种措施的最佳性能。 在R2方面,BR和RFR给出了相同的几乎完美的性能达到-等于0.999954。这些性能略高于RFR,对于这两个测量,改进不超过0.00007。GBR对MAE、RMSE和R2的同行评分分别为0.034405、0.025432和0.983772 。 这 三 项 指 标 的 平 均 值 分 别 为 0.088783 、 0.106124 和0.845595。在所测试的两种加强方法(GBR和ABR)中,结果与装袋方法相比非常不同,装袋方法中的结果相似,如图1B的趋势所示。7.第一次会议。与装袋方法相比,加强方法对所进行的试验的效果稍差最佳的表1性能比较。RMSE MAER2套袋RFR0,0018880,0006820,999951我们进行了两个主要的测试,以评估所选择的算法-BR0,0018230,0006730,999954Rithms:首先在所有停车场和停车场的整个数据库提振GBR0,0344050,0254320,983772每个停车场的数据。ABR0,1061240,0887830,845595见图7。 增强方法参数的优化。见图8。 通过不同算法寻找200个第一实例,比较回归分布。696S.C. Koumetio Tekouabou等人/Journal of King Saud University见图9。 所用回归算法的性能比较。方法(BR)和GBR在0.015和0.033之间变化。BR与ABR之间的相关系数在0.088 ~ 0.155之间5.4.2. 每个停车场的结果分析我们尝试我们的方法来预测每个单独的停车场的可用性。表2给出了三个损失函数(即MAE、RMSE和R2)的结果,并与以前的工作进行了其中仅使用一个损失函数在同一张桌子上,我们-计算了每种方法的平均、最小和最大性能(即MAE、RMSE和R2).在MAE方面,RFR方法给出的平均值最低,为0.00057,而其他方法。对于RMSE和R2,我们发现BR给出了最优均值(分别为0.0012和0.99981)与其他方法相比仍然在表2中,我们感兴趣的是极值(最小值和最大值),然后是每种方法的标准差。我们发现,BR和RFR对所有指标的标准差因此,我们得出的结论是,优化装袋,特别是BR是最有效的方法来预测空间的可用性在每个停车场很多。5.4.3. 与以往作品的考虑到预测的主要目标是预测尽可能接近现实的值,我们比较了预测的性能。表2每个停车场预测可用性的MAE、RMSE和R2MaeRMSER2BRABRGBRRFRBRABRGBRRFRBRABRGBRRFRBHMBCCMKT 010,00050,00910,00140,00060,00140,01210,00210,00130,99990,99520,99990,9999BHMBCCPST010,00060,01140,00130,00050,00180,01480,00200,00150,99990,99460,99990,9999BHMBCCSNH010,00060,00930,00140,00060,00090,01230,00200,00100,99990,99730,99990,9999BHMBCCTHL010,00050,01010,00110,00050,00130,01220,00170,00120,99990,99730,99990,9999BHMBRCBRG010,00070,01430,00140,00070,00120,01700,00200,00110,99990,99710,99990,9999BHMBRCBRG020,00070,01070,00160,00070,00110,01380,00230,00110,99990,99740,99990,9999BHMBRCBRG030,00040,00610,00090,00040,00090,00800,00140,00100,99980,99650,99990,9999BHMEURBRD010,00130,00210,00100,00150,00160,00300,00150,00180,99710,99080,99750,9964BHMEURBRD020,00050,01450,00140,00050,00100,01820,00200,00100,99990,99630,99990,9999BHMMBMMBX010,00040,01460,00100,00040,00130,01950,00180,00130,99990,99640,99990,9999BHMNCPHST010,00040,01510,00100,00040,00080,01710,00150,00070,99990,99020,99990,9999BHMNCPLDH010,00070,00910,00110,00060,00240,01240,00250,00240,99980,99560,99980,9998BHMNCPNHS 010,00050,00810,00120,00050,00080,02110,00170,00080,99990,99990,99990,9999BHMNCPNST010,00070,01000,00140,00060,00150,01280,00210,00180,99990,99010,99990,9999BHMNCPPLS 010,00030,00600,00090,00040,00140,00780,00150,00140,99980,99720,99980,9998BHMNCPRAN010,00030,01040,00090,00030,00130,0130
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功