在线获取旅游需求预测的研究方法及实证研究结果的一个新方法

37 浏览量更新于2023-12-05 收藏 877KB PDF 举报

原创文章

旅游需求预测

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

可在www.sciencedirect.com在线获取ScienceDirectCAAITransactions on Intelligence Technology 1（2016）30e42http://www.journals.elsevier.com/caai-transactions-on-intelligence-technology/原创文章从训练的SVM中提取模糊TakagieXin Xua，*，Rob Lawb，Wei Chenb，Lin Tangca国防科技大学机电一体化与自动化学院，长沙，410073b中国香港特别行政区香港理工大学酒店及旅游业管理学院c湖南农业大学理学院，长沙，4100032016年6月4日在线发布摘要由于快速增长的旅游业对经济的重大贡献，旅游需求预测引起了极大的兴趣。虽然各种定量预测技术已被广泛研究，高度准确和易于理解的预测模型尚未开发。本文提出了一种新的旅游需求预测方法，提取模糊Takagie Sugeno（Te S）规则从训练的支持向量机。与以往的方法不同，本研究使用模糊Te S模型从旅游数据的训练支持向量机的输出中提取。由于符号模糊规则和支持向量机的泛化能力，提取的模糊Te S规则具有较高的预测精度，并包括从业者可以理解的前提条件部分。基于中国香港特别行政区的旅游需求预测问题作为案例研究，从9个海外来源的游客入境的实证研究结果表明，所提出的方法执行与支持向量机，可以实现更好的预测精度比其他预测技术的大多数来源。研究结果表明，决策者可以很容易地解释从支持向量机提取的模糊TeS规则。因此，该方法对旅游市场管理具有重要的指导意义。这一发现表明了所提出的方法在旅游需求预测方面具有良好的科学性和实用价值Copyright © 2016 ，重庆理工大学 . Elsevier B. V. 制作和托管这是 CC BY-NC-ND 许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。关键词：模糊建模;规则提取;支持向量机;旅游需求预测1. 介绍预测是决策和政策规划的基本要求。预测广泛应用于各个领域，包括旅游业。在过去的十年中，越来越多的研究集中在旅游需求的预测技术[48，22，32]。准确预测的重要性基本上归因于该行业产品和服务的易腐性。例如，空的飞机座位、未被占用的酒店房间和未售出的活动门票不能被储存以供将来使用。因此，对未来需求进行准确的短期和长期预测至关重要[20，35，46]。这种预测对香港特别行政区来说是必要的，* 通讯作者。电子邮件地址：xinxu@nudt.edu.cn（X. Xu）.同行评议由重庆理工大学负责。中国是亚洲重要的旅游目的地，旅游业具有重要的经济意义。这个主要行业在入境游客的市场细分方面发生了重大变化。这些变化表明，迫切需要制定准确的方法，预测国际上对中国香港特别行政区旅游的需求，这种需求可以用游客抵达人数来量化因此，旅游研究人员继续开发各种技术来预测未来的旅游需求。在旅游业中，决策者和从业者都需要预测的准确性和良好的可理解性。就工业应用而言，旅游业从业人员可以检查来自不同来源的游客到达的预测值，并通过获得对特定细分市场需求的高度准确的估计来规划这种需求的变化。通过解释预测模型，政策制定者可以分析导致全球变暖的关键因素。http://dx.doi.org/10.1016/j.trit.2016.03.0042468-2322/Copyright © 2016，重庆理工大学由爱思唯尔公司制作和主持这是一篇基于CC BY-NC- ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 4231各地区旅游需求的增减。这些从业人员可以根据旅游预测模型的可理解性来理解潜在的规律性。决策者还可以准确合理地规划旅游项目和相关基础设施发展活动。以往的旅游需求分析和预测研究在预测质量方面产生了两类结果。一类侧重于误差幅度的准确性，另一类旨在提高基于符号规则或知识库的可理解性。尽管人们对预测的准确性达成了共识，并清楚地认识到准确预测的优势，但很少有旅游预测方法在准确性和可理解性方面优于其他方法。根据Walle[57]，定性模型可能表现出良好的解释能力，但这些方法通常缺乏泛化能力，这大大限制了它们的应用。传统的统计回归模型，如自回归积分移动平均（ARIMA）方法，也有一定程度的可理解性。然而，当旅游需求数据中存在非线性和噪声时，这些方法的预测精度可能不令人满意。人工神经网络（ANN）和支持向量机（SVMs）由于其泛化能力和预测精度，最近受到了极大的关注。SVM已经被证明比ANN和ARIMA表现更好。例如， Chen 和 Wang[11] 将遗传算法与支持向量回归（SVR）相结合，对1985年至2001年中国的游客人数进行了建模。他们的研究表明，这种方法优于基于归一化均方误差和平均绝对百分比误差（MAPE）的ANN和ARIMA模型。SVM是一类基于结构风险最小化原则的机器学习算法[11]。支持向量机的泛化能力可以通过控制结构复杂度来优化，这使得支持向量机优于其他机器学习和数据挖掘算法。此外，支持向量机的训练过程是一个凸二次规划过程，通过它可以获得全局最优解。因此，与以往的方法相比，支持向量机为旅游预测提供了一种更准确、更灵活的预测技术。虽然支持向量机的计算精度和表现出令人满意的性能，在旅游研究中，支持向量机和人工神经网络基本上是从这些技术中获得的知识很难理解。因此，最近研究了从SVM或ANN中提取规则[6，10]，并将其应用于各种领域，例如信用评分和欺诈检测[16]。通过从支持向量机和人工神经网络中提取规则，可以增强这些黑盒模型的可理解性，可以实现预测准确性和可解释性之间的折衷。虽然预测的准确性和良好的可理解性是必不可少的决策者和从业人员在旅游业，现有的研究并不将符号规则提取和支持向量机应用于旅游预测。为了填补这一研究空白，本文提出了一种基于规则提取支持向量机的旅游需求预测方法。该方法可以从旅游需求数据训练的支持向量机中提取模糊TeS规则。本研究的目的是将高精度支持向量机提取的模糊规则用于旅游需求预测。从支持向量机的输出生成的模糊TeS规则可以验证这些模型中编码因此，从支持向量机模型中提取的旅游需求模糊规则以中国香港特别行政区的旅游需求预测问题为应用案例进行了研究。结果表明，该方法与支持向量机进行了有效的结合，在大多数情况下，可以达到比其他预测技术更好的预测精度。此外，决策者可以很容易地解释从支持向量机提取的模糊TeS规则。因此，该方法对旅游市场管理具有重要的指导意义。这一结果表明，该方法在旅游需求预测中具有很好的科学性和实用价值。本文的其余部分组织如下。第二部分介绍了本文的研究背景。第三章提出了旅游需求预测的SVMRE方法.第四部分以香港特区旅游需求预测问题为例，对SVMRE的性能进行了评价，并与其他流行的旅游需求预测技术进行了比较。2. 研究背景2.1. 旅游预测技术由于旅游业的独特性，准确的预测至关重要[19，29，31，34]。旅游需求预测采用定性和定量相结合的方法[20，28，48].定性方法依赖于大量的信息和人类经验。Walle[57]批评这些技术缺乏普遍性。因此，旅游研究者并不主要使用定性预测方法.在帮助旅游决策者了解特定目的地的旅游需求方面，形式化的科学技术比定性预测方法更有用，它能清晰地反映旅游需求与其潜在因素之间的关系定量旅游需求预测模型采用数学函数，利用数值数据形成某些现象的关系[15，38]。该等模型用于根据过往表现估计未来价值。定量旅游预测方法包括因果关系（回归）和时间序列技术[1，26，30，50，58]。虽然这些方法取得了一定程度的成功，但一个根本问题是它们无法预测与其他决定因素相关的变化。32X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 42þþ¼因果关系技术通过统计分析建立多个变量之间的关系[2，13，49]。这些技术的优点是明确地表示在现实中显而易见的关系，帮助决策者评估替代方案，并容纳广泛的关系。多元回归预测模型一般具有较高的解释力和预测精度.然而，这些模式也有局限性，包括涉及大量的时间和财务资源，以及建立正确关系所需的大量技能。研究人员还开发了其他基于多元回归分析的旅游需求预测技术，例如衡量两个地理区域之间相互作用程度的重力模型。模拟人类神经系统的计算机系统的成功引起了旅游研究人员的注意;最初的研究是为了调查将计算机神经系统纳入旅游需求分析的可行性[27，54]。2.2. 旅游需求分析支持向量机代表了数据预测和分类统计学习理论的主要进展之一[18，40，60]。SVM训练过程是一个凸二次规划过程，消除了ANN中的局部最小值问题[14，37，42]。虽然在旅游需求分析中使用人工神经网络，支持向量机和高斯过程等计算智能技术进行了初步工作[59]，但以前的研究采用了黑箱建模方法，其解释能力较弱。这种可理解性的弱点是应用神经网络和基于SVM的模型在旅游需求分析的主要障碍。从ANN或SVM中提取规则的主要动机是改进经过良好训练的中间模型的表示，这是通过过滤样本中的噪声来实现的[5，56]。符号规则提取方法可以分为基于分解和基于学习的方法，主要应用于ANN[4]。基于分解的方法分解训练好的神经网络的结构，并使用搜索技术实现规则提取。示例包括 Towell 和 Shavlik[53]的相似权重聚类，Setiono和Leow[45]的相关隐藏单元的激活值的分离，以及Ishikawa[24]的两阶段程序。相比之下，基于学习的方法将网络视为一个整体，并试图提取可以解释其功能的规则。例如，Schmitz等人。[44]通过采用属性选择标准，从训练的神经网络构建二叉决策树。类似地，Tanaka等人[52]从训练过的网络中提取语言为了确定支持向量机模型的符号规则，进行了一些研究。例如，Nu'~nez et al.[41]介绍了SVM的规则提取方法，称为SVM原型方法然而，该方法不适合于较大的输入空间，因为会提取缺乏可解释性的复杂规则。为了促进SVM规则提取方法对大规模问题的适用性，Barakat和Diederich[6]提出了一种使用两个不同数据集的基于学习的方法。本文研究了旅游需求分析中SVM模型的模糊规则提取。本文创新性地提出了一种新的模糊规则提取模型，用于支持向量机在旅游需求预测中的应用。该模型具有较好的泛化能力和可理解性，弥补了现有黑箱模型的不足。2.3. 典型旅游需求分析模型本研究利用五种时间序列预测模型和四种因果关系模型对九个主要客源地的游客人数进行预测比较。前一种模型包括朴素模型、移动平均模型、单指数平滑模型、双指数平滑模型和ARIMA模型，这些模型是旅游需求预测中最常用的一些模型[48]。后者包括多元回归，ANN，SVM和SVMRE。现将选定模式的运作简述如下。一个简单的模型在时间t分配一个值a，该值与时间t 1的值a0相同，其中a0和a分别表示预测值和实际到达数量;也就是说，a0t1¼at：1类似地，本研究中采用的移动平均（3）模型通过下式计算时间段t=1时的a值：a0t1¼atat-1at-2=3：2单指数平滑（0.3）模型通过下式预测时间t1处的到达值a：a0t10：3a0t0：7at：3采用双指数平滑模型（也称为布朗单参数自适应方法）预测到达，公式如下：Lt¼a At1-Lt-1 bt-14bt 1/4aaumen Lt- Lt-1aumen1-aumen bt-1; aumen5 aumena0th¼Lthbt6其中a是0和1之间的平滑常数，h是要预报的时间段的数量。在我们的例子中，h1。Athiyaman和Robertson[3]认为，四种基于时间序列的模型相对容易实施，可以对国际旅游需求做出相对准确的预测。ARIMA模型是一个复杂的时间序列X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 4233XXDXX预测技术，包括五个不同的阶段，即准备，识别，估计，诊断检查和预测。通过对ARMA（p，q）过程进行积分得到ARIMA（p，d，q）过程，其中p，d，q为正整数或零。给定数据Xt的时间序列，ARMA（p，q）模型具有以下形式：在本研究中，基于神经网络的模型包含六个输入节点，用于预测游客到达输出节点。隐层中存在三个S形节点。由于类的数值性质，输出节点是非阈值线性单元。学习率设置为0.01，最大迭代次数根据不同的试验设置为50，000这一势头适用于.1-p1/1fiLi！Xt¼.1þQ1/1qiLi！εt7更新期间的权重被设置为0.2，这是默认值。手动选择上述参数以提高方法的性能。近年来，支持向量机表现出更好的预测能力，其中qi、fi分别是移动平均部分和自回归部分的参数。L是滞后算子，εt表示误差项。因此，ARIMA模型可以用公式表示如下：与传统方法相比，不仅在分类方面，而且在回归任务中，准确性和泛化性能也有所提高。在本研究中，支持向量机应用于回归问题。本文还提出了一种基于规则提取的SVM框架或SVMRE.1-pi¼1fiLi！1-L.1þqi¼1qiLi！εt8需求预测。在此基础上，利用支持向量机回归方法构造具有良好泛化能力的预测模型，其中支持向量机的结构选择和权值学习可通过全局优化技术实现。采用其中d是正整数。由于ARIMA模型在时间序列预测模型中的良好性能，我们也将这些模型应用于我们的实验中。利用SPSS趋势模块中的ARIMA函数对目的地的到达值进行预测。该模块中的专家建模器确定ARIMA模型（p，d，q）中的最佳参数，以获得最佳预测结果。多元线性回归模型采用以下形式：Yi<$b0b1Xi1b2Xi2ð9Þ其中（Yi，Xi1，Xi2，模糊规则提取，SVM模型可以转换为符号模糊规则，以实现改进的可理解性。3. 旅游需求预测为了结合支持向量机和模糊规则的优点，提出了从支持向量机中提取模糊规则的框架，包括三个主要阶段，如算法1所示。由于模糊的Takagie Sugeno（Te S）模型已被证明具有快速的训练速度和简单的规则结构的优势，我们使用训练的支持向量机生成的数据来构建一个模糊Te S规则集，以提高可理解性。34X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 42BB¼bX2¼3.1. 旅游需求预测的支持向量回归方法Ly; f x; u。0，如果jy-f <$x; u<$j ≤ ε;εSVMRE框架的第一阶段涉及对训练数据的SVM回归。在这个阶段，培训jy-f<$x;u<$j-ε，否则ð15Þ可以采用采样来调整SVM超参数，例如核参数。将旅游需求预测表述为回归其中ε是不灵敏度裕度的大小[14]中的Crian in i n和S ch olk定义了优化问题可以对偶求解解由下式给出：问题，以下用于数据生成的统计模型是fbxXnSV。 ai-a*Kxi;x s：t： 0≤a*≤C;0≤ai≤C;考虑到：y¼f× 100 ×100× 100我1/1我ð16Þ其中f（x）是具有m维输入x的未知连续值函数，并且d是具有噪声方差s2的加性零均值噪声。回归的任务是通过收集有限数量的噪声训练数据样本（xi，yi），（i1，2，.，n）来估计未知函数f（x传统的基于回归的预测方法，包括人工神经网络，通常通过最小化训练数据上的经验误差函数来构造估计函数。公式如下：E f bxXh. yi-fbxi;11我其中f x是估计函数，h：R/R是误差函数。在构建估计函数fx之后，可以如下获得新输入的预测值xi1和相应的预测误差ei1：ybi1fbxi12012年12月ei1yi 1-fxi1：13估计函数的预测精度与回归方法的泛化能力密切相关，这在统计学习中得到了广泛的研究根据统计学习理论的研究成果，学习机的泛化能力取决于最小化机器的经验误差和结构复杂度。因此，提高模型的泛化能力或预测精度，其中，nSV是支持向量（SV）的数量，a和a * 是拉格朗日乘数，K（x，xi）是核函数。Smola和Scholkopf[47]描述了计算SVR解决方案的优化过程的细节3.2. 从训练的SVM中在第二阶段，采用支持向量机模型产生新的数据样本的模糊规则的训练。基于训练的ANN的数据再生和符号规则学习的思想被Zhou和Jiang[62]使用，他们提出了NeC4.5算法。在他们的算法中，神经网络集成最初是在原始训练集上训练的。NeC4.5的最终输出是在新的训练集上训练的C4.5决策树。NeC4.5的可理解性优于人工神经网络集成，因为决策树表示的符号规则。在这项研究中，在第一阶段的SVMRE方法训练的SVM模型对于旅游需求预测，由于训练样本和测试样本的输入变量都是可用的，因此可以生成并组合三个新的训练样本子集。令（ xi， yi）（i^l，2，第一子集被表示为（ xi， zi）（i^l，2，通过将原始训练样本中的输入向量xi视为SVM模型的输入来生成输出，如下所示：XnSV当（10）中定义的经验误差函数仅最小化时，传统回归方法的快速性是困难的。zi<$fbxij1ujgj xib：17SVM回归或SVR不同于传统的回归方法，如ANN，因为结构和经验风险最小化[14]。使用内核技巧[55]，SVR的目标函数采用以下形式：11n2 kuk C nL1/1其中L（y，f（x，u））是训练数据的损失函数在SVR中，Vapnik提出的以下ε-不敏感损失函数[55]一般采用：类似地，第二子集（si，zi）（i^l，2，通过替换输出y i（i1，2，用SVM模型的预测输出测试样本。第二子集的生成旨在使用训练的支持向量机的泛化能力来获得测试输入的预测值。然后，第一和第二子集可以组合作为一个扩展的训练集，以构建模糊Te S模型，从而可以提高模糊TeS模型的预测能力。为了进一步提高模糊规则的泛化能力，还可以通过在一些随机生成或选择的输入向量上计算SVM模型的预测输出来构造附加子集。X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 4235¼¼PN我我我我我我阿吉我不不3.3. 基于训练支持向量机的在生成新的训练数据样本后，使用Te S模糊模型[51]的模糊规则提取方法从训练的SVM中提取符号模糊规则。从原理上讲，T-e-S模糊推理系统有三个主要机制，即带有推理机的规则库、输入变量的隶属函数和每条规则的结果部分。Te S推理系统的结果部分是一个线性方程或常系数，分别对应于一阶或零阶Sugeno推理系统。本文研究了一阶Sugeno推理系统。我们将l表示为输入的数量。一个典型的模糊规则可以表示如下：规则i：如果x1是A1i且x2是A2i;XL¼pij xj ri;18j1在我们的实验中，减法聚类算法被用来为输入和输出数据确定合适的聚类。4. 实验结果在本研究中，收集的数据进行分析的基础上的可用性和有效性。这些数据包括北美、欧洲和亚洲的9个原产地。这些原产地包括美国、澳大利亚、加拿大、法国、德国、英国、日本、韩国和中国台湾。这些来源地的访港旅客人数趋势载于图二。1.一、以往的研究[20，21，33，35，36，48]表明，国际旅游需求预测模型中的因变量主要包括：● 原籍人口● 来源的实际可支配个人收入● 2004年12月31日至2005年12月31日期间目的地其中，x i（i¼ 1，2，...，l）是节点i的清晰输入，（j1，2，对于给定的输入向量x，Sugeno模糊系统的最终输出表示如下：目的地的生活费用出发地和目的地之间的外汇汇率● 目的地旅游服务相对价格因此，对前往目的地的旅游需求是以来自这些来源地的游客抵达人数来衡量的，NhbxPi1我爱你;2019年可以表示为●到达时间：2018年12月21日;FER;Pop;Mkt;GDE;AHR;2018年12月21日其中zi是规则i的点火强度，其可以计算为其中，Arrival是从原籍i到达的游客人数。SP是服务相对于原产地i的相对价格（以z1/4min。mx;j1;2;居民消费价格指数（CPI）与起源i）。FER是外汇汇率（以货币计算），Te S模糊系统的训练分为三个步骤。第一步是使用聚类算法确定输入变量的隶属函数，以生成模糊隶属函数的中心。第二步是构造模糊规则。第三步是确定后果参数。一旦计算出模糊隶属函数的中心，T-e-S模糊规则就可以直接根据每个聚类中心设计一个模糊规则。基于Jang等人的工作，可以估计Te S模糊规则美元）。Pop是人口来源i（以数字衡量）。MKT是目的地旅游业的促销和营销支出（以美元计算）。GDE是来源国i的实际人均国内总支出（以美元计算）。AHR为目的地的平均酒店房价（以美元计算）。第i年的SP计算方法与Carey[9]和Morley[39]。SP¼CPIt =CPI2000目的地价格：2022年不我2000我方法对输入隶属函数的非线性参数进行赋值。线性输出参数（pij，ri）通过最小二乘法计算聚类方法用于确定聚类中心，我们数据集内的消费物价指数是以2000年为基准年的连锁数值。因此，公式为SP¼CPIt：23不我消费物价指数的Te S模糊系统的性能至关重要。两种流行的聚类方法，即减法聚类[12，61]和模糊C均值（FCM），可以用来生成聚类中心和规则数。 FCM 算法由 Dunn[17] 提出，Bezdek[7]对其进行了改进，在文献中得到了广泛的应用在预测1967年至2007年来自上述来源地的香港特别行政区旅游需求的相关数据来自多个来源，包括世界银行集团、香港特别行政区旅游协会、香港特别行政区旅游发展局和香港特别行政区政府统计处。为了消除●●1/1[25]第10段。在混合学习算法中，和模糊规则的数量。因此，这些方法是36X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 42联系我们i¼1$100%;250美元P图1.一、来自九个来源地的游客抵达香港特区。为了提高输入变量的维度，并提高ANN，SVM和SVMRE模型的学习效率，我们在数据分析之前对输入和目标变量进行标准化或归一化[43]。原始数据点的缩放有助于提高预测准确性。所采用的标准化过程如下：x-x的由于基于机器学习的预测模型的目标是实现对新数据的预测能力，因此将数据集分为两个子集。一个用于训练预测模型，另一个用于性能测试.机器学习算法的设计需要提高训练集和测试集的逼近精度。在实验中，为了测试这些的准确性，St¼不XMaxmin-Xmin：124小时预测模型，我们将数据集分为训练集（80%）和测试集（20%）。训练集包括在（24）中，Xt是在时间t的输入或目标变量，Xmax是在时间t的输入或目标变量。在我们的数据集期间Xt的最大值，Xmin是Xt的最小值。通过将这些公式应用于输入和输出变量，我们在范围[0，1]内重新调整了用于实验的数据。在所有的预测实验中，使用支持向量机，高斯或多项式核函数的选择。SVM算法选择的四个参数是损失函数中的不敏感参数ε、拉格朗日函数上的边界C乘数，高斯核的宽度参数或度1967年至1999年的入境数据。测试集由2000年至2007年的到达数据组成。前者用于建立预测模型，后者用于评估各种模型的准确性。9种预测方法的预测质量以MAPE和平均绝对标度误差（MASE）衡量，使用以下公式计算：Pnjai-pij=ain对于多项式核，以及对于二次规划方法，调节参数l。在我们的实现中，l和ε被设置为正数。径向基函数核宽度和拉格朗日乘子的界限是根据性能评估手动选择的当 Te S 模糊建模方法用于从训练好的支持向量机中提取模糊规则，利用减法聚类生成Sugeno型模糊推理系统其中ai为实际抵港旅客人数，pi为抵港旅客人数的预测值。MASE是由Hyndman和Koehler提出的缩放误差[23]。MASE基于来自朴素（随机游走）预测方法的样本内平均绝对误差（MAE）对误差进行缩放。比例误差定义为：et令。设置了减法聚类的半径参数0.5对于所有实验。前提和结果是qt¼1n-1个n1/2 jYi-Yi-1 联系我们基于SVM预测模型生成的训练数据，对T-e-S模糊模型的参数进行辨识。规则抽取方法首先利用减法算法确定规则数和前件隶属函数。T-e-S模糊模型的输出与结果参数呈线性关系。因此，可以使用最小二乘估计方法来确定每个规则的结果参数。Chiu[12]进一步讨论了模糊建模方法。其中Yi是实际输出，ett是预测误差，定义为：etYt-Ft，Ft是预测输出。MASE定义为MASE1/ 4平均值：127表1和表2比较了MAPE和MASE值，作为对来自九个来源的数据的不同预测模型的结果。MAPE显示了预测和实际游客人数之间的偏差。因此，较小的MAPEX. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 4237表1九个来源的MAPE比较（粗体数字表示不同预测方法中的最佳性能起源SVMRE安多元回归Arima双指数平滑（0.3）单指数平滑（0.3）移动平均线（3）天真法国百分之十五点八四22.04%17.59%百分之十七点四20.63%百分之十九点七四21.17%百分之十九点二七加拿大12.57%百分之二十五点七五12.54%百分之十六点三一17.59%百分之十七点九九20.57%16.88%澳大利亚百分之十九点八五24.28%29.76%23.60%20.64%百分之二十点三五22.88%19.63%德国百分之十三点六五22.70%46.29%百分之十八点八三32.23%百分之十七点八三20.4 2%16.58%日本13.69%百分之十七点三三15.63%百分之十七点八三百分之十八点三五百分之十五点四九百分之十七点四四百分之十七点零七英国百分之九点三一16.59%25.73%17.48%百分之十八百分之十六点八四百分之十六点八四百分之十六点二八台湾6.91%8.31%9.11%百分之十四点二七9.37%8.49%百分之十一点一七8.12%韩国17.58%31.62%百分之二十点二二36.74%17.71%21.34%25.70%18.10%美国百分之十点八二百分之二十八点零四11.26%百分之十五点一九百分之十六点七二17.62%百分之十九点六四百分之十七点五四表2九个来源的MASE比较（粗体数字表示不同预测方法中的最佳性能起源SVMRE安多元回归Arima双指数平滑（0.3）单指数平滑（0.3）移动平均线（3）天真澳大利亚1.041.461.531.411.121.061.270.96加拿大0.701.560.761.011.021.051.240.95法国0.841.170.970.871.070.981.110.90德国0.741.273.070.981.920.981.170.89日本0.891.111.011.141.200.941.111.04英国0.521.031.441.141.141.021.190.94台湾1.081.341.492.121.321.241.671.16韩国1.101.991.252.311.071.191.480.99美国0.631.840.630.880.941.011.160.97值意味着提高预测准确性。MASE被定义为由朴素预测方法的MAE缩放的误差。因此，当MASE值小于1时，所提出的预测方法产生的误差小于结果表明，SVMRE模型的预测结果准确，误差较小。除澳大利亚的结果外，SVMRE模型的预测精度优于其他模型根据表1和表2的结果，几乎所有数据集的SVMRE模型在9个预测模型中达到了最低的MAPE。对于澳大利亚入境者的预测结果，SVMRE模型的MAPE值仅略高于朴素方法的相应数字，但低于其他方法的通过对MASE的比较，也可以得出同样的结论。与MdASE相比，MASE对离群值的敏感性较低，并且在小样本上的可变性较小[23]。由于测试集的样本量相对较小，我们在本研究SVMRE的MAPE值为不同方法我们将每个模型的预测值与实际游客人数进行了比较。并与其它模型的预测值进行了比较。显著性检验结果见表3和表4。这些表表明，在许多情况下，与其他方法相比，SVMRE的预测性能表现出显着差异。这些表还表明，符号模糊规则可以从训练的SVR模型中提取，而不影响预测精度，通过使用Te S模糊建模方法在SVMRE。这些规则比支持向量机更容易理解，这使得决策者能够更容易地理解模糊预测模型，从而便于规划和决策。例如，从训练的SVM模型中提取9个TeS模糊规则来预测英国的到达人数。我们将Aki（k1基于这些到达的模糊预测模型，Te S模糊规则采用以下形式：规则一：如果（x1是 A1i）和（ x2是 A2i）和（ x3是 A3i）和（ x4是 A4i）和（ x5是 A5i）和（ x6是 A6i），则yi= p1x1 + p2x2 + p3x3 + p4x4 + p5x5 + p6x6 + ri.由于Te S模糊模型的逼近能力，在所有情况下都是一样的。这些结果证实了基于统计学习理论的结构风险最小化支持向量机具有良好的泛化能力。统计显著性检验（Wilcoxon符号检验）已被用来比较两一旦Te S模糊规则得到，设计符号规则的旅游需求预测问题是很容易的。对输入变量构造了模糊隶属函数。因此，可以为这些函数定义符号变量。在我们的实现过程中，每个输入的模糊隶属函数，38X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 42------------------------------------------表3预测到达（使用不同方法）和实际到达之间的Wilcoxon符号秩检验起源SVMRE与到达神经网络vs. 到来回归与到来Arimavs. 到来双指数平滑与到达单指数平滑与到来移动平均线与到来天真vs. 到来澳大利亚-0.5600.575加拿大-0.4200.674法国0.9800.327德国-0.2800.779日本0.2800.779英国-0.2800.779台湾0.8400.401韩国2.3800.017*美国-0.7710.4411.6800.093**-1.8200.0690.7000.4842.3800.017*0.1410.888-0.2800.7791.4420.1492.5210.012*1.9600.050**-0.8450.398-0.7000.4841.5210.1282.3800.017*0.0700.9442.5270.012*1.8290.067**-1.4000.161-0.4210.6741.8200.069**-1.5400.1230.4200.674-0.8400.4011.2600.2081.6800.093**1.6870.0922.5210.012*-1.4000.1611.7550.079**-1.4040.1601.0510.293-0.2110.8330.4200.674-1.1200.2630.7710.4411.9600.050**-1.4020.1611.7520.080**-1.4020.1611.3340.182-0.5600.5751.1850.236-1.5210.1281.4090.1592.2400.025*-1.4020.1611.9600.050**1.6800.093**1.8250.068**-0.4910.6231.2630.206-1.5210.1280.7710.4412.3800.017*-1.4000.161-1.4000.161-1.4020.1611.4000.161-0.6310.5281.1220.262-1.4000.1611.1920.2331.8930.058**-1.2600.208每个原点的第一行是Wilcoxon符号秩检验的Z值，第二行是asymp。sig. （双尾）测试。* <$4在0.05水平上显著; **<$4在0.1水平上显著（粗体数字表示不同预测方法中的最佳性能基于高斯隶属函数的中心位置，通过以下五个符号变量来定义变量：非常大;大;中;小;和非常小为了预测英国的到来，构建了以下Te S模糊符号规则：规则一：如果（SP非常大）和（FER非常小）和（Pop非常小）和（Mkt非常小）和（GDE非常小）（AHR非常小），则到达= 0.04221*SP+0.113*FER+0.189*Pop+0.2502*Mkt+0.3763*GDE+0.303*AHR-0.1329。规则二：如果（SP是大的）和（FER是大的）和（Pop是中等的）和（Mkt是小的）和（GDE是中等的）和（AHR是大的），则到达= 0.0928*SP+0.04937*FER+0.2057*Pop+0.3252*Mkt+0.1376*GDE+0.2706*AHR-0.00365。第三条：如果（SP很小）和（FER很小）和（Pop很小）和（Mkt很小）和（GDE很小）和（AHR很小）小），小），大），则到达= 0.02424*SP+0.05774*FER-0.004358 *Pop-0.02861 *Mkt+0.1443*GDE+0.1694*AHR+0.02203。第四条：如果（SP是中等的）和（FER是大的）和（Pop是中等的）和（Mkt是中等的）和（GDE是大的）和（AHR是非常则到达=-0.05025*SP+0.05392*FER+0.03842*Pop+0.1951*Mkt+0.1276*GDE+0.372*AHR+0.2732。第五条：如果（SP非常小）和（FER是中等）和（Pop是小的）和（Mkt是小的）和（GDE是中等）和（AHR是则到达= 0.2317*SP-0.01644 *FER+0.2598*Pop+0.05078*Mkt+0.3558*GDE+0.07281*AHR+0.06992。第六条：如果（SP是小的）和（FER是中等的）和（Pop是非常大的）和（Mkt是大的）和（GDE是非常大的）和（AHR是中），则到达= 0.04923*SP+0.1982*FER+0.1509*Pop+0.01057*Mkt+0.2491*GDE+0.1917*AHR+0.1464。第七条：如果（SP小）和（FER非常大）和（Pop小）和（Mkt小）和（GDE小）和（AHR中等），则到达=0.1642*SP+0.03257*FER+0.03902*Pop+0.3137*Mkt+0.1733*GDE+0.166*AHR-0.01604。第八条：如果（SP小）和（FER中等）和（Pop小）和（Mkt非常小）和（GDE非常小）和（AHR非常小），则到达 =-0.03721*SP+0.04701*FER-0.01845*Pop+0.1066*Mkt-0.05008*GDE-0.01654*AHR+0.02875。第九条：如果（SP是中等）和（FER是中等）和（Pop是中等）和（Mkt是中等）和（GDE是中等）和（AHR是中等），则到达= 0.09033*SP+0.07145*FER+0.07509*Pop+0.1147*Mkt+0.09799*GDE+0.1684*AHR+0.1389。X. Xu等人/CAAI Transactions on Intelligence Technology 1（2016）30e 4239--------------------------表4SVMRE预测到达与其他模型预测到达之间的Wilcoxon符号秩检验起源SV

下载后可阅读完整内容，剩余1页未读，立即下载