没有合适的资源?快使用搜索试试~ 我知道了~
数据科学与管理4(2021)1研究文章旅游需求预测与游客Yifan Yang,Ju 'e Guo,Shaolong Sun*Xi交通大学管理学院,Xi,710049A R T I C L E I N F O保留字:百度搜索量游客搜索行为旅游需求预测事件研究关键词的选择A B S T R A C T鉴于网络搜索量对于反映游客对某些旅游服务和目的地的偏好的重要性,将这些数据纳入预测模型可以显著提高预测性能。本研究通过对百度搜索量数据进行分段,丰富了旅游需求预测和游客搜索行为的相关文献首先,本文将百度搜索量数据按照量源和时间段进行划分。然后,通过对不同细分市场中旅游需求最相关关键词的分析,揭示了旅游者搜索行为的动态特征最后,本研究采用一系列的计量经济学与机器学习模型,以进一步提升旅游需求与预测的效能。研究结果显示,随着4G技术的普及和普及,游客的 搜 索 行 为 发 生 了 显 著 变 化 , 搜 索 量 提 高 了 2 0 1 4年 M 1 - 2 0 1 9 年 M 1 2 的 预 测 性 能 , 尤 其 是 移 动 终 端 的 搜 索 量 。1. 介绍旅游需求是指旅游者在旅行过程中在旅游目的地购买的商品和服务(Li et al.,2018 a; Wu等人, 2017年),通常以游客量或旅游支出来衡量。准确的旅游需求建模和预测对于有效配置资源,进一步推动旅游业的蓬勃发展具有重要意义(Pan et al., 2011年; Yang等人,2015年)。它们可以极大地帮助从业者在短期内设计合理的运营策略,以及在中长期内优化资源和投资此外,建模和预测还有助于政府制定洪水控制计划和旅游促进政策。旅游者会收集目的地的食物、住宿、景点等事项的相关信息,以制定旅行计划(Fesenmaier et al., 2011; Jacobsen和Munar,2012; Xiang等人,2015年)。搜索引擎记录并处理这些搜索痕迹,形成相应的搜索指数,可以直接反映旅游者对特定目的地的关注程度。 由于人类的注意力是有限的(Da等人,2011年),当一个游客对某些景点更加关注时,这意味着他(她)更有可能去那里旅行。也就是说,游客对一个景点关注越多同行评议由Xi交通大学负责* 通讯作者。电子邮件地址:sunshaolong@X jtu.edu.cn(S. Sun)。https://doi.org/10.1016/j.dsm.2021.10.002对于该目的地将存在(Ho等人, 2012,2016; Liu等人, 2021年)。因此,搜索指数是分析游客搜索行为、提高景点旅游需求预测准确性的重要数据资源。由于谷歌的不可用,百度是中国人获取旅游信息最常用的Baidu Inc.2006年,百度推出了百度索引(http://index.baidu.com/)模块,百度指数以网民的搜索量为基础,以关键词为统计对象,分析计算每个关键词在百度搜索中的搜索频率权重。通过在搜索框中输入一个候选关键词,并确定要搜索的时间间隔、地理区域和搜索终端,百度指数就会显示网民对某个关键词的搜索量以及持续变化情况。此外,百度指数针对不同的搜索终端提供了不同的搜索指数,PC端搜索量(PSV)和移动端搜索量(MSV)。 PC具有更大的显示屏、物理键盘和鼠标,这意味着更友好的用户交互性能,允许用户在PC终端上搜索时找到更全面和具体的信息,而移动设备由于其便携性和连接性,允许用户在任何地方获得信息(Murphy等人,2016; Tavitiyaman等人,2021年)。由于不同的设备有不同的优缺点,游客在通过不同的设备搜索信息时会表现出不同的偏好,PSV和MSV的搜索查询和趋势也会表现出不同的特点。此外,游客通过不同终端的搜索偏好将被接收日期:2021年9月14日;接收日期:2021年10月15日;接受日期:2021年10月16日2021年10月23日在线提供2666-7649/© 2021 Xi'an Jiaotong University.出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表数据科学与管理杂志主页:www.keaipublishing.com/en/journals/data-science-and-managementY. Yang等人数据科学与管理4(2021)12受技术发展的影响2013年12月4日,中华人民共和国工业和信息化部正式向三家电信运营商颁发第四代移动网络(4G)牌照。 4G技术大大提高了移动设备上网的速度,提高了移动设备的连接性,也进一步激励软件厂商通过不断优化移动App来提高移动设备的交互友好性。因此,移动设备已经取代PC成为最受欢迎的搜索终端,MSV从2014年开始超过PSV(Huet al.,2021; Villamediana-Pedrosa等人,2020年)。由于网络搜索量在一定程度上能够反映旅游者的旅游意向,越来越多的学者收集网络搜索量数据并将其应用于旅游需求的建模和预测中。然而,在这些论文中出现了一些实际的研究空白。首先,很少有研究考虑进一步将搜索量索引数据划分为PSV和MSV来探索搜索查询的特征和演变。然后,现有的旅游需求预测研究通常收集尽可能长的旅游需求时间序列,并将其与相同长度的搜索量序列相匹配,以确保预测模型得到充分发展。这些研究的隐含假设是,旅游需求和网络搜索量之间的相关性是静态的(Simester等人,2020年)。然而,4G技术的普及对上述假设提出了挑战此外,这将导致预测精度下降。因此,我们收集了更详细的PC和移动终端的搜索量数据,并以2013年M12(4G技术普及的时间)为断点,将两个系列分为两个部分。本研究主要围绕两个问题展开:Q1:游客的搜索行为在不同的时间、不同的时段是否Q2:对搜索数据进行进一步细分,是否可以提高旅游需求预测的准确性。与以往研究不同的是,本研究从更细致的角度对搜索数据进行挖掘,采用事件研究法捕捉百度搜索量的动态特征进行细分,为现有的基于搜索量数据的旅游需求建模和预测研究提供了新的思路。本文件其余部分的结构如下。第二部分对相关研究进行了总结第3节说明了数据收集的过程第四节和第五节分别描述了游客搜索行为和旅游需求预测的特征最后,第6节探讨了本研究结果的意义2. 文献综述2.1. 通过搜索引擎的游客搜索行为搜索引擎已被证明是游客获取目的地旅游信息的最重要工具之一(Nicolau等人, 2021; Wang等人, 2021; Xiang等人, 2015年)。Tsang等人(2011)指出,在旅行前规划阶段,搜索引擎比旅游指南更具竞争力。 Ho等人(2012)提出了旅游信息搜索行为的概念框架,其中在线网络搜索是这一框架的核心节点。基于403瑞士游客的电子问卷,墨菲等人。(2016)发现,当游客预订酒店时,来自朋友和搜索引擎的推荐是最受欢迎的信息来源。根据Ho et al. (2012),当游客使用搜索引擎获取旅游信息时,他们首先会根据先前的知识或搜索经验确定搜索词(Gursoy和McCleary,2004),然后通过评估搜索引擎的现有内容来细化和缩小搜索词,直到他们获得想要的结果或选择放弃(Pan et al., 2011年)。由于设备特性的不同,游客对搜索结果有效性的评价会受到搜索设备的影响(Murphyet al.,2016年)。当游客使用个人电脑搜索时,PC可以显示更全面的搜索结果,因为游客可以充分评估搜索结果,并选择他们关心的内容进行深入探索。因此,游客搜索行为模式是目标导向的,并且对应的搜索项是分层的(Ho等人, 2016; Kang等人, 2020年)。考虑到移动设备的显示界面有限,移动搜索效率相对较低,但随着信息技术的不断发展,移动设备的便携性和连接性优势不断扩大,游客搜索旅游信息将不受时间或空间的限制,可以利用碎片化的时间搜索更全面的术 语( Dacinia Crina和 Florina, 2020; Tavitiyaman 等 人, 2021年)。2.2. 基于搜索量的旅游需求预测在大数据时代,个人无论何时何地都会在无意中产生大量的数据,这些数据可以用来全面地描绘用户的行为和特征。网络搜索量作为网络搜索的主要类别之一,主要通过收集用户对某个关键词的搜索量来反映用户的偏好和兴趣。 Ginsberget al. (2009)首次将Google搜索量加入到Incubuenza流行病预测模型中,提前准确预测了Incubuenza疫情爆发的时间和强度,证明了搜索量的有效性,鼓励更多学者在其他领域,如电影行业,采用搜索量进行建模或预测(Goel et al., 2010)、股票市场(Perlin等人, 2017),以及能源消耗和价格(Yu et al., 2019年)。在旅游管理方面,Fesenmaier et al首次引入网络搜索量来探索网络搜索量对旅游规划的影响。(2011年)。此外,Pan et al. (2012)采用Google搜索量预测酒店客房需求,并验证网络搜索量的有效性。 网络搜索量在建模和预测旅游需求的文献中得到了大量关注(Li等人,2018 a;Tian等人, 2021; Wu等人, 2017年)。表1按照预测目标、数据提供者、数据预处理技术和预测方法对上述文献进行了总结。Yang等人(2015)首先提出了一种系统化的方法,选择与旅游需求最相关的关键词,并将这些关键词的百度搜索量聚合作为预测中国海南省旅游需求的综合指数。 这种方法得到了旅游需求中大量学者的认可,并广泛应用于他们的研究中(Huang et al. 2017年; Li等人, 2017,2018 b; Sun等人, 2019年)。一些学者在关键词的选择上也做了一些尝试 Lv等人(2018)提出了一个名为SAEN(具有回声状态回归的堆栈自动编码器)的深度学习框架,以细化和整合旅游需求预测的搜索量数据。Xie etal.(2021)采用KPCA选取对香港旅游需求预测有用的搜索信息Li等人(2021)使用四种机器学习方法进行搜索关键字的特征选择,其结果表明具有特征选择的模型更有效。由于网络搜索量可以收集为最高级别的每日数据,而旅游需求数据通常仅在月数据的频率中获得,Bangwayo-Skeete和Skeete(2015)应用混合数据抽样(MIDAS)方法,根据每日搜索量预测月度旅游需求,Wen et al. (2021)进一步扩大这项工作。 更有效的机器学习方法也被引入这个领域。Sun等人(2019)介绍了用于北京旅游需求预测的内核极端学习机(KELM),包括Google和百度搜索量。Wang et al.(2020)基于增强的BPNN(反向传播神经网络)预测月度旅游需求,并使用三个真实数据集来验证其方法的优越性深度学习模型也以其优异的性能逐渐被用于旅游需求预测(Law et al., 2019年; Wu等人,2021年)。例如,Bi et al. (2020年)采用长短期记忆(LSTM),利用搜索量数据进行日常旅游需求预测。Sun等人(2021)提出北京的集成深度学习方法Y. Yang等人数据科学与管理4(2021)13表1利用搜索量数据进行旅游需求预测的文献综述表1(续)参考文献预测数据数据预测Huang等人(2017年)中国紫禁城的游客百度指数一个系统的方法线性回归注:ARMA(X):自回归移动平均(含外生变量); AR-MIDAS:自回归混合数据采样; GDFM:广义动态因子模型; PCA:主成分分析; BPNN:反向传播神经网络; SAEN:带回声状态回归的堆叠式自动编码器;KELM:内核Li等人(2017年)中国北京旅游量Li等人(2018年b)中国北京的游客量百度指数百度指数GDFM、PCA计量经济模型PCA BPNN极限学习机; DLM:深度学习模型; LSTM:长短期记忆; EEMD:集合经验模式分解; ARX:具有外生变量的自回归; MA-MIDAS:移动平均混合数据采样;SARIMA:季节性自回归积分移动平均; RF:随机森林;SAE:堆叠自编码器; KPCA:核主成分分析; LSSVR:最小二乘支持向量回归。Lv等人(2018年)美国和中国的游客量Sun等人(2019)游客中国北京的体积Law等人(2019)游客中国澳门的体积谷歌趋势和百度指数谷歌趋势和百度指数谷歌趋势和百度指数一个系统的方法一个系统的方法一个系统的方法SaenKelmDLM旅游需求预测。 这些研究主要集中在方法层面,很少有学者对网络搜索量的特征进行更详细的研究。 Wickramasinghe和Ratnasiri(2020)对旅游数据和相应的谷歌搜索数据进行了区域和时间分类,以提高旅游预测的性能。作者还应用他们的预测模型来衡量斯里兰卡因COVID-19大流行而造成的经济损失。 Hu等人(2021)应用周搜索量数据和几种预测模型,比较PSV和MSV对中国国家公园旅游需求的预测能力。因此,本研究将搜索量数据分为若干段,考虑设备特性和技术发展,以探讨游客搜索行为的差异,Wang等人(2020)游客中国、土耳其和美国谷歌趋势无增强BPNN不同的终端以及它的发展方式而且我们将上述细分的搜索量作为自变量纳入预测模型,以探索其预测性能。Bi等(2020年)中国九寨沟游客量百度指数一个系统的方法LSTM3. 数据收集本文旨在预测国内旅游需求,因此,选择旅游目的地进行实证研究的过程必须李与法(2020)游客中国香港地区成交量谷歌趋势EEMD ARX考虑旅游人气、游客结构和旅游需求数据的可用性。本文以重庆市为实证研究的对象,以旅游量作为衡量旅游业发展的指标,Li等人(2021)游客中国北京的体积百度指数机学习方法武装部队,ARMAX旅游需求的原因有以下几首先,重庆,中国的热点首都,已经连续几年被评为中国最受欢迎的旅游城市之一。然后,在2019年,Wen etal. (2021)游客体积中国香港百度指数MA-MIDAS来渝游客近6.53亿人次习惯使用百度搜索引擎搜索旅游信息的游客此外,重庆市每月国内Wu等人(2021年)中国澳门游客量Google趋势和百度指数一个系统的方法SARIMA-LSTM游客量可以从Wind数据库中下载为旅游需求选择被认为是将搜索量预测模型;选择太少的关键字将增加错过核心关键字的风险,而选择太多的关键字Peng等人(2021)游客九寨沟和中国北京卷Sun等人(2021)游客体积百度指数谷歌趋势RF LSTMSAEKELM关键字将产生更多的噪声,从而降低模型的准确性(Li等人, 2017年; Yang等人, 2015年)。 这项研究采用了Yang(2016)提出的系统方法,该方法选择了一系列高性能的全尺寸关键字。具体来说,我们最初寻找了一些基本的搜索关键字,以从以前的文献和旅游指南中构建种子集这些关键词指的是旅游的基本方面,如餐饮、酒店和交通(Liu et al., 2021年)。然后,我们搜索上述种子引用预测指标数据提供商数据预处理预测方法目标提供商预处理技术方法技术北京,Pan等人(2012年)酒店房间谷歌没有一武装部队,中国需求趋势ARMAXXie等人(2021)旅游谷歌KPCAMA-LSSVR香港,体积趋势中国香港,和Yang等人(2015年)旅游百度一个系统Arma中国百度体积指数方法指数海南省,Hu等人(2021)旅游百度BorutaARIMAX中国体积指数算法邦瓦约-斯基特旅游谷歌没有一AR-MIDAS四姑娘关于Skeete体积趋势山,(2015年)加勒比中国Y. Yang等人数据科学与管理4(2021)14关键词在百度指数中的搜索,并通过自动推荐迭代收集相关关键词作为下一轮搜索词,直到推荐列表中没有新的关键词出现。最后,我们删除无效关键字,合并相似关键字,并将剩余关键字分类为导游、美食、酒店、天气、交通和景点,以获得最终关键字列表。收集了2011年M1- 如图 1显示,在2014年M12之前,PSV略高于MSV。然而,自2014年以来,MSV大幅上升,比PSV大约15倍因此,为了进一步研究4G技术普及对游客搜索行为的影响,我们将原始数据分为“2011年M1-2013年M12”和“2014年M1-2019年M12”两个子时段。表2显示了最终关键字列表及其分类结果;粗体字表示种子关键字。景点的关键词最受欢迎,其次是食品和交通,导游,酒店和天气,排名最后,符合游客景点是旅游规划的核心组成部分,大多数活动都是围绕景点展开的。除了景点之外,特色食品最能代表旅游目的地交通便利也是游客选择目的地的重要原因。指南通常由表达一般信息的单词组成,游客键入一些关于指南的关键字以获得子类别信息以继续搜索。 酒店和天气信息可以通过其他来源获得,例如相关应用程序。4. 旅游者搜索行为特征为了表征游客的搜索行为,本研究将关键词的搜索量滞后不同的滞后期。计算不同时段滞后搜索量与旅游需求的Pearson相关系数,然后保留量与需求的最大相关系数作为某些关键词的相关系数。 通过对相关系数进行排序,我们可以筛选出代表游客搜索偏好的词汇。 根据Sun et al. (2019年),我们设定关键词0-3的滞后期区间,分析游客在旅游前三个月的搜索行为。为了在准确性和简约性之间做出权衡,我们分别保留了不同PC和移动终端相关系数最高的前5名和前10名搜索关键词(如表3所示)。某些搜索关键词与旅游需求的相关系数对于我们分析游客搜索行为具有重要意义一般而言,PSV的相关系数低于MSV,尤其是在2014年M1至2019年M12期间。PSV的相关系数急剧恶化,所有关键词的相关系数均不大于0.5,2,这意味着2014年M1- 2019年M12的PSV失去了代表游客搜索行为的功能。这是因为从2011年M1- 2013年M12,由于手机上网速度有限,在手机终端上搜索信息与在PC终端上搜索相比,并没有明显的优势。然而,随着4G技术的普及,手机上网速度大幅提升,手机终端搜索变得更加方便快捷。我们可以在滞后期内识别出设备之间的明显差异从2011 M1情况略有变化,1百度移动端搜索量数据自2011年M1起发布。由于COVID-19疫情,重庆旅游需求数据于2019年M12停止发布。因此,考虑到数据可用性,选择2011 M1和2019M12作为起点和终点。2由于相关系数,本研究没有分析2014年M1至2019年M12期间通过PC进行的游客搜索行为2014年M1这表明用户更倾向于通过移动终端搜索即时信息,而更倾向于通过PC终端提前搜索规划信息。此外,关键词的零滞后期可能会导致MSV的预测性能下降,这将在下一节中进一步讨论。搜索关键字和它们的类别对于每个细分也是不同的。在2011年M1 -2013年M12的PSV细分中,搜索内容以导游和景点为主,相应的滞后期为非零,表明游客更喜欢通过PC端提前安排旅游计划。在2011年M1 - 2013年M12的MSV细分中,由于缺乏酒店预订应用程序,除景点外,有关酒店的 在2014 M1 - 2019 M12的MSV细分中,景点仍然是游客最重要的信息。与此同时,随着越来越多的酒店预订应用程序的出现,游客不再通过搜索引擎寻找酒店信息。 关于导游或与导游相似的关键词如重庆夜景、重庆温度、重庆地图等出现,滞后期不为零的关键词也逐渐增多。 这表明,在搜索旅游信息方面,移动终端提供了更好的用户体验,并已逐步取代PC终端。5. 旅游需求预测5.1. 综合指数构建为了降低噪声和计算复杂度,本文尝试从搜索量数据构建一个复合指数由于搜索量数据是在搜索量数据为零(当前数据)的滞后期之后的月初发布的,因此无法用于旅游需求预测,我们将关键词1-3的滞后期区间然后,我们根据数据特征为每个分割设置一定的相关性阈值,该阈值不小于0.5,并保留相关系数超过阈值的关键字作为我们的最终关键字集。最后,我们进一步将上述关键词的搜索量根据其滞后期进行移动,并将其汇总为一个有效的综合指数。 在本旅游需求预测部分,除了2011年M1 - 2013年M12和2014年M1 - 2019年M12这两个子时段外,我们还考虑了整个时段(2011年M1-2013年M12)。图图2显示了各时期旅游需求的变化趋势和综合指数。由于关键词的相关系数较低,2014年M1- 2019年M12的PSV5.2. 协整分析与格兰杰因果检验协整检验验证非平稳序列的线性组合是否具有长期稳定的均衡关系。换句话说,由于季节性干扰或随机干扰,变量可能会在短期内偏离,但这种偏离通常是暂时的,很快就会回到长期平衡点。基于残差的协整检验,即恩格尔-格兰杰(EG)检验,表明如果因变量和自变量之间存在协整关系,则因变量可以通过自变量的线性组合来解释,并且由自变量无法解释的部分组成的残差序列应该是稳定的(恩格尔和格兰杰,1987)。协整分析和格兰杰因果检验是根据历史数据检测变量是否具有预测关系的最常用的计量经济学方法,它必须保证因变量和自变量在相同的不同阶次中平稳,并具有明确的经济含义。因此,我们采用原始数据的第一个差异来建立旅游需求的变化和搜索量的变化,Y. Yang等人数据科学与管理4(2021)15Fig. 1. 2011年M01 - 2019年M12的PSV和MSV趋势。独立变量,分别。为了简化,我们仍然将原始数据的变化称为旅游需求,PSV和MSV。如表4所示,所有变量在所有时间段内均得到稳定验证,这表明变量符合积分检验的要求。此外,协整结果表明,旅游需求和搜索量在所有情况下都是协整的。这说明从计量经济学的角度来看,采用搜索量预测重庆市旅游需求5.3. 使用常见预测模型进行预测根据Granger因果关系检验的结果,进一步比较了预测方法对搜索量的预测性能表3相关系数最大的关键词期间类别关键词系数滞后采用格兰杰因果关系检验检验了搜索量是否可以作为旅游需求的预测指标如图所示PSV从2011 M1到2013 M12重庆旅游攻略0.6070 1在表5中,在2011年M1- 2013年M12子期间搜索量的格兰杰原因,而搜索量是格兰杰原因景点歌乐山0. 5506 2重庆旅游指南0. 5175 1在2014年M1- 2019年M12子时段,旅游需求是MSV的Granger原因;在整个2011年M1 - 2019年M12期间PSV从2014 M1到2019 M12景点磁器口古镇美食重庆麻辣面重庆欢乐谷天气重庆气温旅游景点长江索道0.5137 30.5110 30.4254 30.3732 30.3010 2旅游景点洪崖洞0. 2645 2表2重庆旅游攻略0.1698 1最后的关键字列表和类别。2011年M1至酒店重庆酒店0. 7106 02013M12景点磁器口古0.6536 0类别关键词类别关键词镇引导重庆旅游酒店重庆饭店景点洋人街0.65210引导景点重庆动物园0.63580重庆旅游重庆饭店景点解放碑0.61840预订景点朝天门0.61440重庆特产景点重庆景点码头重庆夜朝天门码头景点洪崖洞0.61240场景景点渣滓洞0.61060食品重庆美食磁器口古镇酒店重庆饭店0.58130九宫格热点洪崖洞预订重庆热点解放碑天气重庆天气0.57901重庆热点白公馆2014年M1至天气重庆0.68483基地2019年M12温度重庆麻辣歌乐山景点渣滓洞0.62030面引导重庆夜0.61070担担面观音桥场景天气重庆天气铁山坪森林公园景点白公馆0.60040重庆天气洋人街景点重庆动物园0.57520预测景点长江0.55550重庆气温渣滓洞索道运输重庆交通长江索道景点重庆0.53722江北机场重庆大景点剧院景点朝天门0.53220重庆地铁重庆动物园码头重庆市地图重庆欢乐谷运输重庆市地图0.53022重庆轻轨重庆中央公园景点重庆欢乐0.52643重庆轻轨重庆园博园谷3号线注:粗体字表示种子关键字。花园注:系数表示关键字的最大相关系数,lag表示相应的滞后时间。Y. Yang等人数据科学与管理4(2021)16图二. 归一化后旅游需求及综合指数的变化趋势表4平稳性检验和协整分析的结果t统计p值t统计p值t统计p值跟踪统计p值跟踪统计p值2011 M1 -2011M1-2013M12 -4.6398 0.00 -4.2372 0.01 -4.2022 0.01 -8.8594 0.00 -8.0119 0.002014M1-2019M12 -4.9193 0.00 -6.3585 0.00 -12.2754 0.00注:0.00表示p值小于0.01。模型出于比较的目的,我们只选择2014年M1-2019年M12和2011年M1-2019年M12,因为它们可以选择相同的测试集。我们将过去6个月的数据作为这两个时期的测试集,并将其余数据作为训练集。此外,我们选择了一个计量经济学模型(SARIMA)和一个机器学习模型(BPNN)进行旅游需求预测,这是预测的基本模型,已被广泛用于旅游预测(Li et al.,2017,2018 a; Sun等人, 2019年)。在本研究中,我们应用滚动窗方法来实现一步预测。例如,如果滞后阶数设置为12,则我们使用2018年M7 - 2019年M6的实际数据来预测2019年M7的旅游需求,并使用2018年M12-2019年M11的实际数据预测2019年M12的旅游需求。运用R软件包auto.arima建立SARIMA模型,利用赤池信息准则(AIC)和贝叶斯信息准则(BIC)确定旅游需求的参数和滞后阶数对于SARIMA和BPNN模型,PSV(MSV)的滞后阶数总是设置为1,因为搜索量指数是一个包含1-3个滞后阶数的最有效预测信息的复合 参见Sun et al. (2019年),BPNN模型的旅游需求滞后阶数设置为12,BPNN的其他主要超参数如下所示。隐藏层节点的数量被设置为15,学习率被设置为0.1,并且最大时期数量被设置为1000。时期增广Dickey-Fuller平稳性检验协整分析旅游需求PSV MSV旅游需求PSV&旅游需求&Y. Yang等人数据科学与管理4(2021)17NbN我我N1B表5Granger因果关系检验结果。周期假设f统计量p值与单一旅游需求时间序列的MAPE比较在2014年M1- 2019年M12期间2011年M1PSV不是旅游需求的Granger原因旅游需求不是MSV0.3266 0.561.5306 0.219.3180 0.00此外,2014年M1 - 2019年M12期间具有MSV的模型的性能对这一结果有首先,前者的时间段是2014年M1 - 2019年M12原因MSVMSV不是旅游需求的Granger原因23.89280.00本研究描述了游客对百度搜索量进行了细分,分析了注:0.00表示p值小于0.01。采用三个常用的评价标准,MAE(平均绝对误差),RMSE(均方根误差)和MAPE(平均绝对百分比误差),MAE¼1Xjy-byj(1)vut1XN2搜索量与旅游需求的关系,并进一步利用细分后的百度搜索量对旅游具体而言,我们将百度搜索量分为PSV和MSV,以比较游客的搜索行为,并以4G牌照发放时间为突破点,将原时段分为2011年M1-2013年M12和2014年M1-2019年M12两个子时段。首先,我们得出结论,移动终端已逐渐取代PC终端成为主要的旅游信息搜索终端,由于其方便和用户友好的体验。具体而言,在4G牌照发放之前,游客主要通过PC终端搜索信息在此期间,通过移动终端搜索的信息很少RMSE¼N1Yi-Yii(二)旅行,如某些旅游景点的位置4G发布后随着许可证的发放,游客开始利用移动设备而不是PC来计划和安排他们的旅行,无论是在旅行期间还是旅行前不久第二、1倍。yi-byi。我们发现,将搜索量纳入预测模型可以联系我们1.yi. × 100%(3)显著提高整个期间的预测性能,而只有MSV可以作为子期间的预测因子,其中,N表示观测数,yi和y指2014年M1 - 2019年M12。实际和预测的旅游需求。我表6和表7给出了重庆市2019年M7- 2019年M12的实际旅游需求和拟合总体而言,2014M1- 2019M12期间采用MSV的车型表现最好,其次是2011 M1 - 2019 M12期间同时采用PSV和MSV的车型表现最好。 以BPNN的MAPE结果为例,在2011年M1 - 2019年M12期间,PSV、MSV和两者同时使用的模型的预测精度分别提高了-1.4%,17%和316.2. 理论意义与先前的文献(Li等人, 2017; Sun等人, 2019)直接使用百度指数进行分析或预测,我们首先将百度搜索量按不同来源分为PSV和MSV,并在确定百度搜索量关键词的滞后期过程中进一步添加零滞后,以分析搜索量与旅游需求的关系。通过比较关键字表6SARIMA模型的预测结果2011年M1- 2019年M12 2014年M1 - 2019年月份实际数据LR模型不T PTMTP M不TM2019年M074910.045015.745039.394991.135027.644950.624994.712019年M086182.676073.966109.846018.536089.796065.126195.292019年M095008.734894.644878.504909.394900.834905.765141.482019年M1012560.6012314.5512296.7412271.9212243.4712315.0412419.892019年M113843.853664.004096.913692.353797.854049.273748.772019年M123930.603915.393884.293888.413906.293894.863838.48Mae128.27149.27137.82117.64124.6492.99RMSE146.70170.69158.88151.32147.11101.88MAPE2.20%2.71%2.27%1.73%2.17%百分之一点七五注:1.T表示旅游需求的历史时间序列,P和M分别表示PSV和MSV2. 粗体字表示在相应的评估标准下表现最好的前2个模型MSV不是旅游需求的Granger原因23.60430.00短于后者,这可能导致模型由于数据不足而导致的训练第二,最相关的MSV2011年M1 - 2013年M12旅游需求不是PSVPSV不是旅游业的格兰杰原因需求0.005313.11160.940.00旅游需求主要产生于当期,而预测的关键词选择在1-3的滞后期区间这导致最适当的关键字的省略旅游需求不格兰杰0.02490.87原因MSVMSV不是旅游业的格兰杰原因12.52140.006. 讨论需求旅游需求不格兰杰2.90540.096.1. 结论Y. Yang等人数据科学与管理4(2021)18表7BPNN模型的预测结果注:1.T表示旅游需求的历史时间序列,P和M分别表示PSV和MSV2. 粗体字表示在相应的评估标准下表现最好的前2个模型内容和PSV和MSV的最佳滞后期,实证结果显示了游客搜索行为在不同设备之间的差异。 这些结果可以为关注网络搜索量数据的学者提供一个新的视角,例如,可以根据搜索位置或用户特征对搜索量进行分类,以进一步探讨游客的搜索行为。此外,我们采用事件研究来衡量4G发牌对搜索量和旅游需求之间的关系的影响以及搜索量对旅游需求的预测能力结果表明,4G技术带来的更快的手机上网速度,彻底改变了游客特别是越来越多的游客更喜欢使用移动设备而不是个人电脑搜索旅游信息,MSV在旅游需求预测中的重要性逐渐增加通过对以往研究较少的技术进步引起的游客搜索行为变化的调查,为未来旅游需求预测提供可行性建议6.3. 实际影响与直接使用搜索量相比,本文提出的更详细的视角更适合当前游客的搜索行为。通过分析最受欢迎的MSV关键词,酒店及旅游业从业者可以直接跟踪游客的偏好,并提前安排行程安排,如投资计划。此外,本文还论证了4G技术彻底改变了游客因此,对于酒店和旅游从业者来说,保持对新兴技术的足够关注是构建行业长期竞争力的基础。6.4. 局限性和未来研究目前,虽然百度搜索在中国搜索市场占有最大份额,但游客也可以从携程、微信和新浪微博等其他旅游服务和社交网络平台百度搜索量并不能反映游客搜索行为的总体,其他平台也提供了相应的指标来衡量用户的行为,如搜狗指数、微信指数、微博指数等。 未来的研究可以在分析和预测模型中加入更多的指标,以捕捉更多的游客行为特征。此外,虽然百度指数可以提供每日和每周的搜索量数据,但由于数据的有限性,本研究仍然采用月度数据进行建模和预测然而,作为我们的Y. Yang等人数据科学与管理4(2021)19实证研究表明,关键词对MSV的滞后期几乎为零,这意味着游客的搜索行为通常与短期旅游兴趣相对应。 毫无疑问,基于月度数据的预测模型会消除最有效的关键词,增加预测误差。因此,在未来的研究中,如果能够采用每日或每周的旅游需求数据,预测精度将有所提高致谢本研究得到国家自然科学基金项目资助。72101197和基础研究基金的中央大学根据批准号。SK2021007。竞合利益作者声明不存在利益冲突引用Bangwayo-Skeete,P.F.,Skeete,R.W.,2015.谷歌数据能否提高游客抵达的预测性能?混合数据抽样方法。旅游管理46(2月), 454- 464.Bi,J.W.,Liu,Y.,Li,H.,2020年。旅游景点日旅游量预测Ann. Tourism Res. 83(4),102923.达,Z.,Engelberg,J.,高,P.,2011年。为了寻求关注。J. Finance 66(5),1461- 1499.Dacinia Crina,P.,Florina,B.,2020.使用智能手机搜索旅游信息。计划行为理论的应用。经济计算经济赛博恩Stud.54(1),125- 140.Engle,R.F.,Granger,C.W.J.,1987.协整与误差修正-表示、估计与检验。 Econometrica55(2),251- 276.Fesenmaier,D.R.,Xiang,Z.,Pan,B.,劳,R,2011.一个用于旅游规划搜索引擎框架。J.小崔Res. 50(6),587- 601。Ginsberg,J.,Mohebbi,M.H.,帕特尔,R.S.,布拉默湖,Smolinski,M.S.,太棒了,2009年使用搜索引擎查询数据检测流行病。Nature 457(7232),1012- U1014.Goel,S.,霍夫曼,J.M.,Lahaie,S.,Pennock,D.M.,Watts,D.J.,2010年。通过网络搜索预测消费者行为。Proc. Natl. Acad. Sci. U.S.A. 107(41),17486- 17490。Gursoy,D.,McCleary,K.W.,2004.出行者的先有知识及其对信息搜索行为的影响。J.Tourism Res. 28(1),66- 94.霍角,澳-地一、林,M.- H、陈洪- M.,2012.网路使用者旅游资讯搜寻行为模式:从线上到网路。旅游管理 33(6),1468- 1482。霍角,澳-地一、林,Y.- C.的方法,袁,Y- L.,陈文C.的方法,阿尔瓦雷斯角,2016.旅行前的旅游信息搜索智能手机和使用替代信息渠道:一个概念模型。Cogent Soc. Sci. 2(1),1136110。胡,M.,肖,M.,Li,H.,2021.哪种搜索查询在旅游需求预测中更强大:通过移动终端还是PC进行搜索?Int. J. Contemp.好客。经理。33(6),2022- 2043。黄,X.,张,L.,丁,Y.,2017.百度指数:预测旅游流量的应用--以故宫为例。旅游管理58(2月), 301- 306雅各布森,J.K.S.,Munar,上午,2012年。数字时代的旅游信息搜索与目的地选择。旅游.经理。透视。 1(1),39- 47。Kang,S.,Kim,W.G.,帕克,D.,2020年。 理解旅游信息搜索行为:社会网络分析的力量和洞察力
下载后可阅读完整内容,剩余1页未读,立即下载
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功