没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报机票价格与需求预测研究综述Juhar Ahmed Abdellaa,NM Zakib,Khaled Shuaiba,Fahad Khanca阿拉伯联合酋长国阿拉伯联合酋长国阿拉伯经济联盟信息技术学院信息系统和安全系b阿拉伯联合酋长国c瑞典林雪平大学计算机视觉实验室阿提奇莱因福奥文章历史记录:2018年9月3日收到2019年1月5日修订2019年2月1日接受在线预订2019年保留字:调查票价预测需求预测价格歧视社交媒体深度学习线A B S T R A C T如今,同一航班的机票价格可能会动态变化,即使是同一机舱内的附近座位也会发生变化。客户寻求最低的价格,而航空公司则试图保持尽可能高的总收入,并最大限度地提高利润。航空公司使用各种计算技术来增加收入,如需求预测和价格歧视。从消费者的角度来看,不同的研究者提出了两类为消费者省钱的模型在本文中,我们提出了一个审查的客户端和航空公司的预测模型。我们的审查分析表明,双方的模型都依赖于有限的功能集,如历史机票价格数据,机票购买日期和出发日期。不考虑从社交媒体数据和搜索引擎查询等外部因素提取的特征。因此,我们介绍并讨论了使用社交媒体数据进行门票/需求预测的概念。©2019作者制作和主办:Elsevier B.V.代表沙特国王大学这是一CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。内容1.导言. 3752.客户端型号3772.1.最佳购票时间预测3782.2.票价预测3793.航空公司侧模型3813.1.需求预测3813.2.价格歧视3834.其他研究涉及票价和需求。............................................................................................................................................................................................................................3855.对现有工作5.1.总体评价3855.2.数据集问题3855.3.特色3865.4.技术3866.未来的方向3867.结论389参考文献389*通讯作者。电子邮件地址:nzaki@uaeu.ac.ae(NM Zaki)。沙特国王大学负责同行审查1. 介绍航空业被认为是使用复杂定价策略最复杂的行业之一。如今,对于同一航班,甚至对于附近的座位,机票价格可以动态地且显著地变化(Etzioni等人,2003; Narangajavana等人, 2014年)。特定航班的机票价格最多可更改https://doi.org/10.1016/j.jksuci.2019.02.0011319-1578/©2019作者。制作和主办:Elsevier B.V.代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.com376J.A. Abdella等人/沙特国王大学学报每天7次(Etzioni等人, 2003年)。客户正在寻求以最低的价格购买机票,而航空公司则试图保持尽可能高的总收入,并最大限度地提高利润。然而,可用座位和乘客需求之间的不匹配通常会导致客户支付更多费用或航空公司损失收入。航空公司一般都配备了先进的工具和能力,使他们能够控制定价过程。然而,随着各种在线工具的发展,客户也变得更具战略性,以比较不同航空公司的价格(Li等人,2014年)。此外,航空公司之间的竞争使得这项任务对每个人来说都很难确定最优定价在过去的二十年里,针对客户和航空公司的研究稳步增加。客户侧研究的重点是为客户省钱,而航空公司侧研究的目的是增加航空公司的收入。进行的研究采用了各种技术,从统计技术,如回归到各种先进的数据挖掘技术。从客户的角度来看,确定最低价格或最佳购票时间是关键问题。“提前买票更便宜”的概念有可能早买一张票的顾客比晚买同一张票的顾客付的钱多。此外,提前购买意味着对具体时间表的承诺可能需要改变,通常需要付费。票价可能会受到几个因素的影响,因此可能会不断变化 为了解决这个问题,进行了各种研究以支持客户确定最佳的门票购买时间和门票价格预测(AnastasiaLantseva等人,2015; Chawla等人,2017; Domínguez-Menchero等人, 2014; K.Tziridis等人,2017年; Li等人,2014; Santana等人,2017; T. Liu等人,2017; T. Wohlfarth等人,2011; V. H等人,2018; WilliamGroves和Maria Gini,2013; William Groves和Maria Gini,2015;Y. Chen等人,2015; Y. Xu和J. Cao,2017)。大多数在顾客方面进行的研究集中在使用统计方法预测最佳购票时间的问题上。正如Y所指出的。Chen等人(2015),预测实际机票价格是一项比预测最佳机票购买时间更困难的任务,这是由于各种原因:缺乏足够的数据集、影响机票价格的外部因素、机票定价的动态变化、航空公司之间的竞争、航空公司机票定价政策的专有性质等。然而,很少有研究试 图 用 作 者 在 ( Anastasia Lantseva 等 人 , 2015; Domínguez-Menchero 等人,2014; K. Tziridis 等人,2017; Santana 等人,2017; T. Liu等人,2017; V. H等人,2018年,作为例子。在航空公司方面,主要目标是增加收入,利润最大 根据Narangajavana等人的说法, 2014年,航空公司利用各种定价策略来确定最优机票价格:长期定价策略、描述生产条件对机票价格影响的收益定价以及主要与响应各种影响因素动态调整机票价格相关联的动态定价。长期定价政策和收益定价与特定航空公司的内部工作有关,对预测价格的动态波动没有多大帮助。另一方面,动态定价使得能够基于诸如需求和价格歧视的变化等活跃因素对票价进行更优化的预测(Malighetti等人,2009年)。然而,由于动态定价受到内部因素、外部因素、航空公司之间的竞争以及战略客户等多种因素的影响,因此具有挑战性。内部因素包括历史机票价格数据、购票日期和离店日期、季节、节假日、供应(可用航空公司和航班数量)、票价等级、座位可用性、近期市场需求飞行距离。外部因素包括诸如在始发地或目的地城市发生某些事件(如恐怖袭击、自然灾害(飓风、地震、海啸等))的政治不稳定(抗议、罢工、政变、辞职)、音乐会、节日、会议、政治集会和体育赛事、竞争者图1是一个图解,说明在确定动态定价时顾客和航空公司之间的相互作用. 1.一、一般来说,动态定价可以被认为是零售商和消费者之间的博弈,每一方都试图最大化自己的利润(Y。Wang,2016)。航空公司希望通过以最高价格出售尽可能多的机票来增加然而,门票必须在有限的时间范围内出售,因为长时间等待可能会因未售出的座位而造成更多损失。另一方面,客户希望以最低的价格购买机票,并继续监控各航空公司的机票价格,直到机票价格下降。此外,客户随机到达,需求可能随时变化。因此,为了在这种复杂的情况下盈利,航空公司必须根据当前的需求,客户的行为,市场竞争对手的机票价格以及其他内部和外部因素动态调整机票价格Wang,2016; Yiwei Chen和Vivek F. Farias,2015)。这种根据各种影响因素动态调整票价的做法上述研究(Malighetti等人,2009;Narangajavana等人, 2014; Y. Wang,2016; Yiwei Chen和VivekF. F a r i a s ,2015)解释说 ,动态定价是通 过 以 下 方 式 实现的 :航空公司作为最常见的价格策略之一然而,他们没有讨论用于实施动态定价的不同类型的预测方法。大量的研究工作提出了航空公司动态定价的预测模型,可以分为两类:需求预测(BoAn等人,2016年; Bo An等人,2017;Chieh-HuaWen andPo-Hung Chen,2017; Diego Escobari,2014; H. Yuan等人,2014; Jie Liu等人,2017 a,b;Mumbower等人,2014年)和价格歧 视 ( EfthymiosConstantinides 和 Rasha HJ Dierckx , 2014 年 ;Mantin Benny和Bonwoo Koo,2010年; Marco Alderighi等人,2011;Steven L.Puller和Lisa M.Taylor,2012)。对给定航线的需求进行早期预测可以帮助航空公司预先计划航班并确定航线的适当定价。现有的需求预测模型通常试图预测乘客对个别航空公司的单一航班/航线及市场占有率。价格歧视允许航空公司根据客户的支付意愿对他们进行分类,从而向他们收取不同的价格。客户可以根据各种标准分为不同的群体,如商务与休闲,旅游与普通旅行者,职业等。例如,商务客户将支付更多的休闲客户相比,因为他们更注重服务质量比价格。尽管事实上,有几个研究进行了双方,客户和航空公司,没有试图提出一个文献调查和审查现有的工作。因此,本文的主要目的是提出一个全面的文献综述,现有的研究与这一主题,可以利用未来的研究者。我们首先分类和现有的研究分为两类,根据他们的预期目标(客户端模型和航空公司端模型)。然后,我们根据正在解决的具体问题对现有讨论了几个问题,包括数据来源、特征和用于预测的各种我们相信,这对于致力于这一令人兴奋的研究领域的研究人员来说是一个重要的贡献。我们的回顾的结果之一表明,现有的模型通常依赖于有限数量的功能,这是不够有效的预测票价。例如,客户端J.A. Abdella等人/沙特国王大学学报377Fig. 1. 动态定价。模型通常利用从历史票价数据、购票日期和出发日期提取的受限特征。同样,航空公司方面的模型也是根据有限的内部因素开发的,如季节性、假期、供应(可用航空公司和航班的数量)、票价等级、座位可用性、最近的市场需求、飞行距离和其他航空公司的竞争举措等。然而,机票价格和乘客需求也会受到前面提到的许多动态外部因素的影响。尽管早期研究者使用的属性在预测门票定价/需求方面发挥了重要作用,但将这些外部因素纳入其中也可能导致更好的结果。如今,社交媒体情感分析已经成为各种数据挖掘模型的良好信息来源。例如,社交媒体数据已被用于事件预测(A. Dingli等人,2015;Arif Nurwidyantoro和Edi Winarko,2013; Hila Becker等人,2012;Mario Cordeiro,2012; Nikolaos Panagiotou等人,2016; TakeshiSakaki等人,2010; Xiaowen Dong等人,2015),竞争对手情报( Lipika Dey 等 人 , 2011; Malu Castellanos 等 人 , 2011; MartinLängkvist 等人 ,2014; 吴 和例如 , 2015 ), 价格 预测 (A.Porshnev等人,2013; J. SantosDomínguez-Menchero等人,2014; L.Bing等人,2014; L.Li和K. Chu,2017)和旅游交通流预测(R. Linares等人, 2015年,还有更多。可以采用类似的方法来提取与影响航空公司乘客需求和机票价格的各种外部因素有关的有用的社交媒体信息例如,对不同的twitter主题标签的分析可以给出关于在出发地/目的地城市的事件的存在、竞争对手的促销、旅游交通流量、天气状况、经济活动等的有价值的信息这反过来可能使我们能够预测票价/需求的变化预期利用从社交媒体数据产生的信息的数据挖掘模型然而,据我们所知,目前还没有利用社交媒体数据来预测路线需求和/或票价的工作所以在这本文还讨论了使用社会媒体数据来提取一些外部特征的概念,这些外部特征可以更好地预测票价和需求。本文的其余部分组织如下:我们在第2节中回顾了客户端模型。第3节介绍了航空公司侧模式我们总结了现有的工作,并在第4节中对现有的工作进行了第5节讨论了基于深度学习和社交媒体数据的门票/需求预测第六部分对全文进行总结和归纳2. 客户端模型尽管多家航空公司和在线旅行社(OTA)实施了各种机票定价策略,但没有足够的研究论文讨论这一主题。这可能是由于两个原因:首先,门票定价策略是高度商业敏感的,并且仍然是所有者公司的专有(Etzioni等人,2003年)。由于与其他航空公司的竞争,大多数航空公司不透露其机票定价策略其次,缺乏可供研究人员有效进行预测的公开数据集。因此,研究人员不得不依赖于使用Web报废程序收集的小数据集。然而,存在有限的工作,其提出了用于门票价格预测的各种技术,而不管可用的有限资源(AnastasiaLantseva等人,2015; Chawla等人,2017; Domínguez-Menchero等人, 2014; K.Tziridis等人,2017年; Li等人,2014; Santana等人,2017; T. Liu等人,2017; T. Wohlfarth等人,2011; V. H等人,2018; WilliamGroves和Maria Gini,2013; William Groves和Maria Gini,2015;Y. Chen等人,2015; Y. Xu和J. Cao,2017年)。在顾客方面进行的研究可以大致分为两类:试图预测最佳购票时间的研究(Etzioni等人 , 2003; Li 等 人 , 2014; T. Wohlfarth 等 人 , 2011; WilliamGroves 和 Maria Gini , 2013; William Groves 和 Maria Gini ,2015)以及那些提出解决方案来预测精确378J.A. Abdella等人/沙特国王大学学报票价的价值(AnastasiaLantseva等人,2015; Domínguez-Menchero等人,2014; K. Tziridis等人,2017; Santana等人,2017; T. Liu等人,2017年; V.H等人, 2018年)。2.1. 最优购票时机预测最佳购票时间预测的先驱之一可能是(Etzioni等人,2003)所做的工作。作者提出了一个模型,建议用户是否购买门票或在特定时间点等待。对于每个查询日,模型根据历史价格信息生成买入或等待信号。该模型使用各种数据挖掘技术,如规则学习(Ripper),强化学习(Q-learning),时间序列方法以及这些方法的组合,以实现各种准确度。Q-learning和Ripper基于一组训练数据来预测新航班数据的行为,而时间序列方法基于同一航班的历史价格数据使用移动平均来预测航班的价格特性。约12,000个历史票价数据代表了两条路线的41个出发日期,用于分析。该数据集具有局限性,其中收集仅从出发前21天开始。此外,考虑了恒定的7天往返。该模型使用的特征包括航班号、离起飞的小时数、当前价格、航空公司和路线(出发地和目的地城市)。模拟是用来衡量节省乘客获得由于这些数据挖掘方法。模型的节省(或损失)性能通过计算由于较早购买点的票价与算法推荐的时间的票价之间的价格差而产生的成本来计算。最好的准确性(61.9%,相比最佳储蓄)是从研究中使用的所有技术的组合实现的。根据(William Groves和Maria Gini,2013),(Etzioni等人,2003)提出的模型已经被实时实现用于被称为Bing Travel的流行机票搜索网站,作为“与Etzioni等人,2003密切相关的工作也是有利的。由(William Groves和Maria Gini,2013)提出,其预测最佳购票时间,并且实际上受到(Etzioni等人,2003年)。然而,与Etzioni等人,2003年不同,WilliamGroves和Maria Gini,2013年可以预测给定出发日期和路线的所有可用航班的最佳购买时间。此外,他们使用的数据集是在出发日期前60天收集的该数据是从2011年2月22日至2011年6月23日使用OTA网站的每日报价收集的,为期3个月每个查询返回来自所有航空公司的单个航线的大约1,200个报价往返行程基于恒定的5天往返行程。两种类型的特征用于分析:确定性特征和聚合特征。确定性特征的示例包括离港天数和报价星期几,即在不同航空公司的特定路线上的给定航班上可用的不同票价的数量聚合特征是从历史数据中提取的特征,例如最低价格,平均价格和报价数量最低价格、平均价格和报价数量是针对个别航空公司和所有航空公司的直飞、一站式和多站航班计算的。此外,滞后特征的计算也被用来考虑时间延迟观测的预测效果。四种回归技术用于生成用于分析的回归模型:偏最小二乘(PLS)回归和三种机器学习算法(决策树、nu-Support Vector Regression(nu-SVR)和RidgeRegression)。(William Groves和Maria Gini,2013)中的研究使用了与(Etzioni et al,2003)相似的方法通过对一条路线256次模拟采购的实验分析,与最优模型相比,最优模型节省了75.3%。上述作者还提出了另一种基于各种机器学习技术的购票时间优化模型( William Groves 和Maria Gini, 2015 )。 机器 学习 方法 包括REPTree分类器和四种回归模型(PLS回归、RepTree回归、Ridge回归和nu-SVR回归)。使用与(William Groves和Maria Gini,2013)类似的数据,但收集了109天内7条路线的数据,总计2350万次报价,其中每条路线的每次查询平均给出1,200次报价。此外,他们将109天的数据集分为3部分:48天,20天和41天,并分别将其用作训练数据集,验证集和测试集。在(William Groves和Maria Gini,2015)中也考虑了(William Groves和Maria Gini,2013)中未使用的其他方法,包括用户引导的功能选择方法和处理特定客户偏好,例如直飞航班、特定起飞时间的航班或来自特定航空公司的航班。通过对7条路线的实验分析,采用PLS回归方法,最佳结果为69%(与最优结果一致)。作者在(T. Wohlfarth等人,2011)提出了一种基于标记点过程(MPP)、数据挖掘技术(聚类和分类)和统计分析技术的最优购票时间优化模型。建议使用MPP预处理技术,将国际、国内、长途和短途航班、不同供应商(低成本和定期)等异构价格系列数据转换为可供无监督聚类算法使用的内插价格系列轨迹。一旦MPP步骤完成,该模型应用聚类,然后对历史价格数据进行分类和统计处理技术,以开发价格下降事件预测规则。首先,基于相似的定价行为将价格序列轨迹聚类成组。接下来,价格演变模型,估计价格变化模式出发日期为每个集群定义。对于一个新的测试数据集,一个基于树的分类算法被用来选择最佳匹配的集群,然后相应的价格演变模型定义的集群被用来预测价格下降事件。本研究使用的数据集来自Liligo.com它涵盖了来自9家航空公司的6条航线的数据。与其他人不同,本文还考虑了3天,7天和14天的往返旅行。分析中的特征集包括:出发站、到达站、出发日期、返回日期、供应商、星期几、月份几、年份几和需求。作者声称,与Etzioni等人,2003年相比,该模型实现了55%的性能。但是,没有细节的性能评价步骤。Domínguez-Menchero等人的研究,(2014年)A该模型基于非参数保序回归技术,针对特定航线、时间段和航空公司预测最佳购买时间。该模型确定了在不明显涨价的情况下,用户在购票前可能等待的最大天数以及因延迟购票而造成的每日金钱损失。两种类型的变量被认为是预测:价格和购买日期。作者分析了四条航线的直飞和一站式航班的基础上,为期两个月的每日价格信息,提取起飞日期前30天。他们发现,出发前18天内未造成重大经济损失。作者声称,等渗方法的优势在于,其他类型的回归技术(例如线性回归)无法实现这种效果。该论文(Chawla等人,2017年)调查了门票价格对某些因素的依赖性,并建立和比较了各种类型的预测模型,这些模型咨询用户是否购买门票或等待一段时间以获得门票。J.A. Abdella等人/沙特国王大学学报379×在给定的路线和出发日期的定期航班。本文考虑了五个因素,其中包括在其他研究中没有得到太多关注的因素:油价、中途停留次数、出发前天数、出发的工作日和航线上的竞争者数量。两种不同的监督学习方法已被用于建立这些模型:基于回归的建模和基于分类的建模。在这两个类别下考虑了若干技术。基于朴素贝叶斯技术建立的模型被认为是最准确的。它是基于收集了2个月的数据进行测试,能够达到84%的准确率与之前基于过去静态价格数据进行局部(短周期,例如每天)最佳购买时机预测的模型不同,(Y. Xu和J. Cao,2017)提出了一种最佳购买决策支持系统,该系统允许在出发日期前几天基于实时动态价格特征和多步预测以及历史价格数据连续推荐最佳购买时机。该系统采用两种单步时间序列预测模型:MA(移动平均)和CART(分类和回归树)回归作为多步预测的基础多步预测是基于单步预测的结果递归建立一种被称为线性判别分析(LDA)和贝叶斯分类方案的统计方法被用来将出发前的天数分类为“购买”和“等待”标签,Manan Dedhia等人最近的工作, 2018)还提出了一种基于逻辑回归机器学习技术的最优购票时机预测系统。该模型建议用户购买车票或等待一段时间。最佳购票时间预测模型汇总见表1。2.2. 票价预测上一节讨论的所有研究都提供了一个模型,可以预测客户的最佳购买时机然而,预测实时航班价格并没有被考虑。理解这个差距,Y.Chen等人,(2015)提出了一个模型,预测给定行程(特定出发日期的给定路线上的特定航班)的最低价格。 更准确地说,给定当前日期d 1和由路线r和出发日期d n标识的特定行程(r,d n),模型预测连续日期d 2,d 3. 其中d1 d2 d3 dn-1 dn。然而,该模型只考虑直飞航班。此外,不可能预测单个航班的价格,因为它在航线一级起作用。对基于集成的学习算法Learn++.NSE进行了修改和训练,以增量地从过去的价格变化模式中学习并预测未来的价格。递归策略用于迭代地估计多个未来价格,即来自先前预测的价格用于在多个步骤中预测下一个价格。该模型使用相同行程的价格该模型是在一个日常价格数据集上进行测试,该数据集是从中国的一家OTA公司提取采集时间超过3个月(2015年2月11日至6月1日,共110天)。每一天,每一条路线都记录了未来60天出发的行程的最低价格,总共有11060次观察。实验结果表明,该模型在不同航线上表现得相对较好,即不同航班的定价行为完全相互独立,但价格水平和变化幅度不同,没有普遍的模式。Learn++.NSE,KNN和被动攻击(PA)来查看它们的相对性能。与KNN(12.58)和PA(15.41% )相比,该模型实现了最低的平均绝对百分比误差(MAPE),为10.7%。Anastasia Lantseva等人,2015)提出了基于经验数据驱动的回归模型的门票预测模型。该模型预测了出发日期前90天内给定航班的每公里价格。该研究基于2015年春季从两个独立的机票价格信息聚合器(AviaSales和Sabre)收集的数据,考虑了两种航班(本地和国际)。对于当地航班,他们使用了从两个俄罗斯城市(莫斯科和圣彼得堡)飞往50个俄罗斯当地城市的航班。从同一两个城市(莫斯科和圣彼得堡)飞往40个国际目的地的航班被认为是以欧洲城市为主的国际航班。每天每个航班的最低价格是在AviaSales的75天和Saber的90天内收集的。用于构建模型的特征包括:出发城市、目的地、购票日期、出发日期、机票选项与价格。基于所提出的模型,作者比较了提前购票对本地和全球航班的机票价格的影响。结果发现,国际航班提前购票具有优势,而国内航班则需要额外的调查才能得出具体的结论。作者没有提供模型的性能评价。此外,Anastasia Lantseva等人,2015年)是有限的,因为它是在很短的时间内收集,也为特定的 路线。该研究由(T。Janssen,2014)使用线性分位数混合回归模型,以预测最低机票价格将发生在60天内起飞前。该方法仅使用具有低价观测值的五分位数代替全部价格观测值来预测最低价格。模型中考虑了四个变量:价格、出发日期、观察日期、离出发还有多少天以及表示星期几(周末或工作日)的特征。研究所用的数据包括2271个航班,共126,412条记录,对应于6条航空公司在起飞前60天内收集的该数据集仅限于直飞航班的单程旅行休闲检验结果表明,该模型在离港前较短时间内表现良好,但随着离港前天数的增加,该模型趋于纸(K。Tziridis等人,2017)比较了八种最先进的回归机器学习(ML)模型在预测机票价格方面的性能。所考虑的八个模型包括多层感知器(MLP)、广义回归神经网络、极限学习机(ELM)、随机森林回归树、回归树、Bagging回归树、回归SVM(多项式和线性)和线性回归(LR)。此外,本文还试图找出对机票价格预测影响较大的因素。研究的因素包括出发时间、到达时间、免费行李数量、出发前天数、中途停留次数、等待时间、一天中的时间和星期几。这些模型是基于由单一国际航线的1,814个航班组成的数据集进行训练的。结果表明,“套袋回归树”模型的预测精度最高,为87.42%,其次是随机森林回归树,为85.91%。类似于(Y。Chen等人,2015),提出了一种集成回归算法(T. Liu等人,2017),用于预测在购买日期和给定出发日期之间的几天内在特定路线上可用的最低价格。该算法采用k-近邻、随机森林和贝叶斯等多种机器学习技术作为基本学习器,通过特征聚类建立集成学习模型。该模型考虑了历史票价、信号特征、时间特征和时间特征三种特征,380J.A. Abdella等人/沙特国王大学学报--表1最优购买时间预测模型综述。参考文献解决问题数据集特征使用的计算技术性能结果话Etzioni等人,(2003年)威廉·格罗夫斯和玛丽亚·吉尼(2013)威廉·格罗夫斯和玛丽亚·吉尼(2015)T. Wohlfarth等人,(2011年)预测最佳购票时间预测最佳购票时间预测最佳购票时间预测最佳购票时间在41天出发前60天收集三个月的数据。数据与上述相同,但有7条路线从9家供应商收集了6条路线的28天数据。它还考虑了3、7和14天航班号、离起飞的小时数、当前价格、航空公司和航线离港天数、报价周天数、最低价格、平均价格、报价与上述相同,但除了滞后功能选择之外,出发站、到达站、出发日期、返回日期、供应商、星期、月份、年份、需求规则学习(Ripper)、强化学习(Q学习)、时间序列方法以及这些方法决策树,nu-SVRRidgeRegression决策树(RepTree),PLS回归,RepTree回归,岭和nu-SVR用于预处理、聚类、分类和统计分析与最佳节省相比,平均节省61.8%。与最佳节省相比,节省75.3%。通过对7条路线的分析测试,使用PLS回归,69%(与最佳相比)。与Li等人, 2014年度)- 数据集- 功能数量有限- 只考虑7天往返- 不考虑异类航班- 不考虑异类航班- 只考虑7天往返- 不考虑异类航班- 只考虑7天往返未提供详细的性能评估步骤。多明格斯门凯罗例如,(2014年)购票前等待的最长2个月的每日价格信息在出发日期价格和购买日期非参数保序回归–评价Chawla等人,(2017年)Y. Xu和J. 曹,(2017)比较机器学习算法的最优购票时间预测最优购票决策支持系统2个月数据油价、停靠次数、出发前天数、出发周天数和竞争对手–基于回归的建模和基于分类的建模- 使用两个单步预测模型的多步预测:移动平均和分类回归树。使用朴素贝叶斯技术的准确率为84%–nal表示出发日期是否为节假日以及出发前的天数。该方法还根据上下文动态地自适应调整特征,以获得更准确的结果.显示出发日期是否是假日的信号是被认为是上下文信息的特征之一。该模型基于由19条不同路线组成的数据集进行训练和测试,时间跨度为三个月(92天)。该算法已被证明是执行更好的com-course单基地学习者表示的平均绝对百分比误差(MAPE)的评价指标,其中错误已从(7% 12%)改善到(3.7%6%)。另一篇研究论文(William Groves和Maria Gini,2011)通过结合传统的机器学习算法开发了一种称为堆叠预测模型的价格预测模型。为了确定使用哪种机器学习技术,作者首先基于三个评估指标:R-squared(R2),平均绝对误差(MAE)和均方误差(MSE)评估了几种机器学习算法的性能,包括随机森林,决策树,多层感知器,支持向量机,k-最近邻,AdaBoost和梯度提升。随机森林和多层感知器是表现最好的两个。因此,通过应用两个性能最佳的模型(即随机森林和多层)Perceptron)通过赋予它们不同的权重。该模型基于机票数据进行训练,该数据由三家国内航空公司在出发日期前21天收集的7天往返直飞航班的51,000条记录组成。但是,数据中未考虑国际和多站航班从数据中提取了总共12个预测特征:航空公司,航班号,购买日期,出发日期,出发时间,到达时间,票价等级,停留次数,价格,出发机场,到达机场和到达日期。基于R2评价指标,堆叠预测模型分别优于随机森林和多层感知器,分别为4.4%和7.7%其他最近的作品也存在门票价格预测。博鲁阿A.例如,(2018)试图使用著名的贝叶斯估计技术(称为卡尔曼滤波器)来预测门票价格。提出了一种基于卡尔曼滤波线性模型的航班票价预测算法。该模型利用从先前票价的观察中得到的特征,其中观察到的数据以类似于线性卡尔曼滤波器模型的矩阵的形式作为输入给出。Yuling Li和ZhichaoLi(2018)使用ARMA算法和随机森林算法的组合设计并实现了一个票价预测该模型使用Python语言和SQLServer数据库实现。J.A. Abdella等人/沙特国王大学学报381表2门票价格预测模型概述。参考文献解决问题数据集特征使用的计算技术性能结果话Y. Chen等人,(2015年)最低票价预测5 条 国 际 航 线 3 个 月( 110 天 ) 以 上 数据。同一行程价格、目标日之前的最近行程价格、同一周的行程价格、同一月的行程价格对基于集成的学习算法Learn++.NSE进行了改进和使用平均绝对百分比误差(MAPE)为10.7%,与KNN(12.58)和PA(15.41%)。- 无法预测航班价格- 不考虑多站航班Anastasia Lantseva等人,(2015年)每公里票价预测收集75天和90天的本地和国际航班机票价格数据。出发城市、目的地、购票日期、出发日期、机票选项和价格未给出回归模型-未提供性能评估- 的数据集集有限(K. Tziridis等人,(2017年)比较回归机器学习模型预测机票价格。一条国际航线的1814个航班数据集出发时间、到达时间、免费行李数量、出发前天数、中途停留次数、节假日、一天中的时间和星期八种回归机器学习模型Bagging回归:87.42%,准确率和随机森林回归树:85.91%。精度T. Liu等人,(2017年)预测出发前最低价格V. H等人,(2018)票价预测T. Janssen,(2014)预测出发前最低票价数据由19条不同的路线组成,跨越三个月(92天)。国内三家航空公司2,271个航班,共收集了126,412条记录,对应于出发前60天历史机票价格,指示出发日期是否为假期以及出发前天数的信号航空公司,航班号,购买日期,出发日期,出发时间,到达时间,票价等级,停留次数,价格,出发机场,到达机场,到达日期价格,出发日期,观察日期,出发前天数和星期几(周末或工作日)使用K-最近邻、随机森林和贝叶斯等技术的包围模型一种称为堆叠预测模型的模型。随机森林与多层感知机模型线性分位数混合回归模型将MAPE从(7%-12%)提高到(3.7%至 6%)。与单一模式4.4%和7.7%分别优于随机森林和多层感知器(通过R2测量),在较短时间内表现良好,但在较长时间只限单程及直达航班的休闲机票所讨论的票价预测模型的总结如表2所示。3. 航空公司侧模型航空公司侧模型代表针对航空公司和OTA获得的利润的研究。在这方面的文献中存在两大类研究。第一组提出了需求预测模型(BoAn等人 , 2016 年 ; Bo An 等 人 , 2017;Chieh-Hua Wenand Po-HungChen,2017; Diego Escobari,2014; H. Yuan等人, 2014; Jie Liu等人,2017 a,b; Mumbower等人,2014;)而第二组侧重于价格歧视( EfthymiosConstantinides 和 Rasha HJ Dierckx , 2014; MantinBenny和Bonwoo Koo,2010; Marco Alderighi等人,2011; StevenL.Puller和Lisa M.Taylor,2012)。3.1. 需求预测在最近进行的关于路线需求和市场份额预测的工作中,有一项研究是由(BoAn等人, 2016年)。 提出了一种通过预测航线需求量和市场占有率来实现航空公司利润最大化的数据挖掘技术。本文还提出了两种算法(双层分支定界算法和贪婪算法),航班,同时利用航线需求和市场份额预测使用所提出的预测模型。所提出的预测模型是一个包围预测(MAP-EF)技术。它是在现有航线需求和市场份额预测模型、聚类技术和博弈论分析的基础上开发的。利用几个特征预测市场份额和航线需求。所使用的特征包括:票价、航空公司运营的航班数量、航空公司过去的与大多数其他作品不同,这项工作考虑了13家航空公司在这些航线上运营的一系列广泛的航线(约700条航线)。训练数据集跨越10年(40个季度),测试集包括2015年第一季度(共9100个预测)。然而,预测是每季度进行的,而不是在可能不考虑动态需求变化的短时间内进行的。此外,所考虑的路线仅为美国的国家路线。该数据集来自美国办公室的4个公开数据来源:运输统计局(BTS),经济分析局(BIA),国家运输安全委员会(NTSB)和美国人口普查局(CensusBureau)该模型基于三个性能指标优于以前的模型:皮尔逊相关系数(CC)、R2和均值382J.A. Abdella等人/沙特国王大学学报--绝对误差(MAE)。相关系数为0.95的市场份额和0.98的需求相比,0.82和0.77以前的模型。然而,与以前的模型相比,该模型具有更高的时间开销,因为聚类和更先进的回归方法的额外时间。上述作者在另一篇文章中提供了他们工作的扩展(Bo An et al.,2017年),他们在基本的基于频率的利润最大化算法中引入了两个新概念,以捕捉航空公司在决定航班频率时的保守性:有限频率和长期利润。更严格的频率界限捕捉到这样一种情况,即航空公司只对频率进行有限的改变,即使将频率改变一个大的数字更有利可图。第二种情况表示航空公司试图通过保留目前可能不会带来利润的高频号码来“赶走”其他竞争航空公司并获得潜在的未来利润。综合考虑这两个因素,得出了更好的利润最大化结果,证明了航空公司在改变航班频率时是保守的,更关心长期利润。该扩展还研究了如何计算多个航空公司具有战略性并独立改变其频率的情况下的最佳频率和prof- its(原始方法假设只有一个航空公
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功