没有合适的资源?快使用搜索试试~ 我知道了~
数据科学与管理5(2022)43研究文章基于汽车售后市场数据的间歇性需求组合预测方法庄晓天a,俞颖a,b,陈爱辉b,c,*a京东真视信息技术有限公司智能供应链部,有限公司、中国北京,邮编:100176b天津大学管理与经济学院,天津,300072c天津大学青岛海洋工程学院,青岛,266207A R T I C L E I N F O保留字:智能供应链管理间歇性需求组合预测机器学习迁移学习A B S T R A C T间歇性需求预测是智慧供应链转型过程中的重要挑战,准确的需求预测可以为企业降低成本,提高效率提出一种基于内外部数据的间歇性需求组合预测方法,从机器学习的角度构建间歇性需求特征工程,通过分类模型预测需求的发生,通过回归模型预测非零需求量基于库存侧的策略选择和补货侧的库存需求,重点研究了分类问题的优化,结合企业内外部数据,分别提出了基于最佳分类阈值搜索和迁移学习的组合预测优化方法基于汽车售后业务的真实数据,从多个维度对这些方法进行了评价和验证。与其他间歇性预测方法相比,本文提出的模型在分类精度和预测精度方面都有显著提高,验证了间歇性需求组合预测框架的潜力,并为该框架在行业实践中的应用提供了实证研究。研究结果表明,该研究能够进一步为智能库存提供准确的上游输入,保障供应链智能决策的准确性和效率。1. 介绍需求预测是智能供应链管理的重要组成部分这是因为它是计划活动的重要基础,例如库存管理和与库存管理的各个方面相关的准确预测(Syntetos和Boylan,2001),例如, 生产规划、营销规划、采购规划、库存规划、调度操作、车辆调度和网络规划(Kolassa,2016; Ma和Fildes,2017)。需求预测贯穿于整个供应链和制造过程。 它是应对供应链中不确定性的关键,为后续阶段的决策提供依据,并提高供应链的可操作性。供应链的效率和灵活性 库存控制可以从准确的需求预测中获益匪浅。此外,保持适当的库存水平可以为公司节省大量不必要的库存成本,提高客户满意度,并通过避免缺货带来更多收入。因此,较低的库存成本和较高的服务水平需要更准确的预测结果(Ghobbar和Friend,2003)。间歇性需求(ID),也称为零需求,是一种在许多时期对产品的需求为零的现象(Shenstone和Hyndman,2005)。这种现象在售后市场行业中特别常见(Willemain等人, 2004),以及在航空航天、计算机部件、电子和工业机械工业中。需求预测通常包括三个方面同行评议由Xi交通大学负责* 通讯作者。电子邮件地址:aihui@tju.edu.cn(A. 陈)。https://doi.org/10.1016/j.dsm.2022.04.001接收日期:2021年12月15日;接收日期:2022年4月3日;接受日期:2022年4月7日2022年4月22日在线提供2666-7649/©2022 Xi'an Jiaotong University.出版社:Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表数据科学与管理杂志主页:www.keaipublishing.com/en/journals/data-science-and-managementX. Zhuang等人数据科学与管理5(2022)4344×dimensions:仓库维度(仓库、商店等),产品维度(库存单位、类别等)以及时间维度(每日、每周、每月等)。(Syntetos等人,2016年)。在许多情况下,非间歇性数据在细粒度的数据分解级别上是间歇性的。例如,以从数月到数天的时间粒度进行预测会导致大量间歇性数据,并且由于缺货或低需求而导致的零需求经常出现在零售商店维度中。面临高淘汰风险的SKU可能已接近其产品生命周期的终点。因此,准确的预测对这些项目尤为重要(Patton和Steele,2003). 长期以来,间歇性需求一直是供应链需求预测领域的一个难点,预测方法和评估指标可能更具挑战性。 在现有的预测文献中,已经对快速移动的时间序列的建模和因果模型的构建给予了很多关注(Bozos和Nikolopoulos,2011;Nikolopoulos等人, 2007; Nikolopoulos和Tho-makos,2019;Petropoulos等人,2014年)。然而,对间歇性需求预测的关注非常有限(Nikolopoulos等人, 2011年)。大多数人普遍认为间歇性需求预测方法似乎只适用于备件需求预测。事实上,这是一个不准确的假设,因为在任何商品库存领域,无论是备件还是消费品,60%的SKU都表现出间歇性特征。(Syntetos等人,2016年)。这是因为销售的长尾往往是产品中被大家忽视的部分,而这部分的总数并不在少数,仅仅是因为它的销售量不够高,不够显眼。一些研究认为,这些SKU应该得到最高水平的服务(Knod和Schonberger,2001)。这一论点在很大程度上是基于这些SKU的总体贡献。当单独查看时,这些SKU似乎相对不重要;然而,当将它们作为一个整体考虑时,情况发生了巨大变化。 与此同时,这一类别中有大量昂贵的物品,如果按价值排名,也需要额外的关注和处理(Nikolopoulos等人, 2011年)。此外,当我们假设间歇性数据服从独立同分布时,事情变得更加棘手,因为人们很难从间歇性数据中找到相应的性能。系列(Petropoulos等人,2014年)。间歇性需求序列具有大量的零,不具有明显的变化模式,如趋势性和季节性,通常表现出极不规则的特征。因此,对间歇性需求的预测已经被学术界认为是一个挑战(Swain和Switzer,1980; Tavares和Almeida,1983; Watson,1987; Willemain等人, 2004年)。 Croston(1972)提出了一种预测方法,该方法将间歇性需求序列分解为需求量和需求区间两个连续序列,分别计算需求区间和需求量,然后采用指数平滑算法对这两个连续序列进行预测,得到最终结果。 受Croston(1972)的启发,Kourentzes(2013)还预测了两个组件的间歇性需求。他使用神经网络方法来更新需求间隔和需求规模的值,取代了Croston方法中使用的简单移动平均值。 神经网络方法将非零需求和需求间隔之间的关联纳入模型中,从而产生动态需求率。 尽管预测结果不佳,神经网络方法提高了库存服务水平,同时保持库存持有成本。Kourentzes(2013)之后,许多学者尝试从组合模型的角度研究分段预测,即分别预测需求发生和需求量Jiang等人(2020)提出一种方法,将间歇性需求数据分为零值和非零值两部分,并将非零值拟合到混合零截断泊松模型中。当需求发生时,他们使用混合零截断泊松模型的加权平均值这些数据会与预测的需求情况合并,以形成最终的预测需求数列。Roanec及Mladeni(2021)提出一个组合模型,显示在预测需求事件发生时,全局分类模型是最佳选择,而在预测需求规模时,使用简单E ×势平滑(SES)预测取得最佳结果。综上所述,目前大多数研究并没有关注间歇性需求预测中的分类问题,并且时间序列模型通常给出有偏差的平均预测。 只要在最近的一般时期有非零的需求,就只有对未来的非零预测。这将对实际业务运营的补货端产生很大压力,如库存成本和积压成本。因此,提高需求发生的分类精度是一个关键问题。现有的研究在试图解决分类问题时,没有综合考虑需求发生的特征因素,而仅仅依赖于时间序列本身的特征。然而,机器学习可以通过特征工程和交叉训练全面捕捉全球影响。 越来越多的研究表明,全局机器学习时间序列模型(用多个时间序列构建的模型)比局部模型(用单个时间序列构建的模型)提供更好的结果(Bandara等人,2020; Salinas等人, 2020年)。基于上述实际业务问题和间歇性需求预测的困难,本文提出了一种基于内部和外部数据的间歇性需求组合预测方法--间歇性需求组合预测(IDCF)。基本方法将问题分为两部分。第一部分的分类模型给出了需求发生的概率,第二部分的回归模型给出了非零需求的规模。最后,将两部分的结果合并以形成最终预测输出。所有的优化都在此基础上进行了调整和测试 本研究为汽车售后市场间歇性需求预测的实践提供了新的视角,并初步验证了IDCF框架在汽车备件预测中的潜力,该框架已在企业内部实施,供客户使用,并在企业中得到了显著改善。基于上述情况,本研究旨在解决以下问题:问题1:如何将间歇性需求预测的问题分解为两个阶段? 如何构建特征工程并将其应用于间歇性汽车后备件?如何使用机器学习模型来构建适用于汽车售后市场间歇性需求预测的方法,从而捕捉全球影响并构建全球模型?Q2:如何提高机器学习需求分类预测的准确性,如何确定最佳分类阈值?当内部数据不足时,如何使用迁移学习将外部数据纳入模型训练,以提高预测的准确性?2. 文献综述2.1. 需求分类许多学者认为,准确的需求分类可以为找到合适的预测方法提供一些指导最常用的分类法是ABC分类法,也被称为帕累托分类法,通常用于行业中区分不同重要性级别的 它以意大利经济学家维尔弗雷多·帕累托的名字命名,他在1906年指出,意大利80%的土地由20%的人口拥有。更一般地说,在许多领域都有类似的法律。在清单的情况下,许多案例研究证实了80/20规则的有效性(Syntetos等人, 2009年、2010年)。在库存管理中,约20%的SKU会产生X. Zhuang等人数据科学与管理5(2022)4345Fig. 1. SBC需求分类法。近80%的销售额。通常,可以使用两个以上的类别来控制总体需求类别,基于特定的标准(年需求量或年需求值),例如,A类年总需求量的60%,B类年总需求量的30%,C类年总需求量的10%(Syntetos等人, 2009年)。A类SKU被认为是最关键的,因此需要最高级别的服务,以避免代价高昂的积压。因此,ABC分类也用于确定服务水平,其中A类通常被设定为最高目标,间歇性需求预测方法主要用于C类SKU。然而,用ABC分类法进行预测时会出现一个问题. 如果根据需求标准将一些缓慢和低容量的非间歇性SKU分配到C类,并使用针对间歇性需求开发的方法对这些SKU进行预测,则可能会产生负面结果。基于预测的分类旨在为不同类别选择最合适的预测方法 Boylan和Johnston(1996)通过一系列真实的模拟实验,基于不同的提前期条件和需求模式,论证了Croston方法比SES方法更精确的条件。他们发现,根据均方误差(MSE),如果平均需求间隔大于1.25,则应使用Croston方法而不是SES。受Williams(1984)的启发,Eaves和Kingsman(2017)提出了一种基于二阶矩变化(交易变化性,需求规模变化性和提前期变化性)识别间歇性需求的分类方法,但由于所需元素过多,它缺乏业务着陆时钟的实用性。Syntetos等人提出的另一种方法。(2005)是基于交易频率和需求规模的变化。 他们提出了两个关键参数,其中一个是平均需求间隔,另一个是需求变化系数。 这种分类提供了不同需求类型之间的截止值,从而将需求序列分为四类:不规则需求、平滑需求、间歇性需求和亮度需求。块状需求也被认为涉及更极端的间歇性需求,这种分类更直观,更容易在实际业务中应用Syntetos等人(2005)重新研究了Croston和SES等方法之间的比较,并讨论了基于理论对(而不是模拟)的分类标准的截止点,引入非零需求变化作为除平均需求间隔(ADI)之外的需求分类变量之一。特别地,建议使用非零需求变化系数(CV2)来表示需求稳定性。 这种分类方法被称为SBC分类法。如图1所示,ADI和CV2可以将需求分为四类,即不规则需求、平滑需求、亮度需求和间歇性需求。间歇性预测方法、SBA方法和常规时间序列方法SES方法验证了ADI和CV2的阈值分别为1.32和0.49。SBC分类方法非常直观,易于在实际业务中应用,提供了不同需求类型之间的截止值。它在许多处理间歇性商品的组织的实际运作中得到了更好的验证(Ghobbar和Friend,2002年; Regattieri等人, 2005;Rego和Mesquita,2015)。它也被许多国际供应链软件开发商和顾问使用 , 如 Blue Yonder , Implement Consulting , Llamasoft 和Syncron。本研究将针对间歇性需求和间歇性需求探索预测方法,并以SBC方法作为需求分类的基准。2.2. 间歇性需求预测方法间歇性需求的稀疏性给预测带来了很大的挑战。由于间歇性时间序列中存在大量的零值,使得传统的预测方法难以应用,学者们提出了许多不同的间歇性需求预测方法CrostonX. Zhuang等人数据科学与管理5(2022)4346以Croston(1972)命名,是第一个解决间歇性需求预测问题的算法。该方法将间歇性需求序列分解为需求量和需求间隔两个连续序列。然后,分别用指数平滑算法对这两个连续序列进行预测,并根据预测区间和预测大小形成但Croston方法的预测结果Syntetos和Boylan(2005)提出了SBA方法,认为通过乘以平滑因子进行修正,新的预测值将接近无偏。该方法在需求预测改进方面具有一些优势,这已被许多研究人员证明(Eaves和Kingsman,2017; Gutierrez等人, 2008; Nikolopoulos等人, 2016; Wingerden等人, 2014年)。许多学者从组合的角度研究了间歇性需求预测。 已经证明自举对于间歇性预测增强是有效的(Babai等人, 2020年)。 一方面,最典型的方法,由Willemain等人提出。(2004),使用两阶段马尔可夫链来生成非零 需 求 点 , 然 后 使 用 历 史 数 据 对 需 求 进 行 重 新 采 样 。 另一方面,Viswanathan和Zhou(2008)使用历史数据中的非零需求间隔进行重新采样,从而为验证有效的提前期生成非零需求间隔分布。此外,Zhou和Viswanathan(2011)分别探讨了自助法和参数估计法 一些研究人员假设提前期的第一个预测点是非零需求,这在分阶段补货控制系统中也很有效(Hasni等人,2019 a; Teunter和Duncan,2009)。 关于引导方法的更多评论可以在Hasni et al. (2019b年版)。与此同时,Hua et al.(2007)和Hua and Zhang(2006)遵循类似的路径,通过引入解释变量和影响因子来预测间歇性需求。Hua et al.(2007)将时间序列切成二进制序列。一个是零需求序列,另一个是非零需求序列。 他们把需求的发生归因于自相关或解释变量。 前者通过马尔可夫链预测需求发生的概率,后者通过逻辑回归进行相应的概率预测,然后利用Bootstrapping方法估计非零需求规模。Hua和Zhang(2006),简单地用支持向量机(SVM)代替马尔可夫链方法。 Hua和Zhang(2006)的预测精度优于Hua等的预测精度。(2007年),以实际数据为依据。 Nasiri Pour等人(2008)使用混合模型的神经网络来预测需求是否发生,同时使用指数平滑来预测非零需求规模。他们提出的神经网络模型考虑了四个输入变量:最后一点的需求大小,前两次需求发生之间的周期数,目标周期和最后一次需求发生之间的周期数,以及目标周期和最近的零需求周期之间的周期数然而,基于时间序列算法的需求预测无法捕捉到内部和外部因素对需求发生的影响。它倾向于给出一个平均的预测水平,几乎没有零值,无法区分需求的存在与否,也无法给出补货的指导,从而带来一定的库存成本和积压成本。此外,许多基于自举的方法已经被尝试用于分类问题,但它们只依赖于时间序列本身的特征。EX机器学习研究并没有充分挖掘机器学习的优势,从而捕捉更多的干扰因素,做出更准确的预测。此外,由于历史数据不足,新上市的备件面临巨大的预测挑战。因此,本研究将进一步探讨通过关注分类问题并致力于对需求的发生做出更准确的预测,我们克服并且,研究将进一步考虑引入外部数据进行迁移学习,以扩大现有数据量,充分发挥企业数据资源优势,获得更准确的预测。2.3. 迁移学习数据挖掘和机器学习技术在知识工程的许多领域取得了重大成功,包括分类、回归和聚类(Yang and Wu,2006)。许多机器学习和数据挖掘算法的一个主要假设是训练和测试数据必须共享相同的分布。 当分布发生变化时,大多数统计模型需要使用新收集的训练数据从头开始重建。然而,在许多实际应用中,这一假设难以维持。例如,在一个场景中,我们可能有一个数据不足的分类任务;同时,在另一个类似的场景中,我们可能有足够的训练数据,这些数据在数据方面可能有不同的分布。 在这种情况下,如果可以将样本转移到训练中,就可以避免昂贵的数据标签和人为主观因素的误差,大大提高训练效率和预测精度。还可能存在原始可用的标记样本数据可能随着时间变得不可用的情况,例如, 股票数据是时间敏感性很强的数据,用上个月的训练样本得到的模型对于预测当月的新样本是不可靠的。迁移学习是一种新的机器学习方法,它利用现有的知识来解决不同但相关领域的问题。它放松了传统机器学习中的两个基本假设,允许训练集和测试集所处的域、任务和分布不同,并利用现有知识解决目标域中只有少量标记样本数据甚至没有的学习问题。在现实世界中可以观察到许多迁移学习的例子例如,学习二胡(中国传统乐器)可能有助于学习小提琴。也就是说,迁移学习的研究是基于这样一个事实,即人们可以智能地应用以前学到的知识来更快或更有效地解决新问题。自1995年以来,关于迁移学习的研究包括知识迁移、模型迁移、样本迁移、特征迁移等(Thrun and Pratt,1998),引起了越来越多的学者的关注。 两个不同领域共享的因素越多,迁移学习就越容易。由于共享因素很少,迁移学习更加困难,甚至可能发生“负迁移”(Dai等人, 2009; Rosenstein等人,2005年)。在需求预测的场景中,由于目标数据和源数据都是时间序列数据,因此可以从时间序列中构造相同的特征列进行样本融合训练。问题是如何使用源域数据与目标数据建立可靠的模型来预测目标域数据(源域数据和目标域数据可能不具有相同的数据分布)。因此,最合适的迁移思想是实例迁移学习。实例迁移学习的思想非常直观。它的核心概念是,虽然源域数据不能直接完全重用,但其部分数据仍然可以与目标域中的一些标记数据一起使用。Dai等人(2007)提出了一种基于提升的算法TrAdaBoost,它是AdaBoost算法的扩展,用于解决样本迁移学习问题。TrAdaBoost假设源域和目标域数据使用完全相同的特征和标签字段,但两个域中的数据分布不同。TrAdaBoost假设,由于X. Zhuang等人数据科学与管理5(2022)43472YtnpQnjt¼在源域数据的帮助Wu和Dietterich(2004)n我我不我我ni¼1XX我i-1在源数据和目标数据之间的分布中,源数据的某些部分可能对目标数据的训练有用,但是源数据的某些其他部分可能是无用的,甚至干扰目标数据的训练。因此,TrAdaBoost算法通过对目标和源数据使用不同的权重迭代策略来训练融合模型。 它采用与AdaBoost相同的策略更新目标域中误分类样本的权重,采用相反的策略更新源数据中误分类样本的权重,以减少源数据中的“负面”影响。降低了源数据对目标域训练的“负“影响,提升了源数据对目标域训练的“正”影响。 对于每次迭代,TrAdaBoost根据加权的源数据和目标数据训练基本分类器,但仅计算目标数据的误差,如Dai等人所述。(2007年)。Jiang和Zhai(2007)提出了一种启发式方法,根据条件概率之间的差异,从源域中删除可能对目标数据产生“误导”的训练样本表1混淆矩阵真正价值预测值积极负正负真阳性(TP)假阳性(FP)假阴性(FN)真阴性(TN)无标度误差。这类最典型的评价指标是平均绝对标度误差(MASE)。分母可以被看作是朴素预测方法的MAE(使用昨天的实际销售作为明天的需求),因此该指标是稳健的和可扩展的(Hyndman,2006)。MASE不必担心分母为零,除非历史需求全部相等,否则它将是无限的方程如下所示n源域和目标域中的能力Liao等人(2005年)MASE¼1XjYi-Fij(三)一种新的主动学习方法,可以标记目标域中的数据ni¼11XnjY-Yj将源域数据集成到SVM框架中,分类性能。除了用于分类问题,实例转移也被研究用于解决回归问题。Pardoe和Stone(2010)提出了两阶段TrAdaBoost。 R2模型,它使TrAdaBoost适应回归任务的要求。基于上述研究和总结,本研究以TrAda-Boost为方法基准,通过实际业务中的响应需求,将其融入间歇性需求预测方法中,解决了该场景下利用外部数据时数据不足的问题2.4. 间歇性需求预测当我们训练模型时,我们需要使用评估指标来评估其错误提示这类指标基于pt<$et×100%,这是相对于真实值的百分比误差这些指标不依赖于规模,可用于比较不同数据系列的预测方法的优点典型的度量是平均绝对百分比误差(MAPE),其用于许多预测研究(Yang等人,2021年)。然而,在间歇性需求中,Y t通常等于零,这使得MAPE不适合这种场景。因此,Sungil 和 Heeywald ( 2016 ) 提 出 了 平 均 Arctan 绝 对 百 分 比 误 差(MAAPE)。MAAPE基于MAPE,但不限于域,范围在0和π之间。因此,它并不严重偏向低估,相反,它对高估和低估的惩罚更加对称,并且具有非常明显的意义和高度的可解释性。Eqs。MAPE和MAAPE的数据如下所示。n优点和缺点。间歇性序列难以测量。MAPE¼1Xp(四)典 型的 预 测精 度 度量 通 常不 适 用 于此 类 问题 。 因此 ,Hyndman(2006)列出了一系列与此类序列相对应的回归预测评价指标尺度相关度量。这类指标基于etYt-Ft,即真实值与预测值之差,其中Yt为真实值,Ft为预测值。典型的包括均方误差(MSE)和平均绝对误差(MAE),这是使用方程计算。下图:MSE¼1XXXY-F2(1)1NMAEjY-Fj(2)1/1这些方法的缺点是它们依赖于幅度,并且对不同幅度的时间序列进行比较是没有意义的。此外,如果将MAE用作损失函数,则它预测具有高不确定性的序列在每个阶段都为零,这显然难以应用于实际场景。Syntetos和Boylan(2005年)建议使用几何平均绝对误差. 这种方法的缺点是GMAE等于i/1零,只要1等于零,如果预测方法可以在间歇性预测中给出零值。ni¼11NMAAPE¼n中国( 5)1/1除了回归预测的评估指标外,分类预测也需要在本研究中进一步评估。根据数据挖掘理论,评估分类模型预测能力的最广泛使用的方法是混淆矩阵(Deng et al., 2016年,如表1所示。个体评估侧重于准确度、精确度和召回率,而综合评估侧重于F1评分、受试者操作特征(ROC)和曲线下面积(AUC)。在过去,ROC曲线主要应用于信号领域检测(Swets,2014)。如今,它们通常被用作标准用于模型评估(Flach,2003)。ROC曲线是由真阳性率(TPR)和假阳性率(FPR)组成的评价曲线,以FPR为横轴,TPR为纵轴。它们由以下等式计算得出,分别为:TPR中文(简体)TPFFNn-11/2不X. Zhuang等人数据科学与管理5(2022)4348¼FPRFPFPFTTN(七)Willemain等人, 2004)或通过历史数据趋势调整需求规模(Altay etal., 2008年)。离散时间特征的构造和可以看出,TPR和FPR实际上分别从真正和真负观测值开始,这绕过了所谓的正和负观测值数量的比例差距例如,如果所有观察结果中有75%是正面的,那么TPR只考虑这些正面观察结果中有多少是正确的,与其余样本无关为了更直观地评价ROC曲线提出了曲线下面积(AUC)方法(Weng和Poon,2008)。该算法是一种更有效的排序模型,它可以全面而详细地平衡每个阈值的影响和性能通常,AUC值在0.5和1之间;越接近1,预测越好(Bradley,1997)。 基于上述文献研究,本研究将使用MAPE和MASE作为需求预测的指标,而ROC和AUC将作为分类预测的指标。2.5. 特征工程许多学者试图找到可以描述间歇性需求是否发生的特征,包括平均需求间 隔(Lev'en和Segerstedt,2004),需求频率(Gutierrez等人,2008)、需求间隔分布(Croston,1972)、需求规模(Nasiri Pour等人, 2008)、需求分布(Zotteri,2000)、用户在购买过程中产生的早期数据(Verganti,1997)、促销或假日信息(Hyndman,2006)、需求自相关(Wil-lemain等人, 2004年),产品交易模式(Syntetos,2001年)等有两类方法用于表征未来的需求。第一类主要应用于历史非零需求,通常是指数平滑及其变体(Nasiri Pour等人,2008年)。由于另一类是基于历史需求的随机抽样,它被用来解释未来的需求值(Hua等人,二○ ○七年;在此基础上进行时间序列聚合特征2.6. LightGBM机器学习模型已经在大量应用场景中显示出优异的结果(Fan等人,2021年)。 作为机器学习的典型代表,LightGBM是基于决策树的分布式梯度提升框架(Ke等人, 2017年)。梯度提升决策树(GradientBoosting Decision Trees)最早由Friedman(2001)提出,是提升类算法的典型代表训练中的算法将专注于每次迭代结果的残差;然后,在下一次迭代过程中,前一次的残差 关键在于如何对结果的残差进行估计。 梯度提升决策树方法通过使用模型损失函数的负梯度来解决这个问题,使得目标函数的求解更加方便,可以使用更多种类的目标函数。然而,在许多工业实践中,企业数据的主要特点是数据量大、特征复杂、响应级别高,这里的梯度提升决策树方法显然不能满足更复杂的需求。为了解决这个问题,Chen和Guestrin(2016)提出了XGBoost算法,该算法基于梯度提升决策树(GBDT),并进行了以下改进:除了基本的分类和回归树(CART)树分类器外,还实现了一些广义线性分类器;它使用二阶泰勒展开,在使用损失函数的负梯度时使用二阶导数,包含更多信息;它在损失函数中添加了正则项,以控制模型的复杂度;它可以支持随机提取特征列;模型更健壮。同时,速度比传统GBDT快10倍图二、 总体模型框架图。X. Zhuang等人数据科学与管理5(2022)4349●¼●×●×ð ð Þ Þð≤ÞLightGBM是微软开源的算法框架,在XGBoost的基础上进行了进一步的修改,主要在以下三个方面进行了优化:i. 直方图算法。该算法的核心好处在于它能够减少替代分裂点的数量,例如回归问题。连续变量的特征值可以在一定的区间尺度上离散化,使得交替分裂点的数目更少,速度也更快。ii. 单边采样(GOSS)。该算法的核心优势在于其能够减少观测次数,主要是使用有目的的观测采样来减少损失函数增益计算中的冗余。这种有目的的抽样被称为单侧抽样,它简单地意味着根据某种策略对某一类样本进行抽样,而不触及其他类别的样本 在该算法中,它涉及在训练过程中以相应的速率对具有小的梯度绝对值的观测进行重新采样,而那些具有大的梯度绝对值的观测保持不变。 这是因为损失函数的增益由具有大的梯度绝对值的观测值贡献,这可以更好地区分不同种类。因此,该算法在提高运算速度和效率的同时,最大限度地保留了模型的预测能力。iii. 排他性特征捆绑(EFB)。该算法的核心优点是能够减少特征的数量。在许多情况下,真实的样本集不可能是特征丰富的。另外,总是存在大量稀疏特征,其中大量观测被标记为零,并且少量观测被标记为某个非零值。一般来说,这些稀疏特征是互斥的。有了这些特征,就有可能为相应的特征编码一个新的标记,这样一些互斥的字段就可以重新形成一个特征。这有效地减少了特征的数量。此外,由于这种设计,LightGBM可以支持类别变量。这三种算法的引入,大大降低了LightGBM的复杂度。它的主要优点是分布式支持,可以并行训练,效率很高。LightGBM支持回归和分类任务。在分类任务中,它可以支持不平衡样本的处理和权重校正。此外,M5竞赛(世界顶级需求预测竞赛)中排名前五的时间序列预测模型中有四个是基于这种算法的(Makridakis等人,2020年),结合了工程速度和预测准确性的优势。因此,LightGBM被用作本研究的基础模型3. 方法如图2、提出了三种基于内外部数据的间歇性需求组合预测方法。其中,以间歇性需求组合预测方法为核心,扩展了最佳 其中,BTIDCF主要基于内部数据实现,而TBIDCF可以在内部数据不足时结合外部数据进行训练。 这些方法结合了它们的优点,形成了一个多样化的解决方案,间歇性需求预测。3.1. 间歇性需求组合预测i.问题定义本研究提出IDCF方法。 为了澄清这个问题,我们首先给出下面的相关定义。定义3.1. (基本符号):设X为样本空间,也可以称为目标样本(特征)空间。设L{0,1}为类空间,在本研究中,它涉及预测需求存在或不存在的分类问题,因此需要定义。● 让Y2Z被的整数空间总体分类数据集C {XL},它是从样本空间中收集的。总体回归数据集R{XY},从样本空间中收集。● 映射函数c:X→L,将样本x2X映射到它的真范畴c(x)2L。● 映射函数r:X→Y,将样本x2X映射到它的真范畴r(x)2Y。定义3.2.(测试数据集):N<$fxi <$g;其中xi2X;当i<$1;2;其中数据集N未被标记,并且n是集合N中的元素的数量。定义3.3.(测试预测集):F<$ffig;其中fi2R;当i<$1;2;n是集合F中元素的个数。定义3.4.(训练数据集):其中xi2X;当i1;2;其中xi2X;且r x i>0;且i≤m其中cxi是样本x的真实类别,rxi是样本x的真实销售额,Tc是分类问题训练集,Tr是回归问题训练集,m是分类问题训练集的大小。回归问题训练集的大小是k/4len r xi>0i m。基于上述定义,问题可以简单地描述如下:给定训练数据集Tc,分别训练分类器和回归器,以及一些未标记的测试集N,N上的分类误差和回归误差最小化。ii.方法和说明如算法1的描述所示,在训练集中,调用机器学习模型LightGBM来训练分类模型M1,其预测是否出现需求这需要通过调整正样本和负样本的权重来缓解,因为数据样本呈现严重的不平衡。筛选训练数据中销售额大于零的样本,调用机器学习模型LightGBM训练回归模型M2,预测非零需求。在测试集中,分类模型M1为●X. Zhuang等人数据科学与管理5(2022)4350-1/4×ð Þj2ð Þj2用于预测样本的需求是否为零。如果它不为最后,将两部分的结果合并以获得最终输出。算法1. IDCF描述3.2. 最佳门限间歇性需求组合预测i.问题定义在这项研究中,我们提出了一个优化的方法,称为最佳阈值间歇性需求组合预测(BTIDCF)的IDCF的基础上。为了澄清这个问题,我们在定义3.1、定义3.2、定义3.3和定义3.4的基础上给出了与这个问题相关的其他定义。定义3.5.(验证样品组):Tv<$f<$xi;c<$xi< $g;其中xi2X;当i<$1;2;其中q是验证样本集的大小定义3.6.(验证样本分类预测结果集):V<$fvi g;其中vi 2L;当i <$1;2;其中q是验证样本集的大小定义3.7.(分类阈值设置):当i=1;2;... ; k时其中,αi≠ 1αil满足任何正整数i,α是分类阈值的集合,l是步长,k的大小取决于步长l:基于上述定义,问题可以简单地描述如下:给定两个训练数据集Tc和Tr,一个验证数据集Tv,分别训练分类器M1和回归器M2,以及一些未标记的测试集N,N上的分类误差和回归误差最小化。ii.方法和说明如算法2的描述所示,首先将目标样本集分为训练样本集、验证样本集和测试样本集。 通过使用机器学习模型LightGBM,在训练集上训练分类模型M1以预测需求发生的概率。构造了一组分类阈值,范围从0.4到0.6,并且还设置了阈值增量步长。在验证集上调用M1,并输出验证集的需求概率。如果需求概率大于分类阈值,则预测值为1,如果需求概率小于分类阈值,则预测值为0。遍历每个分类阈值,并使用AUC值评估每个阈值下验证集的分类具有最大AUC值的最佳分类阈值 在测试集中,使用验证集输出的与数据特征匹配的最佳分类阈值。 在获得分类预测结果后,然后使用M2回归模型获得非零需求估计。最后,将两组结果合并以获得最终输出。算法2. BTIDCF描述3.3. 基于转移的间歇性需求组合预测方法i.问题定义在这项研究中,我们提出了一个优化的方法,基于转移的间歇性需求组合预测(TBIDCF)的基础上IDCF。为了澄清这个问题,我们在定义3.1、定义3.2、定义3.3和定义3.4的基础上给出了与这个问题相关的其他定义。定义3.8.(源数据集):Ts<$fzi;h zi g;其中zi 2Z;当i<$1;2;其中Z是源实例空间,从源样本空间收集的数据集H<${Z L},映射函数h:Z→L将样本z2Z映射到其真实类别h<$z<$2L。因此,定义3.4中的目标数据集Tc和源数据集Ts一起构成了新分类模型的训练集。Tc和Ts之间的区别在于Tc具有与N相同的分布,而源数据集Ts可能具有不同的分布,即Px;y xTs Px;y x N。基于上述定义,该问题可以简单地描述为:给定非常小的目标数据集Tc和Tr,大量的源数据Ts,以及一些未标记的测试集N,N上的分类误差和回归误差最小化。ii.方法和说明如算法3的描述所示,将目标数据集切割成训练集和测试集,并引入外部源数据X. Zhuang等人数据科学与管理5(2022)4351¼;d¼t我我我我我我t1/2i¼1wici¼1wisi¼1wici¼1wis啪啪啪啪2吨表2间歇性SKU(3,089)每周粒度SBC分类描述性统计。指数平均标准偏差最小百分之二十五百分之五十百分之七十五最大Adi10.038.181.002.438.0016.0029.67CV29.918.380.242.028.5215.9850.34之后,迁移学习开始。这里应该注意的是,TrAdaboost的原始版本(Dai等人, 2007)使用Adaboost模型的修改。在Adaboost中,第一个弱分类器是通过训练所有具有相同权重的样本来获得的。 从第二轮开始,每个样本的权重根据每轮前一个弱分类器的分类结果进行调整。前一轮中错误分类的样本的权重增加,而正确分类的样本的权重减少。然后,新的样本权重用于指导这一轮中弱分类器的训练,即,通过更新错误分类样本的权重来定位模型的缺陷(Freund和Schapire,1997)。但在我们实际的业务场景中,需要优化的SKU数量非常庞大。特别是在汽车零部件方面,通常有数千到数万个SKU。当层次结构是(续)wTc <$wTcβ-tjhtxi-cxij;当i<$1;2;... ; m;w Ts 当i<$1;2;...; q ;输出分类模型集合M1<$fhtg及其投票权重集合O<$fθtg,当t<$1,2,3,.时,S使用训练回归样本Tr,输出量:调用分类模型集h,在测试集N上的预测。对于i1; 2;3;对于t1; 2; 3;...; S打电话给我,告诉我最新情况。1-1;dt¼10得到预测结果集Dftg,结合模型投票权值集O,Ci ¼符号PSdtθt如果c拉里蒂,会有更多的。此外,将有大量的源数据,这几乎是不可能的土地与传统的Ada-boost;该过程是效率较低的 , 敏 捷 响 应 是 难 以 实 现 的 。 因 此 , 在 这 项 研 究 中 , 我 们 使
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- StarModAPI: StarMade 模组开发的Java API工具包
- PHP疫情上报管理系统开发与数据库实现详解
- 中秋节特献:明月祝福Flash动画素材
- Java GUI界面RPi-kee_Pilot:RPi-kee专用控制工具
- 电脑端APK信息提取工具APK Messenger功能介绍
- 探索矩阵连乘算法在C++中的应用
- Airflow教程:入门到工作流程创建
- MIP在Matlab中实现黑白图像处理的开源解决方案
- 图像切割感知分组框架:Matlab中的PG-framework实现
- 计算机科学中的经典算法与应用场景解析
- MiniZinc 编译器:高效解决离散优化问题
- MATLAB工具用于测量静态接触角的开源代码解析
- Python网络服务器项目合作指南
- 使用Matlab实现基础水族馆鱼类跟踪的代码解析
- vagga:基于Rust的用户空间容器化开发工具
- PPAP: 多语言支持的PHP邮政地址解析器项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功