ung and Simchi-Levi( 2019)提出基于采样的近
似
我们的研究从有序到非线性全面风险管理
容量受限随机库存控制模型的方案。我们的研究特
别 感 兴 趣 的 是 Huh and
Rusmevichientong(2009).他们受到报童模型的
启发,设计了一个数据驱动的多期订单到水平库存
控制模型。订单到水平库存模型的目标是在考虑订
单成本、持有成本和销售损失成本时,最小化(最大
化)计划范围内的总成本(利润)。他们制定了一个单
变量算法,当应用于 IID 数据时,该算法是渐近最优
的。Shi et al.(2016)还讨论了相同的订单到水平
模型,但将数据驱动的结果扩展到多产品案例。IID
假设仍然需要建立一个渐进的最佳订单到水平。
此外,许多研究采用基于动态规划、马尔可夫过
程或强化学习的求解算法 ing 解决数据驱动的动态
库存 问题。Subramanianet al.(2012)研究一个
单 变 量 闭 环 多 级 分 销 库 存 供 应 链 模 型 。 Van
Foreest et al.( 2010)使用单价需求模拟来评估中
的不同订购策略 more 复杂定制随机批量调度问
题。Heki-moğlu et al.(2018)检查一个库存控制
模型,该模型可以通过马尔可夫过程对随机要素建
模来处理随机提前期和中断,该过程被集成到作者
的求解算法中。最近,Georghiou et al.( 2019)
开发一种方法,他们称之为稳健的双重动态规划,
以解决多阶段优化问题。作者展示了
水平
(
动态
)
回归
他们在具有观察到的随机需求和固定持有和延期交
货成本的单级多项目库存问题中的方法。 Çimen
and Kirkbride(2017)还研究了用观察到的需求求
解多项目单级库存模型,但采用了近似动态规划算
法。
强化学习是一种数据驱动的方法,在许多经济研
究领域获得了关注,理论上也是如此 connected 动
态 规 划 和 马 尔 可 夫 过 程 ( Nguyenet
al.,2020).Giannoccaro and
Pontrandolfo(2002)为库存管理提供强化学习方
法的早期介绍。从那时起,强化学习领域已经取得
了 许 多 理 论 上 的 进 展 Kara and
Dogan ( 2018),Perez et al. ( 2021) , 以 及
Wang et al. (2012)基于观察到的单变量需求数
据,应用更新的强化学习方法来解决库存管理问
题。
2.3. 大数据驱动的库存模型
我 们 已 经 总 结 了 我 们 将 在 本 节 中 回 顾 的 论 文
Table1。
第一栏列出了主要文献。第二栏列出了文献中提
到的焦点问题。第三列介绍