一维动态规划：解析法与数值法详解

需积分: 39 122 浏览量更新于2024-09-17 1 收藏 181KB DOC 举报

动态规划的解析法与数值法是运筹学中的两种核心求解策略，适用于一维或多维决策过程中的优化问题。一维动态规划涉及单一状态变量sk和决策变量xk，通过阶段性的决策寻找最优路径。在分析这类问题时，我们通常关注线性、非线性和整数规划的不同形式。解析法是动态规划的一种关键方法，它依赖于指标函数的数学表达式，能够利用经典数学工具找到全局最优解。对于线性规划问题，当所有变量的函数都是线性的，且只有一个约束条件时，可以通过线性规划理论处理。例如，考虑资源分配问题，如图所示，资源b被分配到n种产品生产中，目标是最大化总利润。动态规划在此问题中的应用，是通过逆序递推方式来逐步确定每阶段的决策，如sk表示可用资源，满足sk>=0且无后效性（即决策对后续阶段无影响）。状态转移方程反映了资源消耗与决策的关系，而决策集合和允许状态集合则基于这些限制条件。逆序递推法的核心在于建立一个递归关系，即最优函数V[k]表示从第k阶段到最后阶段的指标函数最优值，其递推方程为V[k] = max{V[k+1] + akxk | xk >= 0, sk >= akxk}。边界条件通常在第一阶段给出，即V[n+1] = 0，因为最后一阶段没有后续阶段。通过递归求解这个方程，我们可以逐步找到整个决策过程的最优解。数值法则是针对解析方法难以求解的非线性或整数规划问题而设计的。这种方法可能涉及数值计算技术，如梯度上升法、模拟退火等，通过迭代逼近最优解。然而，数值法可能无法保证全局最优，但提供了在特定问题上的可行解决方案。总结来说，动态规划的解析法和数值法在求解一维动态规划问题时各有优势。解析法适用于线性或部分线性问题，能提供明确的最优解；而数值法则适合于复杂非线性问题，尽管可能存在局部最优，但在实际问题中有广泛应用。这两种方法是运筹学和优化理论中的重要工具，对于理解和解决多阶段决策问题具有重要意义。

一维动态规划的求解法

所谓一维动态规划问题是指：在一个多阶段决策过程中，每一个阶段只用一个状态变

量 s

就足以描述系统的状态演变，并且在每一个阶段，只需要选择一个决策变量 x

就

够了。前面讨论的问题都属于这一类。若每个阶段需要两个或多个状态变量才能描述

系统的演变，或者每个阶段需要选择两个或多个决策变量时，这类问题都属于多维动

态规划问题。

求解一维动态规划问题，基本上有两类方法：一类是解析法；一类是数值法。

所谓解析法是需要用到指标函数的数学公式表示式，并且能用经典求极值的方法得到

最优解，即用解析的方法求得最优解。下面主要介绍解析法

动态规划的解析法



我们讨论仅有一个约束条件的数学规划问题

)()()(max

2111 nn

xgxgxgZ  











),,2,1(0

2211

njx

bxaxaxa



这里，当

)(

,j=1,2,…,n 均为线性函数时，则为线性规划问题；当

)(

不全为线性函

数时，则为线性规划问题；当 x

有整数要求时，则为整数规划问题。虽然这一类问题可在

线性规划、非线性规划及整数规划中讨论它。但是，用动态规划方法来解决这一类问题是

有其特殊的优点和方便之处。



用动态规划求解这一类问题，有一个统一的模式。即把问题划分为 n 个阶段，取 x

为

第 k 阶段的决策变量。第 k 阶段的效益为

)(

（k=1,2,…,n）。指标函数为各阶段效益

之和，即

),,2,1()( nkxgV

jjkn







问题是如何选择状态变量 s

。正如线性规划问题中可以将约束条件看成资源限制一样

这里也可以这样理解，即将现有数量为 b 个单位的某种资源用来生产 n 种产品，问如何分

配使总利润最大。假设工厂的决策者份几个阶段来考虑这个问题，如果是用逆序递推法，

决策者首先考虑的是第 n 种产品生产几件，消耗资源多少；然后考虑第 n-1 种和第 n 种产

品各生产多少，消耗资源多少；依次向前递推。在第 k 阶段时，就要考虑第 k 种、第 k-1 种、

…，第 n 种产品各生产多少，消耗资源多少。于是我们就可以这样来选择状态变量了，即

令 s

表示可供第 k 种产品至第 n 种产品消耗的资源数。显然由 s

≧0,且 s

满足无后效性。而

第 k 阶段的资源消耗为 a

，于是得状态转移方程为

.1,,1,,





nnkxass

kkkk

再由 s

k+1

≥0 及决策变量 x

的非负性，可得允许决策集合为















kkkk

xxsD 0|)(

允许状态集合为

 

bssS

kkk

 0|

且 S

=｛b｝.

设最优函数

)(

表示从第 k 阶段到第 n 阶段指标函数的最优值，则逆序递推方程为

 

)1,,1,()()(max)(

)(







nnksfxgsf

kkkk

sDx

kkk

边界条件为

0)(



 kk

。然后再依次逆序递推求解。

下载后可阅读完整内容，剩余9页未读，立即下载

zouteng

粉丝: 0
资源: 2

一维动态规划：解析法与数值法详解

PolarPlot_Animation​_Test.m:极坐标图动画-matlab开发

matlab新古典动态规划的数值计算程序

数值分析python实验贪心，动态规划算法等江大lyy实验

数值法与解析法能量常数

简单介绍月球的散射特性建模方法的经验方法、解析近似法以及数值计算法

数值分析解析法java

在追赶问题中，解析解，数值解和计算机仿真解各自的优缺点是什么

数值最优化算法与理论 习题解析 pdf

最新资源

PolarPlot_Animation_Test.m:极坐标图动画-matlab开发

数值最优化算法与理论习题解析 pdf