数值方法求解含扩散项随机生产系统的最优控制

需积分: 5 112 浏览量更新于2024-08-08 收藏 1.05MB PDF 举报

"这篇论文是2009年由宋春跃和李平发表在《控制理论与应用》期刊上的，探讨了含扩散项不可靠生产系统的最优生产控制问题的数值求解方法。研究中，他们利用数值解法解决了一个模态耦合的非线性偏微分HJB方程，该方程是优化命题的关键。通过构建Markov链来近似生产系统状态的演变，并借助局部一致性原理，将连续时间的随机控制问题转换为离散时间的Markov决策过程问题。他们进一步应用数值迭代和策略迭代算法来求解最优控制。仿真结果证明了所提出方法的准确性和实用性。" 本文针对的是一种包含扩散项的不可靠随机生产系统，这种系统由于各种不确定性和随机性，其性能和稳定性受到很大影响。最优生产控制旨在最大化生产效率或最小化成本，同时考虑到系统的可靠性。文章的核心在于使用数值解方法来处理这一复杂问题。首先，作者们通过构建Markov链来描述生产系统状态随时间的随机变化。Markov链是一种概率模型，它假设系统未来状态只依赖于当前状态，而与过去的历史无关。这种方法简化了系统状态的追踪，便于进行数值分析。其次，他们利用局部一致性原理，将原本复杂的连续时间随机控制问题转化成更易于处理的离散时间问题。这种转化允许他们将问题转换为Markov决策过程（MDP），MDP是一种用于决策制定的数学框架，特别适合处理带有随机性的动态环境。接下来，为了找到最优控制策略，他们应用了数值迭代和策略迭代算法。数值迭代法是一种逐步逼近解的方法，通过不断迭代来逼近最优解；策略迭代算法则是一种在策略空间中寻找最优策略的方法，它通过比较不同策略的性能来更新控制策略。最后，通过仿真结果验证了所提出的数值求解方法的有效性和准确性。这些仿真可能包括了不同生产条件、随机扰动和控制参数的场景，证明了即使在复杂和不确定的环境下，该方法也能得出满意的结果。这篇论文对含扩散项的不可靠生产系统提供了新的优化工具，对于实际生产环境中的控制策略设计具有重要指导意义。通过数值解法和Markov决策过程，不仅能够应对生产系统的随机性和不可靠性，还能为工业界提供实用的优化方案。

第 26 卷第 7 期

2009 年 7 月

控制理论与应用

Control Theory & Applications

Vol. 26 No. 7

Jul. 2009

含含含扩扩扩散散散项项项不不不可可可靠靠靠生生生产产产系系系统统统最最最优优优生生生产产产控控控制制制的的的数数数值值值求求求解解解

宋春跃, 李平

(浙江大学工业控制技术国家重点实验室工业控制研究所, 浙江杭州 310027)

摘要: 针对含扩散项不可靠随机生产系统最优生产控制的优化命题, 采用数值解方法来求解该优化命题最优控

制所满足的模态耦合的非线性偏微分HJB方程. 首先构造Markov链来近似生产系统状态演化, 并基于局部一致性原

理, 把求解连续时间随机控制问题转化为求解离散时间的Markov决策过程问题, 然后采用数值迭代和策略迭代算

法来实现最优控制数值求解过程. 文末仿真结果验证了该方法的正确性和有效性.

关键词: 不可靠生产系统; 生产控制; 数值解; Markov决策过程

中图分类号: TP11 文献标识码: A

Numerical solution for optimal production control of unreliable

production systems with diffusion terms

SONG Chun-yue, LI Ping

(State Key Lab of Industrial Control Technology, Institute of Industrial Process Control, Zhejiang University,

Hangzhou Zhejiang 310027, China)

Abstract: The optimal production control for unreliable stochastic production system always involves in solving a

mode-coupled nonlinear partial differential equation, i.e., HJB(Hamilton-Jacobi-Bellman) equation, which is the necessary

and sufﬁcient condition of optimal control. Numerical method for stochastic control problems in continuous time is adopted

to solve the optimal production control problem involving diffusion terms by constructing Markov chains to approximate

the evolution of the system states, and then, the associated HJB equation is transformed into a discrete time Markov decision

process(MDP) under local consistence. Based on the MDP, an algorithm including numerical iteration and policy iteration

is then proposed. Finally, some numerical examples of production system are presented to illustrate the usefulness of the

numerical method.

Key words: unreliable production systems; production control; numerical method; Markov decision process

文文文章章章编编编号号号: 1000−8152(2009)07−0709−06

1 引引引言言言(Introduction)

柔性制造系统(FMS)是由若干可进行多种加

工工序的工作站(workstation)及传送装置组成. 由

于FMS具有很好的柔性, 故FMS制造系统较传统的

制造系统具有很大的优势, 以至越来越多的生产企

业采用FMS工作方式. 然而, FMS高昂的成本要求

对FMS的生产和维护进行有效的管理和调度成为必

然, 以应付诸如设备故障、需求波动、销售退货及库

存损耗等不确定事件的发生, 来满足市场的需求和

降低生产成本

[1]

. 由于系统规模大及结构复杂, 使

得对FMS的管理和控制具有递阶结构, 即上层为管

理层, 下层为生产控制(production control)层. 管理层

是离线实现的, 而生产控制层则是在线实现, 动态调

度, 以优化产品的生产速度和切换次序.

对生产控制的研究由来已久, 现在世界上形成

了以MIT的“制造和生产力研究实验室”(laboratory

for manufacturing and productivity, http://web.mit. edu

/lmp/)和Boston大学的“制造系统生产控制实验室”

(production control of manufacturing systems labora-

tory, http://www.bu.edu/pcms/)为主的生产控制研究

中心, 在对生产控制策略性质及值函数性质的研究

上, 得出了很多有意义的结论: 例如生产控制的开关

结构和值函数的凸性以及最优生产控制策略所要满

足的条件等

[2∼5]

, 为生产控制的工程应用奠定了理

论基础. 对生产控制的研究可分为两种途径, 一种是

把工作站作为服务中心来对待, 把待加工零件作为

服务对象, 用排队论来研究此类系统; 另一类是基于

对大批量产品生产的近似, 以流率化模型来研究生

产控制

[8]

. 不论那种研究方法, 最优状态反馈控制求

取都面临求解HJB方程的难题.

收稿日期: 2007−09−21; 收修改稿日期: 2009−01−15.

基金项目: 国家自然科学基金资助项目(60404018).

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38517212

粉丝: 8
资源: 952

数值方法求解含扩散项随机生产系统的最优控制

最优控制问题描述及matlab求解

gpops求解最优控制

基于改进遗传算法的时间最优控制问题求解

最优控制中拉格朗日乘子怎么求解

最优控制策略属于哪种控制

IEEE39系统最优潮流计算程序

d.subbaram naidu.最优控制系统中文版

LQR 深度学习 轨迹最优控制

用MATLAB编写一个利用线性二次型最优控制方法求解一个数值模型的程序

最新资源

LQR 深度学习轨迹最优控制