如何解释自适应动态规划
时间: 2023-08-25 08:11:35 浏览: 54
自适应动态规划是一种通过使用函数近似结构来估计代价函数的方法,以按时间正向求解动态规划问题。在动态规划中,当系统是非线性的或代价函数不是状态和控制输入的二次型形式时,需要求解哈密顿—雅可比—贝尔曼(HJB)方程来获得最优控制策略。然而,HJB方程的求解非常困难,并且当状态和控制输入的维数增加时,动态规划方法的计算量和存储量会增加,导致维数灾问题的出现。为了解决这些问题,自适应动态规划方法利用函数近似结构(如神经网络、模糊模型、多项式等)来估计代价函数,从而减少计算和存储的复杂度。通过这种方法,可以更有效地解决动态规划问题。<em>1</em><em>2</em><em>3</em>
#### 引用[.reference_title]
- *1* *2* [动态规划(Dynamic Programming)](https://blog.csdn.net/weixin_42018112/article/details/80657109)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item]
- *3* [(自适应动态规划综述)](https://blog.csdn.net/APTX4869595/article/details/103885585)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item]
[ .reference_list ]