AdaptiveDynamicProgramming自适应动态规划_自适应动态规划 - CSDN文库

3星 · 超过75%的资源需积分: 45 19 浏览量更新于2023-03-16 评论 7 收藏 2.15MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

1556-603X/09/$25.00©2009IEEE MAY 2009 | IEEE COMPUTATIONAL INTELLIGENCE MAGAZINE

39

Michael Margaliot

Tel Aviv University, Israel

M

Mi

M

M

M

Mi

Mi

Mi

Mi

Mi

M

Mi

Mi

M

Mi

Mi

Mi

Mi

Mi

M

Mi

Mi

M

Mi

Mi

Mi

M

M

M

M

Mi

Mi

Mi

M

Mi

Mi

Mi

Mi

M

Mi

i

Mi

M

Mi

Mi

i

Mi

M

M

i

i

M

Mi

Mi

M

M

M

M

Mi

Mi

i

Mi

Mi

i

M

M

i

i

M

M

c

ch

ch

chch

ch

ch

ch

ch

c

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

ch

h

ch

ch

ch

ch

c

c

ch

h

h

h

h

h

h

c

c

ch

h

h

c

c

h

c

h

ae

ae

ae

ae

ae

ae

aeae

ae

ae

ae

ae

ae

ae

ae

ae

ae

ae

ae

a

a

ae

a

a

ae

a

ae

a

ae

ae

ae

a

e

e

ae

a

e

ae

a

ae

a

e

l l

l

l

l

l

l

l

l

l

l

l

l

ll

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

l

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

Ma

M

Ma

Ma

Ma

Ma

M

M

M

Ma

Ma

M

Ma

M

Ma

M

Ma

Ma

M

Ma

Ma

M

M

M

Ma

Ma

M

M

Ma

M

M

Ma

rgrg

rg

rg

rg

rg

rg

rg

g

rg

rgrg

rg

rg

rg

rg

rg

rg

rg

rg

rg

rg

rg

rg

rg

rg

g

g

rg

rg

rg

rg

rg

rg

g

rg

rg

rg

r

rg

g

g

g

g

g

al

alalal

al

al

al

al

al

al

al

al

al

l

al

al

al

al

al

al

al

l

al

al

al

l

al

a

al

al

l

al

al

a

a

a

a

al

a

io

ioioio

io

io

io

io

ioio

io

io

i

io

o

io

io

io

io

io

io

io

io

io

io

i

io

io

i

io

io

i

o

io

o

io

io

o

i

io

t

tt

t

tt

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

t

Te

Tel

Tel

Tel

Tel

Tel

Tel

Tel

Te

Tel

Tel

Tel

Tel

Tel

Tel

Te

Tel

Tel

T

T

Tel

Tel

Tel

Tl

Tel

Tel

Tel

Tel

l

Te

Te

T

Tel

l

el

Te

Te

l

Tel

Te

Tel

T

el

Tel

T

T

T

e

e

l

Te

el

T

Tel

T

T

Tel

e

l

el

T

e

e

e

e

A

Av

A

Av

A

A

Av

Av

Av

Av

Av

Av

Av

Av

Av

Av

Av

A

Av

Av

Av

A

Av

Av

Av

Av

Av

Av

Av

A

A

Av

Av

Av

v

A

Av

Av

Av

A

A

A

A

v

A

A

A

iv

iv

iv

iv

iv

iv

iv

iv

iv iv

iv

iv

v

v

iv

iv

iv

iv

iv

iv

iv

iv

iv

iv

i

iv

iv

v

iv

iv

iv

iv

v

v

i

iv

v

i

i

UniUni

Uni

UniUni

Uni

Uni

Uni

Uni

Un

Un

Uni

U

UniUni

Uni

Uni

Uni

Uni

Uni

Uni

Un

n

Uni

Uni

Uni

Uni

U

Uni

Uni

U

ni

Uni

U

U

Un

Uni

Uni

i

U

U

ni

Un

U

U

U

Un

U

Un

U

U

n

Un

n

U

U

n

i

i

U

Un

Un

Un

n

ver

ver

ver

ver

ver

ver

ver

ver

ver

ver

verver

ver

ve

ve

ver

ver

ver

ver

ve

v

ver

ver

er

e

ver

ver

er

er

ver

ver

e

ver

ve

ver

er

er

r

ve

er

v

v

v

v

v

ve

v

v

ve

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

sit

i

t

sit

i

sit

sit

si

s

s

s

i

sit

t

sit

sit

t

sit

t

i

t

i

i

it

y,

y,

y,

y,

y,

y,

y,

y,

y,

y

y,

y

y,

y,

y

y,

y

y

y

y,

y,

y,

y,

y,

y,

y,

y,

y,

y,

y,

y,

y,

y

y,

y,

y

y,

y

y

y,

y,

y

y

y

Isr

Isr

Isr

Isr

Isr

Isr

Isr

Isr

Is

sr

Isr

Isr

s

sr

Isr

Is

Is

Isr

I

Isr

Isr

I

I

Isr

I

I

Isr

Isr

Isr

sr

Is

I

s

r

Isr

Isr

sr

Is

Is

r

r

s

ael

ael

ae

ael

ael

ael

ael

ael

aelael

ael

ael

ael

ael

ael

ae

el

ael

el

ael

ae

ae

ael

ael

ael

l

l

l

ael

ael

l

ael

a

a

ael

ael

ael

a

el

e

el

l

a

el

l

el

a

ael

e

e

ael

a

Fei-Yue Wang, Chinese Academy of Sciences,

CHINA and University of Arizona, USA

Huaguang Zhang, Northeastern University, CHINA

and Derong Liu, Chinese Academy of Sciences, CHINA

Adaptive Dynamic

Programming: An Introduction

Digital Object Identifier 10.1109/MCI.2009.932261

Abstract: In this article, we introduce some recent research trends

within the field of adaptive/approximate dynamic programming

(ADP), including the variations on the structure of ADP

schemes, the development of ADP algorithms and applications

of ADP schemes. For ADP algorithms, the point of focus is that

iterative algorithms of ADP can be sorted into two classes: one

class is the iterative algorithm with initial stable policy; the other

is the one without the requirement of initial stable policy. It is

generally believed that the latter one has less computation at the

cost of missing the guarantee of system stability during iteration

process. In addition, many recent papers have provided conver-

gence analysis associated with the algorithms developed. Fur-

thermore, we point out some topics for future studies.

©STOCKBYTE

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余8页未读，立即下载

评论1

倍蓓的北碚

2020-09-20

刚刚下载了，是2009年一篇综述，大家可根据实际情况下载

Lawliet-t

粉丝: 1
资源: 2

会员权益专享

图片转文字

全年可省5，000元立即开通

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈