没有合适的资源?快使用搜索试试~ 我知道了~
首页多智能体-DM-ICML-ACAI.pdf
多智能体-DM-ICML-ACAI.pdf
需积分: 18 12 下载量 156 浏览量
更新于2023-05-11
收藏 17.08MB PDF 举报
强化学习与多智能体入门读物,这篇文章对多智能体强化学习(MARL)的背景,目的,代表性的算法进行了调研,在这样一个环境中,每个智能体拥有独立的 Q network,独自采集数据并进行训练,都有对环境的全局观察,动作空间包含以下四个维度:上移、下移、保持不动以及击球(或称为开始游戏)。 作者为了全面的观察将 DQN 应用到多智能体环境下的各方面表现,通过设计回报函数的方式设计了完全协作环境、完全竞争环境以及非完全协作/竞争环境。具体回报函数设计如下: 完全协作环境:一方失球,则两方均获得 -1 的回报 完全竞争环境:一方失球,该方获得 -1 的回报;对方获得 +1 的回报 非完全协作/竞争环境:一方失球,该方获得 -1 的回报;对方获得 的回报 最终的实验结果表明,在完全协作环境中,智能体学到的策略是尽可能长时间的不失球;而在完全竞争环境中,智能体学到的是如何更好的得分(即让对方失球)。
资源详情
资源推荐
![](https://csdnimg.cn/release/download_crawler_static/12697906/bg1.jpg)
Tutorial:
Multi-Agent Learning
D Balduzzi, T Graepel, E Hughes, M Jaderberg, S Omidshafiei, J Perolat, K Tuyls
![](https://csdnimg.cn/release/download_crawler_static/12697906/bg2.jpg)
Joint work with many great collaborators, including:
Marc Lanctot
David Silver
Vinicius Zambaldi
Georg Ostrovski
Audrunas Gruslys
Christos Papadimitriou
Georgios Piliouras
Jean-Baptiste Lespiau
Remi Munos
Wojciech Czarnecki
Mark Rowland
Daniel Hennes
Dustin Morrill
Joel Z. Leibo
Sébastien Racanière
James Martens
Jakob Foerster
Edgar Duéñez-Guzmán Luke Marris Nicolas Heess Zhe Wang
Edward Lockhart Siqi Liu Michael Bowling Finbarr Timbers
Guy Lever
![](https://csdnimg.cn/release/download_crawler_static/12697906/bg3.jpg)
We won’t cover ...
● Single Agent Reinforcement Learning
○ Markov Decision Processes
○ Algorithms
● A good resource though
![](https://csdnimg.cn/release/download_crawler_static/12697906/bg4.jpg)
Part I. Background & Theory
1. Introduction
2. NFGs and Markov Games
3. Social Learning
![](https://csdnimg.cn/release/download_crawler_static/12697906/bg5.jpg)
● Motivation
● What is Multi-Agent Learning?
○ General Setup
○ Different Realizations: RL-based, Swarms, Evo-based
○ Role of (Evolutionary) Game Theory
● Game Theoretic Intuitions: NFG and Replicator Dynamics
● Opportunities & Challenges
Part I: Background & Theory
剩余230页未读,继续阅读
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/67475702baf3449591d7d93c9d5023f1_u014093545.jpg!1)
fendoudaoliming
- 粉丝: 1
- 资源: 3
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 构建智慧路灯大数据平台:物联网与节能解决方案
- 智慧开发区建设:探索创新解决方案
- SQL查询实践:员工、商品与销售数据分析
- 2022智慧酒店解决方案:提升服务效率与体验
- 2022年智慧景区信息化整体解决方案:打造数字化旅游新时代
- 2022智慧景区建设:大数据驱动的5A级管理与服务升级
- 2022智慧教育综合方案:迈向2.0时代的创新路径与实施策略
- 2022智慧教育:构建区域教育云,赋能学习新时代
- 2022智慧教室解决方案:融合技术提升教学新时代
- 构建智慧机场:2022年全面信息化解决方案
- 2022智慧机场建设:大数据与物联网引领的生态转型与客户体验升级
- 智慧机场2022安防解决方案:打造高效指挥与全面监控系统
- 2022智慧化工园区一体化管理与运营解决方案
- 2022智慧河长管理系统:科技助力水环境治理
- 伪随机相位编码雷达仿真及FFT增益分析
- 2022智慧管廊建设:工业化与智能化解决方案
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)