深度强化学习代码库：使用游戏验证DRL算法

需积分: 17 19 浏览量更新于2025-01-05 收藏 5.02MB ZIP 举报

该存储库中包含了用pygame开发或修改的游戏，以及由Unity ML-agents构成的环境，用于实现各种DRL算法。在介绍部分，博士升提到了他使用这个存储库通过游戏来验证他所实现的DRL代码。这些游戏中，有一些是自己制作的，另一些则是对现有游戏的修改，以便更好地适应强化学习算法的应用。此外，他提到已经通过经典的Breakout游戏对所实现的算法性能进行了验证。在描述DRL代码的设置步骤时，作者强调了他特别关注于描述DQN（Deep Q-Network）算法的实现。DQN是一种将深度学习与强化学习结合的算法，它使用神经网络来近似Q值函数，从而解决复杂的决策问题。存储库中所用到的技术栈包括： 1. 操作系统：Windows7（64位） 2. 编程语言：Python 3.6.5和Python4.2.0 3. 主要的深度学习框架：Tensorflow-GPU 1.12.0，用于加速训练过程 4. 游戏开发库：pygame 1.9.3，用于游戏的创建与修改 5. 计算机视觉库：opencv3 3.1.0，用于图像处理和游戏状态识别 6. 硬件配置：一个高性能的CPU（Intel Core i7-4790K @ 4.00GHz）和一个强大的GPU（GeForce GTX 1080TI），以及16GB的内存，共同为DRL算法的训练提供支持关于DRL算法的具体实现，作者提到了一些常见的算法变种，包括但不限于： - DQN（Deep Q-Network） - DDQN（Double Deep Q-Network） - DRQN（Deep Recurrent Q-Network） - A3C（Asynchronous Advantage Actor-Critic） - RND（Random Network Distillation） - PER（Prioritized Experience Replay） - NoisyNet-DQN（噪声网络DQN）这些算法在不同的环境和任务中可能表现出不同的效果，而作者则根据自己的实验经验，强调了每种算法在特定情境下的性能表现。存储库的文件结构以'DRL-master'为压缩包文件名，暗示了这是一个主干代码库，可能包含了多种DRL算法的实现，并且可能以模块化的方式组织各个算法的代码。例如，DQN算法的代码可能会被单独组织在一个目录下，而DDQN或DRQN的代码则分别在其他目录中。这样的结构方便开发者根据需求直接查看和使用特定的DRL算法实现代码。总的来说，该存储库为研究和应用深度强化学习算法提供了一个实践平台，特别是对于那些希望通过游戏环境来验证算法性能的研究者和开发者来说，提供了很大的便利。通过这个平台，研究人员可以进一步探索和改进DRL算法，以提高其在各种复杂环境中的表现和效率。"

展开

资源目录

收起资源包目录

深度强化学习代码库：使用游戏验证DRL算法（147个子文件）

11_IQN.py 17KB

README_Algorithms.md 7KB

pong.PNG 36KB

tetris.PNG 33KB

2017-11-20_15_42_PER_breakout7.8303030303.png 31KB

breakout.PNG 17KB

2017-11-24_6_35_C51_breakout1.01396877568.png 136KB

wormy.png 25KB

2017-11-22_17_13_C51_breakout-1.0.png 165KB

13_RND_DQN.py 17KB

Remote_2.png 8KB

Remote_6.png 9KB

2017-10-19_0_41_Noisy_DQN_breakout41.7384615385.png 28KB

2017-12-06_16_25_DARQN_breakout2.91728212703.png 78KB

pong_test.PNG 6KB

PER_equation1.png 26KB

12_ICM_DQN.py 17KB

2017-11-02_2_6_Noisy_DQN_wormynan.png 32KB

Obstacle_1.png 3KB

asGame.PNG 5KB

architecture_Dueling.png 210KB

architecture_DRQN.png 109KB

algorithm_PER.png 353KB

2017-11-22_11_38_C51_0.00025_breakout2.34755332497.png 140KB

2017-12-07_18_10_DARQN_breakout4.48520710059.png 86KB

KTngbaGTq.gif 244KB

DQN_equation.PNG 16KB

Remote_6.png 9KB

dot.py 18KB

rock_icon.png 18KB

icon_resize.png 5KB

2017-10-19_10_34_DDQN_breakout8.37125748503.png 29KB

breakout.gif 477KB

2017-10-19_13_47_Duel_DQN_breakout17.7396449704.png 28KB

03_Prioritized_Experience_Replay.py 17KB

2017-11-24_6_35_C51_breakout4.64077669903.png 134KB

Obstacle_1.png 3KB

Small_Rock_furniture_icon.png 19KB

Remote_3.png 7KB

rock_icon.png 18KB

Host.png 7KB

icon_resize.png 5KB

2017-11-12_14_44_C51_breakout9.23758865248.png 32KB

NoisyNet_Loss.PNG 13KB

Remote_5.png 8KB

2017-11-19_22_31_C51_breakout4.26785714286.png 33KB

easy_grid.png 23KB

2017-11-23_1_53_C51_breakout7.87575757576.png 162KB

2017-10-19_19_51_DRQN_breakout13.8416289593.png 33KB

2017-12-30_13_56_DQN_pong8.33195020747.png 27KB

2017-10-19_10_28_DQN_breakout11.1461538462.png 30KB

Remote_2.png 8KB

icon.png 23KB

dot_test.PNG 30KB

breakout.PNG 17KB

Remote_5.png 8KB

Remote_4.png 7KB

dot_test.py 18KB

tetris.py 21KB

pong_test.PNG 6KB

PER_equation3.png 11KB

pong.PNG 36KB

Remote_3.png 7KB

icon_resize2.png 4KB

Performance.png 300KB

2017-11-23_8_9_C51_breakout1.50493096647.png 172KB

goal.png 4KB

NoisyNet_Algorithm.PNG 172KB

dodge.PNG 25KB

icon_resize2.png 4KB

icon.png 23KB

PER_equation2.png 24KB

Remote_1.png 8KB

2017-10-27_8_21_Noisy_DQN_breakout36.125.png 30KB

Dueling_Equation1.png 63KB

README.md 4KB

2017-10-19_14_32_DDQN_breakout11.7741935484.png 30KB

2017-11-22_15_34_C51_breakout1.24933214604.png 138KB

2017-10-19_20_34_PER_breakout21.024.png 28KB

KTngbaGTq.gif 244KB

2017-11-22_2_26_C51_breakout-1.0.png 42KB

2017-12-07_6_42_DARQN2_breakout9.98207885305.png 75KB

DDQN_equation.PNG 21KB

2017-11-02_2_6_DQN_wormy-0.112.png 47KB

Small_Rock_furniture_icon.png 19KB

PER_equation4.png 18KB

Remote_1.png 8KB

Remote_4.png 7KB

2017-10-20_11_8_PDD_DQN_breakout14.219047619.png 32KB

2017-11-26_21_41_C51_breakout5.36.png 105KB

2017-11-23_7_52_C51_breakout1.14358108108.png 162KB

NoisyNet_Description.PNG 280KB

2017-12-05_10_9_DARQN_breakout3.18351477449.png 36KB

2017-11-21_10_22_PER_breakout11.4008264463.png 31KB

dot_game.PNG 46KB

2017-11-26_21_41_C51_breakout3.34733441034.png 103KB

Host.png 7KB

README_Games.md 3KB

goal.png 4KB

共 147 条

身份认证购VIP最低享 7 折!

30元优惠券

tafan

粉丝: 43

深度强化学习代码库：使用游戏验证DRL算法

Python-各种DRL算法的PyTorch实现

DRL_面试

DRL:深度强化学习

drl4dypm:深度强化学习以实现动态组合管理

fenics-DRL:来自文件https的存储库

drl-trainers:深度强化模型训练师

强化学习与神经网络的结合：深度强化学习（DRL）

setup-mujoco-gym-for-DRL:如何建立Openai体育馆和Mujoco进行深度强化学习研究的指南

rl-policies-attacks-defenses:深度强化学习（RL）的对抗性攻击

DRL_Navigation：Udacity深度强化学习课程的第一个项目

最新资源