稳定基准代理：Tensorflow 1.15下的RL算法性能参考

需积分: 9 120 浏览量更新于2024-12-05 收藏 15.26MB ZIP 举报

资源摘要信息:"stable-baselines-agent" 本资源是一个包含经过训练强化学习（Reinforcement Learning，简称RL）代理的代码仓库，名为“stable-baselines-agent”。该仓库的主要目的是提供一个稳定的基准，使研究者和开发者能够利用一系列经过广泛测试的强化学习算法来评估和比较不同模型的性能。仓库中的RL代理都经过了训练，因此可以直接使用，也可以作为进一步研究和开发的基础。在使用此仓库之前，需要关注以下几点要求： 1. 环境依赖：仓库中包含了一个名为requirements.txt的文件，列出了运行该仓库所必需的Python包和它们的版本。使用者需要根据该文件来安装所有必要的依赖库。 2. TensorFlow版本兼容性：目前该仓库仅支持TensorFlow版本小于等于1.15。这意味着使用者在安装TensorFlow时，需要特别注意选择正确的版本，以确保仓库能够正常运行。 3. GPU支持：如果用户计划在具有GPU加速的环境中运行这些代理，还需要安装特定版本的CUDA和cuDNN库。根据仓库中的描述，需要CUDA版本为10.0.130，cuDNN版本为7.6.5。这些版本需要与TensorFlow版本兼容，以确保最佳性能。 4. 环境管理：由于Python环境配置的复杂性，推荐使用如conda这样的工具来管理不同库的版本和虚拟环境。这样可以避免依赖冲突和环境问题，确保项目在不同机器上的一致性和可靠性。【标签】:"Python" 这个标签强调了该资源是使用Python编程语言开发的。Python因为其简洁易读的语法、强大的库支持以及在数据科学、机器学习和AI领域的广泛应用而广受欢迎。在本仓库中，开发者可能使用了如NumPy、Pandas、TensorFlow等Python库来实现强化学习算法和训练代理。【压缩包子文件的文件名称列表】: stable-baselines-agent-main 这个文件名称表明用户获取的是一个压缩的包，其解压后的主目录名为“stable-baselines-agent-main”。这意味着用户在下载并解压这个资源后，应该在“stable-baselines-agent-main”这个目录中进行后续的开发和研究工作。总结来说，“stable-baselines-agent”是一个为了强化学习算法研究而精心设计的资源，其通过提供经过训练的代理和清晰的使用要求来简化了研究流程。不过，需要注意的是，由于对TensorFlow和CUDA等组件有特定的版本要求，用户在使用之前需要仔细检查和配置环境。此外，Python作为该仓库的主要开发语言，为用户提供了一种强大而灵活的工具，以实现复杂的强化学习任务。

收起资源包目录

stable-baselines-agent （335个子文件）

cig_map1_lv1.cfg 741B

_vizdoom.ini 11KB

reward_shaper.py 6KB

flatmap_lv9.cfg 733B

_vizdoom.ini 11KB

midterm_demo.cfg 870B

_vizdoom.ini 11KB

augmented_ppo2.py 29KB

reward_shaper.py 6KB

_vizdoom.ini 11KB

reward_shaper.py 6KB

my_way_home.cfg 922B

README.md 739B

policies.py 13KB

_vizdoom.ini 11KB

health_gathering.cfg 853B

vizdoom-crash.log 15KB

defend_the_center.cfg 900B

_vizdoom.ini 11KB

take_cover.cfg 761B

multi_deathmatch.cfg 795B

rocket_basic_easy_random.cfg 579B

_vizdoom.ini 11KB

reward_shaper.py 6KB

simpler_my_way_home.cfg 929B

game_wrapper.py 11KB

rocket_medium.cfg 590B

_vizdoom.ini 11KB

vec_curiosity_wrapper_icm.py 18KB

flatmap_lv8.cfg 733B

_vizdoom.ini 11KB

deadly_corridor.cfg 893B

_vizdoom.ini 11KB

basic.cfg 895B

deathmatch.cfg 1KB

reward_shaper.py 6KB

_vizdoom.ini 11KB

flatmap_lv1.cfg 733B

_vizdoom.ini 11KB

flatmap_lv5.cfg 733B

reward_shaper.py 6KB

_vizdoom.ini 11KB

oblige_0.cfg 737B

flatmap_lv3.cfg 733B

_vizdoom.ini 11KB

my_cig_01_lv1.cfg 741B

rocket_basic_easy.cfg 572B

reward_shaper.py 6KB

predict_position.cfg 932B

my_cig_01.cfg 737B

reward_shaper.py 6KB

_vizdoom.ini 11KB

reward_shaper.py 6KB

_vizdoom.ini 11KB

reward_shaper.py 6KB

midterm_demo_3.cfg 894B

simpler_deathmatch.cfg 984B

_vizdoom.ini 11KB

reward_shaper.py 6KB

vec_tf_wrapper.py 10KB

_vizdoom.ini 11KB

evaluate_recurrent_policy.py 9KB

vec_curiosity_wrapper_rdn.py 11KB

cig.cfg 775B

_vizdoom.ini 11KB

bots.cfg 5KB

rocket_basic.cfg 567B

health_gathering_supreme.cfg 861B

reward_shaper.py 6KB

README.md 6KB

rocket_basic2.cfg 568B

flatmap_lv6.cfg 733B

reward_shaper.py 6KB

flatmap_lv7.cfg 733B

loops.py 18KB

midterm_demo_2.cfg 876B

flatmap_lv4.cfg 733B

_vizdoom.ini 11KB

simpler_basic.cfg 503B

defend_the_line.cfg 824B

.gitignore 112B

flatmap_lv2.cfg 733B

_vizdoom.ini 11KB

reward_shaper.py 6KB

共 335 条

刘岩Lyle

粉丝: 46
资源: 4680

稳定基准代理：Tensorflow 1.15下的RL算法性能参考

stable-baselines-zh:Stable Baselines官方文档中文版

PyPI 官网下载 | stable_baselines-2.2.0-py3-none-any.whl

强化学习环境类与训练脚本介绍及stable-baselines库安装

stable_baselines3在训练时显示出智能体所有获得的奖励值

Multi_agent_Reinforcement_Learning-master_PYTHON强化学习_learningpyt

Reinforcement-Learning-Resources-and-Code

Python-中文整理的强化学习资料ReinforcementLearning

Python-来自三星公司的深度强化学习教程资料

PyTorch实现Stable Baselines3强化学习库

Stable Baselines：强化学习算法的改进与实用工具集

最新资源