Pendulum-v0源码

以下是Pendulum-v0的源码实现，你可以直接在Gym官方GitHub仓库中查看完整的代码实现：https://github.com/openai/gym/blob/master/gym/envs/classic_control/pendulum.py ```python import gym from gym import spaces from gym.utils import seeding import numpy as np from os import path class PendulumEnv(gym.Env): metadata = { 'render.modes': ['human', 'rgb_array'], 'video.frames_per_second': 30 } def __init__(self, g=10.0): self.max_speed = 8 self.max_torque = 2. self.dt = .05 self.g = g self.m = 1. self.l = 1. self.viewer = None high = np.array([1., 1., self.max_speed], dtype=np.float32) self.action_space = spaces.Box( low=-self.max_torque, high=self.max_torque, shape=(1,), dtype=np.float32) self.observation_space = spaces.Box( low=-high, high=high, dtype=np.float32) self.seed() self.state = None def seed(self, seed=None): self.np_random, seed = seeding.np_random(seed) return [seed] def step(self, u): th, thdot = self.state # th := theta g = self.g m = self.m l = self.l dt = self.dt u = np.clip(u, -self.max_torque, self.max_torque)[0] self.last_u = u # for rendering costs = angle_normalize(th) ** 2 + .1 * thdot ** 2 + .001 * (u ** 2) newthdot = thdot + (-3 * g / (2 * l) * np.sin(th + np.pi) + 3. / (m * l ** 2) * u) * dt newth = th + newthdot * dt newthdot = np.clip(newthdot, -self.max_speed, self.max_speed) # pylint: disable=E1111 self.state = np.array([newth, newthdot]) return self._get_obs(), -costs, False, {} def reset(self): high = np.array([np.pi, 1]) self.state = self.np_random.uniform(low=-high, high=high) self.last_u = None return self._get_obs() def _get_obs(self): theta, theta_dot = self.state return np.array([np.cos(theta), np.sin(theta), theta_dot], dtype=np.float32) def render(self, mode='human'): from gym.envs.classic_control import rendering if self.viewer is None: self.viewer = rendering.Viewer(500, 500) self.viewer.set_bounds(-2.2, 2.2, -2.2, 2.2) rod = rendering.make_capsule(1, .2) rod.set_color(.8, .3, .3) self.pole_transform = rendering.Transform() rod.add_attr(self.pole_transform) self.viewer.add_geom(rod) axle = rendering.make_circle(.05) axle.set_color(0, 0, 0) self.viewer.add_geom(axle) fname = path.join(path.dirname(__file__), "assets/clockwise.png") self.img = rendering.Image(fname, 1., 1.) self.imgtrans = rendering.Transform() self.img.add_attr(self.imgtrans) self.viewer.add_onetime(self.img) self.pole_transform.set_rotation(self.state[0] + np.pi / 2) if self.last_u: self.imgtrans.scale = (-self.last_u / 2, np.abs(self.last_u) / 2) return self.viewer.render(return_rgb_array=mode == 'rgb_array') def close(self): if self.viewer: self.viewer.close() self.viewer = None def angle_normalize(x): return (((x+np.pi) % (2*np.pi)) - np.pi)

相关推荐

深度强化学习+DoubleDQN+Pytorch+Pendulum-v0

Pendulum

DeepReinforcementLearning：深度RL实施。 在pytorch中实现的DQN，SAC，DDPG，TD3，PPO和VPG。 经过测试的环境：LunarLander-v2和Pendulum-v0

怎么下载pendulum-v0环境

pendulum-v0里的代码怎么改能适合Pendulum-v1环境

pendulum-v0里的代码怎么改能在Pendulum-v1环境中运行

Env Pendulum-v0 not found (valid versions include ['Pendulum-v1'])

gym.error.deprecatedenv: env pendulum-v0 not found (valid versions include ['pendulum-v1'])

详细介绍Pendulum-v1

DQN算法实现pendulum-v1

Environment version v0 for Pendulum is deprecated. Please use Pendulum-v1 instead. 20

代码如何解决f"Environment version v{version} for {get_env_id(ns, name, None)} is deprecated. " gym.error.DeprecatedEnv: Environment version v0 for Pendulum is deprecated. Please use Pendulum-v1 instead.问题

python pendulum

Pendulum ppo实现

unity中Pendulum怎么创建

inverted_pendulum python

策略梯度在 Pendulum 环境下应用

撰写in_pendulum_zyc'

最新推荐

zigbee-cluster-library-specification

管理建模和仿真的文件

【实战演练】MATLAB用遗传算法改进粒子群GA-PSO算法

openstack的20种接口有哪些

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

【实战演练】时间序列预测用于个体家庭功率预测_ARIMA, xgboost, RNN

怎么在集群安装安装hbase

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

关系数据表示学习

DeepReinforcementLearning：深度RL实施。在pytorch中实现的DQN，SAC，DDPG，TD3，PPO和VPG。经过测试的环境：LunarLander-v2和Pendulum-v0