def _next_observation(self): # 获取下一个观察值 obs = np.array([ self.data.loc[self.current_step - self.window_size:self.current_step, 'Open'].values / 200, self.data.loc[self.current_step - self.window_size:self.current_step, 'High'].values / 200, self.data.loc[self.current_step - self.window_size:self.current_step, 'Low'].values / 200, self.data.loc[self.current_step - self.window_size:self.current_step, 'Close'].values / 200, self.data.loc[self.current_step - self.window_size:self.current_step, 'Volume'].values / 5000000000, self.profit / 10000 ]) return obs
时间: 2024-04-28 16:19:58 浏览: 199
feinieer_yuankong.rar_matlab 衍射_site:www.pudn.com_菲涅尔_菲涅尔参数_衍射演示
这段代码是一个私有方法 `_next_observation`,用于获取下一个观察值。在这个股票交易环境中,观察值包括了如下信息:
- 过去 `window_size` 个时间步的股票开盘价、最高价、最低价、收盘价和成交量,分别除以一个标量数值,这里是 `200`,以便将其限制在一个 `[0, 1]` 的范围内;
- 当前已经获得的收益,除以 `10000`,以便将其限制在一个比较小的范围内。
最后返回这些信息的数组,作为当前时间步的观察值。
阅读全文