怎么使action有两个值
时间: 2024-03-08 19:50:00 浏览: 44
如果你需要得到两个形状为[1, 2]的张量,可以使用action_dist.sample((2,))方法。这样,你就可以得到一个形状为[2, 1]的张量,其中的每个元素都是0或1,表示两个离散动作的选择情况。代码如下:
```
action_dist = torch.distributions.Categorical(probs)
action = action_dist.sample((2,)).unsqueeze(1)
```
这里的参数(2,)表示你需要采样2个样本,每个样本的形状为[1, 2]。最后使用unsqueeze(1)将张量的形状从[2, 2]变为[2, 1, 2],这样每个样本都是形状为[1, 2]的张量。
阅读全文