action_dist = torch.distributions.Categorical(probs) action = action_dist.sample() action_dist是Tensor[1,2]，为什么action是1

根据你提供的代码，action是从action_dist中采样得到的，而action_dist是一个Categorical分布对象，它的参数probs是一个形状为[1, 2]的张量，表示两个离散动作的概率分布。在这里，Categorical分布会根据概率分布来随机选择一个动作，因此action的值是0或1，对应于这两个离散动作。由于action_dist.sample()返回的是一个随机采样的张量，所以action的值是0或1，而不是action_dist的形状[1, 2]中的任何一个数值。如果你想要得到一个张量，包含了大量的采样数据，你可以使用action_dist.sample_n(n)方法来生成n个样本。

ction_dist = torch.distributions.Categorical(probs) action = action_dist.sample()怎么让action输出Tensor(1,2)

如果需要将action的形状从[1]变为[1, 2]，可以使用torch.unsqueeze()方法来增加一个维度。代码如下： ``` action_dist = torch.distributions.Categorical(probs) action = action_dist.sample() action = torch.unsqueeze(action, 1) ``` 这里使用了torch.unsqueeze()方法，在第1个维度增加了一个维度，将形状从[1]变为[1, 1]。如果你需要在第2个维度增加一个维度，可以使用torch.unsqueeze(action, 2)。最后，使用torch.repeat()方法将整个张量在第2个维度上重复一次，从而得到形状为[1, 2]的张量。代码如下： ``` action_dist = torch.distributions.Categorical(probs) action = action_dist.sample() action = torch.unsqueeze(action, 1) action = action.repeat(1, 2) ```

class torch.distributions.Categorical(probs)

`torch.distributions.Categorical(probs)`是PyTorch中的一个概率分布类，用于表示具有离散取值的随机变量。它的参数`probs`是一个概率张量，表示每个离散取值的概率。该类可以用于模拟离散随机变量的采样、计算随机变量的概率密度函数（probability density function, PDF）、计算随机变量的对数概率密度函数（log probability density function, log PDF）等操作。例如，可以使用`Categorical`类来模拟抛硬币的结果，其中正面出现的概率为0.6，反面出现的概率为0.4： ```python import torch from torch.distributions import Categorical probs = torch.tensor([0.6, 0.4]) dist = Categorical(probs) # 采样一个随机变量 sample = dist.sample() print(sample) # 输出0或1，表示正面或反面 # 计算随机变量的概率密度函数 pdf = dist.log_prob(sample) print(pdf) # 输出一个张量，表示正面或反面的对数概率 ``` 以上代码中，`sample`表示一次抛硬币的结果，它的值为0或1，对应正面或反面。`pdf`表示抛硬币结果对应的对数概率。

阅读全文

action_dist = torch.distributions.Categorical(probs) action = action_dist.sample() action_dist是Tensor[1,2]，为什么action是1

ction_dist = torch.distributions.Categorical(probs) action = action_dist.sample()怎么让action输出Tensor(1,2)

class torch.distributions.Categorical(probs)

相关推荐

Python脚本size_dist.py：分析fastq和bam读取大小分布

ANT项目发布配置：深入解析_build.xml_文件

掌握LHS.zip文件：拉丁超立方抽样方法详解与应用

torch.distributions.categorical

torch.distributions.Categorical

A2C python实现

资源解包工具：dist_zip文件处理

uClinux-dist开发者指南：1.1版配置与程序添加详解

rip宣告网段选择版本

基于springboot+vue的学生选课系统（Java毕业设计，附源码，部署教程）.zip

基于BP神经网络的电力负荷预测-基于BP神经网络的短期电力负荷预测源码

基于springboot+vue的常规应急物资管理系统（Java毕业设计，附源码，部署教程）.zip

网站系统渗透测试报告.doc

I型NPC三电平逆变器 仿真 有三相逆变器参数设计，SVPWM，直流均压控制，双闭环控制说明文档（可加好友另算） SVPWM调制 中点电位平衡控制，LCL型滤波器 直流电压1200V，交流侧输出线电

燕山大学EDA综合实训实验报告.doc

一个基于qt实现钩子屏蔽系统按键、任务管理器、任务栏实例

headers-more-nginx-module-v0.34.tar.gz 下载 headers-more-nginx-module是Nginx的第三方模块，它提供了一些额外的功能，用于设置HTTP

牢大防火墙_牢大防火墙.apk

大家在看

dmx512无线舞台灯光系统

SIMATIC S71200和1500安全编程指南

INCA用的A2L文件生成脚本

计算机组成原理课程设计复杂模型机设计实现冒泡排序

CMOS反相器的掩膜版图-集成电路版图设计

最新推荐

rip宣告网段选择版本

基于springboot+vue的学生选课系统（Java毕业设计，附源码，部署教程）.zip

基于BP神经网络的电力负荷预测-基于BP神经网络的短期电力负荷预测源码

基于springboot+vue的常规应急物资管理系统（Java毕业设计，附源码，部署教程）.zip

网站系统渗透测试报告.doc

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

I型NPC三电平逆变器仿真有三相逆变器参数设计，SVPWM，直流均压控制，双闭环控制说明文档（可加好友另算） SVPWM调制中点电位平衡控制，LCL型滤波器直流电压1200V，交流侧输出线电