当batchsize大于1时，交叉熵如何计算

当batchsize大于1时，交叉熵的计算方式与batchsize等于1时略有不同。在多个样本的情况下，交叉熵损失函数的计算方式为将每个样本的交叉熵损失相加，然后再求平均值。具体来说，对于一个大小为batchsize的输入数据集，设第i个样本的标签为$y_i$，模型的预测输出为$\hat{y_i}$，则交叉熵损失函数的计算方式为： $$ \frac{1}{batchsize} \sum_{i=1}^{batchsize} -y_i log(\hat{y_i}) - (1-y_i)log(1-\hat{y_i}) $$ 其中，$log$表示自然对数。

def learn(self): # 从所有内存中抽样批处理内存 if self.memory_counter > self.memory_size:#随机选择一组，减少数据的依赖性 sample_index = np.random.choice(self.memory_size, size=self.batch_size) else: sample_index = np.random.choice(self.memory_counter, size=self.batch_size) batch_memory = self.memory[sample_index, :]#batch_memory是一个二维的 numpy 数组，用于存储从记忆库（memory）中随机选择的一批记忆（memory）数据。 h_train = torch.Tensor(batch_memory[:, 0: self.net[0]])#h_train是这批记忆的前self.net[0]个元素，即输入数据 m_train = torch.Tensor(batch_memory[:, self.net[0]:])#m_train是这批记忆的后面的元素，即标签。 optimizer = optim.Adam(self.model.parameters(), lr=self.lr,betas = (0.09,0.999),weight_decay=0.0001)#是一个 Adam 优化器，用来更新网络的参数，使得误差不断降低。 criterion = nn.BCELoss()#是一个二分类交叉熵损失函数，用来计算网络的预测结果和真实结果的误差，通过反向传播算法更新网络的参数，使得误差不断降低。 self.model.train() optimizer.zero_grad() predict = self.model(h_train)#得到网络的输出结果 loss = criterion(predict, m_train) loss.backward() optimizer.step() # 训练DNN self.cost = loss.item() assert(self.cost > 0) self.cost_his.append(self.cost)，给这段代码加注释

``` def learn(self): # 从所有内存中抽样批处理内存 if self.memory_counter > self.memory_size: # 随机选择一组，减少数据的依赖性 sample_index = np.random.choice(self.memory_size, size=self.batch_size) else: sample_index = np.random.choice(self.memory_counter, size=self.batch_size) # batch_memory是一个二维的 numpy 数组，用于存储从记忆库（memory）中随机选择的一批记忆（memory）数据。 batch_memory = self.memory[sample_index, :] # h_train是这批记忆的前self.net[0]个元素，即输入数据 h_train = torch.Tensor(batch_memory[:, 0: self.net[0]]) # m_train是这批记忆的后面的元素，即标签。 m_train = torch.Tensor(batch_memory[:, self.net[0]:]) # 是一个 Adam 优化器，用来更新网络的参数，使得误差不断降低。 optimizer = optim.Adam(self.model.parameters(), lr=self.lr, betas=(0.09, 0.999), weight_decay=0.0001) # 是一个二分类交叉熵损失函数，用来计算网络的预测结果和真实结果的误差， # 通过反向传播算法更新网络的参数，使得误差不断降低。 criterion = nn.BCELoss() # 将模型置于训练状态 self.model.train() # 清空梯度 optimizer.zero_grad() # 得到网络的输出结果 predict = self.model(h_train) # 计算损失函数 loss = criterion(predict, m_train) # 反向传播 loss.backward() # 更新网络参数 optimizer.step() # 记录本轮训练的损失函数值 self.cost = loss.item() # 检查损失是否大于 0 assert (self.cost > 0) # 将损失值记录到 self.cost_his 列表中 self.cost_his.append(self.cost) ``` 这段代码实现了深度神经网络的训练过程，具体细节如下： 1. 根据当前记忆库中存储的数据数量来决定如何进行批量抽样，从而减少数据之间的依赖性。 2. 将抽样得到的一批数据分别作为输入和标签，构成二维的 numpy 数组。 3. 初始化 Adam 优化器和二分类交叉熵损失函数。 4. 将模型置于训练状态，并清空梯度。 5. 将输入数据输入到模型中，得到模型的输出结果。 6. 计算网络的预测结果和真实结果之间的误差，并通过反向传播算法更新网络的参数，使得误差不断降低。 7. 记录本轮训练的损失函数值，并将其添加到 `self.cost_his` 列表中。

阅读全文

当batchsize大于1时，交叉熵如何计算

相关推荐

flume batchsize transactionCapacity capacity的简单理解

【目标检测】epoch、batch、batch_size理解

HW1批改标准_5366016141

加权交叉熵损失函数在不平衡数据处理中的应用

【深度学习损失选择】：均方误差与交叉熵的权衡

文本相似度计算：神经网络算法的实践指南

深度学习赋能计算机视觉：CNN、RNN与Transformer，解锁机器视觉新境界

向量化技术在计算机视觉中的应用：增强图像和视频处理能力，开启视觉新时代

【Python正则化技术解析】：L1与L2在神经网络中的应用详解

OpenCV部署YOLOv5-pose人体姿态估计（C++和Python双版本）.zip

ARIMA+Transformer+LSTM心跳时间序列预测模型源码+设计文档（课设新开发项目）.zip

体育馆管理系统(代码+数据库+LW)

基于HTML、TypeScript、JavaScript的全面运动健康手环App设计源码

2021科大讯飞车辆贷违预测大赛冠军源码+全部资料.zip

【锂电池剩余寿命预测】CNN卷积神经网络锂电池剩余寿命预测，马里兰大学锂电池数据集（Pytorch完整源码和数据）

大家在看

JESD47I中文版.docx

sdram 资料 原理。

运算放大器的设计及ADS仿真设计——两级运算放大器仿真设计

《Web服务统一身份认证协议设计与实现》本科毕业论文一万字.doc

[C#]文件中转站程序及源码

最新推荐

Keras框架中的epoch、bacth、batch size、iteration使用介绍

关于keras.layers.Conv1D的kernel_size参数使用介绍

在keras里面实现计算f1-score的代码

Python计算IV值的示例讲解

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

opencv的demo程序

sdram 资料原理。