TensorFlow交叉熵详解：sigmoid_cross_entropy_with_logits

需积分: 8 97 浏览量更新于2024-09-09 收藏 21KB DOCX 举报

"这篇资源主要介绍了TensorFlow中计算交叉熵的四种方法，特别是强调了交叉熵函数`tf.nn.sigmoid_cross_entropy_with_logits`的使用细节。" 在机器学习和深度学习中，交叉熵（Cross Entropy）是一种常用的损失函数，尤其在分类任务中，用于衡量模型预测的概率分布与真实标签之间的差异。TensorFlow提供了多种计算交叉熵的方法，以便适应不同的场景和需求。首先，我们来看`tf.nn.sigmoid_cross_entropy_with_logits`这个函数。它主要用于二元分类问题，尤其是当标签可以表示为连续概率值而非硬编码的0或1时。该函数接受两个参数，`logits`和`labels`，其中`logits`是模型的原始输出，通常是未经激活的神经网络层的输出，而`labels`是实际的标签，也是与`logits`相同形状的浮点数张量。`logits`和`labels`的数据类型应该是`float32`或`float64`。函数内部会先对`logits`应用sigmoid函数，然后计算sigmoid后的输出与`labels`之间的交叉熵。这样做的好处是可以避免直接计算logits和标签的交叉熵时可能出现的数值溢出问题。由于`logits`经过sigmoid转换后，其值域在0到1之间，因此计算交叉熵更稳定。计算公式如下： \[ E = -\sum_{i=1}^{num\_classes}{y_i \cdot \log(\sigma(logits_i)) + (1 - y_i) \cdot \log(1 - \sigma(logits_i))} \] 其中，\( \sigma \) 是sigmoid函数，\( y_i \) 是第i个类别的标签值，\( logits_i \) 是对应的logits值。示例代码展示了如何使用Python和Numpy手动计算交叉熵，以及如何在TensorFlow中实现。最后，通常我们需要用`tf.reduce_mean(loss)`来计算整个批次的平均损失，以得到单个的损失值，用于模型训练过程中的反向传播。除了`tf.nn.sigmoid_cross_entropy_with_logits`，TensorFlow还提供了其他交叉熵计算方法，如`tf.nn.softmax_cross_entropy_with_logits_v2`用于多分类任务，`tf.nn.sparse_softmax_cross_entropy_with_logits`处理稀疏标签，以及`tf.nn.weighted_cross_entropy_with_logits`用于加权交叉熵，这些函数分别适用于不同的分类场景和优化需求。了解并正确使用TensorFlow中的交叉熵函数对于构建和优化分类模型至关重要。根据具体问题选择合适的交叉熵计算方式，能够有效提高模型的训练效果和泛化能力。

Tensorow 交叉熵函数：cross_entropy

注意：

tensorow

交叉熵计算函数输入中的

logits

都不是

softmax

或

sigmoid

的输出，

而是

softmax

或

sigmoid

函数的输入，因为它在函数内部进行

sigmoid

或

softmax

操

作

.nn.sigmoid_cross_entropy_with_logits(_sennel=None, labels=None, logits=None,

name=None)

argument:

_sentinel:本质上是不用的参数，不用填

logits:一个数据类型（type）是 oat32 或 oat64;

shape:[batch_size,num_classes],单样本是[num_classes]

labels:和 logits 具有相同的 type(oat)和 shape 的张量(tensor)，

labelsϵ {0.0,1.0 }

name:操作的名字，可填可不填

output:

loss，shape:[batch_size,num_classes]

Note:

它对于输入的 logits 先通过 sigmoid 函数计算，再计算它们的交叉熵，但是它对交叉

熵的计算方式进行了优化，使得结果不至于溢出

它适用于每个类别相互独立但互不排斥的情况：例如一幅图可以同时包含一条狗和一

只大象

output 不是一个数，而是一个 batch 中每个样本的 loss,所以一般配合

tf.reduce_mea(loss)使用

计算公式：

y=labels

=sigmoid

(

logits

)

1+e

−logits

loss

=−[ y

∗ln p

(

1− y

)

(

1− p

)

]

Python 程序：

import tensorow as tf

import numpy as np

def sigmoid(x):

return 1.0/(1+np.exp(-x))

# 5

个样本三分类问题，且一个样本可以同时拥有多类

y = np.array([[1,0,0],[0,1,0],[0,0,1],[1,1,0],[0,1,0]]

logits = np.array([[12,3,2],[3,10,1],[1,2,5],[4,6.5,1.2],[3,6,1]])

y_pred = sigmoid(logits)

E1 = -y*np.log(y_pred)-(1-y)*np.log(1-y_pred)

print(E1) #

按计算公式计算的结果

下载后可阅读完整内容，剩余3页未读，立即下载

清舞sunny

粉丝: 40
资源: 1

TensorFlow交叉熵详解：sigmoid_cross_entropy_with_logits

TensorFlow框架下的序列预测与交叉熵计算

TensorFlow入门：学习速率与最小化交叉熵

TensorFlow教程：利用0.01学习速率最小化交叉熵

基于tensorflow的交叉熵算法.rar_tensorflow_交叉熵_交叉熵；tensorflow_深度学习

tensorflow中四种不同交叉熵函数tf.nn.softmax_cross_entropy_with_logits() -

交叉熵tensorflow交叉熵损失

tensorflow中如何用交叉熵损失函数

tensorflow 交叉熵函数名称

tensorflow

TensorFlow

最新资源