softmax函数与多分类：从神经网络到FashionMNIST

182 浏览量更新于2024-08-30 1 收藏 257KB PDF 举报

test_label) = tf.keras.datasets.fashion_mnist.load_data() 本文主要讨论了softmax分类和独热编码在多分类问题中的应用。softmax函数是logistic回归的扩展，适用于处理具有多个类别的问题。它能够将神经网络的原始输出转换为一个概率分布，其中每个类别的概率之和为1。在神经网络模型中，原始输出通常是非线性变换后的数值，不具备概率含义。softmax函数通过应用指数函数和归一化处理，使得每个类别的概率在0到1之间，且整个分布的总和为1。这样，模型可以输出每个类别的概率，从而进行多分类预测。例如，预测一个人可能来自的城市，softmax函数将给出每个城市对应的概率，概率最高的城市即为预测结果。 softmax函数的形式为：softmax(xi) = exp(xi) / Σ(exp(xj))，其中xi表示第i个类别的得分，Σ表示对所有类别得分求和。当类别数量为2时，softmax函数就等同于logistic回归，输出两个类别的概率。在机器学习中，为了计算损失和优化模型，通常会使用交叉熵作为损失函数。对于多分类问题，tensorflow.keras提供了categorical_crossentropy和sparse_categorical_crossentropy函数。前者用于已经进行独热编码的标签，而后者适用于用整数表示类别的情况。 FashionMNIST数据集被用作MNIST数据集的替代，包含10个类别共70000张灰度图像，其中60000张用于训练，10000张用于测试。这个数据集具有较高的复杂性，适合检验和调试算法的性能。通过导入tensorflow库，可以直接加载FashionMNIST数据集进行多分类任务的训练和评估。在实际应用中，数据预处理是必不可少的步骤，包括将图像数据归一化到0到1之间，以及将标签转换为适合softmax函数和交叉熵损失函数的形式。例如，可以使用one-hot编码将类别标签转化为二进制向量，每个类别对应一个维度，只有一个维度的值为1，其余为0。这有助于模型理解和处理多分类问题。 softmax分类结合独热编码是解决多类别问题的有效方法，通过神经网络的输出和适当的损失函数，可以训练出能够进行概率预测的模型。在实践中，如FashionMNIST这样的数据集是检验和开发模型的理想选择。

softmax分类分类独热编码独热编码

对数几率回归解决的是二分类二分类的问题，对于多个选项的问题，我们可以使用softmax函数，它是对数几率回归在 N 个可能不同的

值上的推广。

神经网络的原始输出不是一个概率值，实质上只是输入的数值做了复杂的加权和（乘以w+b）与非线性处理之后的一个值而已，那

么

如何将这个输出变为概率分布输出变为概率分布？ -这就是Softmax层的作用层的作用了

softmax要求每个样本必须属于某个类别，且所有可能的样本均被覆盖

1.softmax个样本分量之和为 1

（1）概率之和为1.预测一个人来自广州，还是广西，上海等地，，这是个多分类问题，softmax分类之后，谁的概率大，预测值

就是谁，当只有两个值的时候，->2。

2.当只有两个类别时，与对数几率回归完全相同

tf.keras交叉熵交叉熵

在tf.keras里，对于多分类问题我们使用

categorical_crossentropy 和

sparse_categorical_crossentropy #顺序数字编码时使用

来计算softmax交叉熵

Fashion MNIST 数据集数据集

Fashion MNIST 的作用是成为经典 MNIST 数据集的简易替换， MNIST 数据集包含手写数字（0、1、2 等）的图像，这些图像的

格式与本节课中使用的服饰图像的格式相同。

Fashion MNIST 比常规常规 MNIST手写数据集更具挑战性。这两个数据集都相对较小，用于验证某个算法能否如期正常运行。它们

都是测试和调试代码的良好起点。

Fashion MNIST 数据集包含 70000 张灰度图像，涵盖 10 个类别。

我们将使用 60000 张图像训练网络，并使用 10000 张图像评估经过学习的网络分类图像的准确率。

可以从 TensorFlow 直接访问 Fashion MNIST，只需导入和加载数据即可

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38534352

粉丝: 5
资源: 982

softmax函数与多分类：从神经网络到FashionMNIST

多分类问题详解：逻辑回归与独热编码在鸢尾花识别中的应用

鸢尾花分类实践：环境配置与数据预处理

李宏毅深度学习教程（1.0.5版）：从基础到实践

softmax一个独热编码

python _softmax多分类.rar

softmax的严格数学推导与证明

python写softmax分类三类平面上的二维点的代码

读取csv文件，将其中的五个已知标签进行独热编码，再把结果进行lstm模型的序列预测

最新资源