神经网络学习笔记：概率转正与多分类方法详解

需积分: 0 74 浏览量更新于2024-08-04 收藏 212KB DOCX 举报

神经网络学习笔记1深入探讨了神经网络和深度学习的基本概念，特别是其在人工智能领域中的应用。首先，介绍了神经网络的核心功能，包括分类和回归任务。分类问题如图像识别，目标是确定样本属于哪个预定义类别，如男女识别；回归问题则预测连续数值，如根据图像预测人的体重。感知器作为神经网络的基础模型，模仿了人脑神经元的工作方式。它接受输入信号，通过内部计算判断输出，通常输出是0-1的连续或离散值。四种简单感知器——AND、OR、NOT和NOR，分别对应逻辑门操作，其中NOR感知器可以通过组合其他三种感知器实现异或功能。感知器算法的核心是梯度下降法，通过不断调整模型参数，使分类错误的样本与理想分类线之间的距离减小，直至达到最优解。为了处理非线性问题，误差函数被引入，要求其连续且可微分，以便于计算梯度。例如，对于多分类问题，误差函数可能采用交叉熵损失函数，配合softmax函数来计算每个类别的概率。在多分类场景下，softmax函数被广泛应用于输出层，它将每个节点的输出转换为概率分布，每个概率值表示该类别发生的可能性。此外，one-hot编码是一种常用的处理多分类问题的方法，它将类别转换为数字向量，如大象（100）、河马（010）和蚂蚁（001），便于模型理解和处理非数字形式的输入。这篇笔记提供了神经网络基础理论、算法流程以及关键工具的概述，强调了分类、回归任务的区别，以及如何通过优化方法解决复杂问题，如多类别分类和概率估计。通过理解和掌握这些概念，读者能够更好地入门神经网络的学习和实践。

5. 多类别分类和 softmax 函数

在输出层添加更多的输出节点，每个节点告诉我们每个结果的概率，将结果运用

softmax 函数就可以得到每个类别的概率。

6. One-hot 编码

对于多分类问题，可以把不同类别或者不是数字形式的输入转换成数字的形式，这就用

到 one-hot 编码。比如有大象、河马和蚂蚁三类，可以编码为 100，010，001，这样就可

以方便后续的训练处理。

7. 最大似然率和交叉熵

通过激活函数的处理的结果是处于 0-1 之间的数，也就是我们所说的概率。那么我们

就可以用概率的形式来评判模型的好坏，把概率低的模型转换成概率高的模型的过程就叫最

大似然法，也叫最大化概率。但是求概率的过程中我们运用了多次乘积的方法，在计算机中

乘积的形式效率比较低，而求和的效率比较高，于是我们希望把求积转换成求和，这就需要

借助 log 函数，因为 log（a+b）=loga + logb 。

引入 log 后我们发现对概率取 log 结果是负值，因为概率是处于 0-1 之间的数，log 在

[0,1]上是小于零的，所以我们对 log 的值取负，将其转换成正数。这一系列转换后出来的

结果就是我们所说的交叉熵，也就是我们可以把最大似然率转换成最小化交叉熵的形式。

其中，交叉熵的公式：

)1()lny1()(lny-Entropy -ross2n

pymn

)(lny-Entropy -ross

ppC

��

�

� �

�

� �

时，特殊得，当

是预测结果的概率是实际结果，是样本数，是特征数，其中，

剩余10页未读，继续阅读

weixin_35780426

粉丝: 24
资源: 286

神经网络学习笔记：概率转正与多分类方法详解

[原创]机器学习与神经网络学习笔记1

卷积神经网络学习笔记

神经网络学习笔记-神经网络基础（三）

卷积神经网络学习笔记.pdf

神经网络学习笔记及R实现.pdf

cs224w 图神经网络 学习笔记（一）Introduction1

10.1 RNN,LSTM,.GRU递归神经网络学习笔记

cs224w 图神经网络 学习笔记（三）Motifs and Structural Roles in Networks1

卷积神经网络 深度学习笔记1

cs224w 图神经网络 学习笔记（四）Snap.py_ SNAP for Python1

最新资源

cs224w 图神经网络学习笔记（一）Introduction1

cs224w 图神经网络学习笔记（三）Motifs and Structural Roles in Networks1

卷积神经网络深度学习笔记1

cs224w 图神经网络学习笔记（四）Snap.py_ SNAP for Python1