神经网络基础：从M-P神经元模型到正则化

需积分: 0 6 浏览量更新于2024-08-04 收藏 1.24MB DOCX 举报

"本文主要介绍了神经网络的基本概念和神经元模型，强调了正则化在防止过拟合中的重要作用，并简述了M-P神经元模型的结构和激活函数的使用，特别是Sigmoid函数的特性。" 在机器学习领域，神经网络是一种模仿生物神经系统的结构和功能的模型，用于处理各种复杂的学习任务。正则化是神经网络中一个至关重要的概念，其目的是通过在损失函数中加入惩罚项来控制模型的复杂度，避免过拟合现象。在训练过程中，正则化使网络在试图最小化预测误差的同时，也要最小化权重参数的大小，从而达到平衡模型性能和泛化能力的效果。神经网络的基本组成单元是神经元，它们通过复杂的连接方式形成网络。生物神经元具有树突、轴突和细胞体等结构，而在数学模型中，神经元被简化为M-P神经元模型。这个模型接受多个输入信号，每个信号都带有相应的权重，这些加权后的输入信号汇总后与神经元的阈值进行比较。如果总输入超过阈值，神经元会输出一个信号，否则不输出。激活函数在神经元模型中起到关键作用，它决定了神经元何时被激发。早期的M-P神经元模型使用了阶跃函数，但由于其非连续性和不光滑性，实际应用中往往采用Sigmoid函数作为替代。Sigmoid函数可以将实数范围内的输入值压缩到(0,1)之间，提供了连续且可微的输出，有利于网络的梯度下降优化过程。 Sigmoid函数的输出值可以解释为神经元的激活程度或概率，对于二分类问题，0.5通常作为分类的阈值。然而，Sigmoid函数在输入接近正负无穷时导数值非常小，可能导致梯度消失的问题，因此在现代深度学习中，人们更倾向于使用ReLU（Rectified Linear Unit）及其变种，如Leaky ReLU和ELU，这些激活函数在解决梯度消失问题上表现更好。神经网络通过正则化和合理的神经元模型来实现高效学习和泛化，而激活函数的选择则直接影响网络的表达能力和训练效果。随着研究的深入，神经网络模型和理论不断发展，如深度学习、卷积神经网络和循环神经网络等，为各种复杂问题的解决提供了强大的工具。

奋；若差值小于零则输出 0，对应抑制。但阶跃函数不连续，不光滑，故在 M-

P 神经元模型中，也采用 Sigmoid 函数来近似， Sigmoid 函数将较大范围内变

化的输入值挤压到 (0,1) 输出值范围内，所以也称为挤压函数（squashing

function）。

将多个神经元按一定的层次结构连接起来，就得到了神经网络。它是一种包含

多个参数的模型，比方说 10 个神经元两两连接，则有 100 个参数需要学习

（每个神经元有 9 个连接权以及 1 个阈值），若将每个神经元都看作一个函

数，则整个神经网络就是由这些函数相互嵌套而成。

##5.2 感知机与多层网络

感知机（Perceptron）是由两层神经元组成的一个简单模型，但只有输出层是

M-P 神经元，即只有输出层神经元进行激活函数处理，也称为功能神经元

（functional neuron）；输入层只是接受外界信号（样本属性）并传递给输出

层（输入层的神经元个数等于样本的属性数目），而没有激活函数。这样一

来，感知机与之前线性模型中的对数几率回归的思想基本是一样的，都是通过

对属性加权与另一个常数求和，再使用 sigmoid 函数将这个输出值压缩到 0-1

剩余12页未读，继续阅读

忧伤的石一

粉丝: 31
资源: 332

神经网络基础：从M-P神经元模型到正则化

第五章 神经网络控制

【完整版】清华大学精品AI人工智能课程 第8章 循环神经网络 含习题 共55页.pptx

第一章神经网络第四节训练神经网络1

第5章 卷积神经网络1

第 5 章 神经网络：多层感知器1

第五章 卷积神经网络(CNN)1

第1章 BP神经网络的数据分类.zip_BP神经网络_bp网络分类_神经网络分类_第1章 BP神经网络的数据分类

第五章_神经网络优化计算

第5章 线性神经网络.rar_线性神经网络

机器学习西瓜书笔记第五章神经网络及代码.rar

最新资源

第五章神经网络控制

【完整版】清华大学精品AI人工智能课程第8章循环神经网络含习题共55页.pptx

第5章卷积神经网络1

第 5 章神经网络：多层感知器1

第五章卷积神经网络(CNN)1

第5章线性神经网络.rar_线性神经网络