详细阐述Sigmiod激活函数的原理与概念以及优缺点

时间: 2024-03-12 13:31:45 浏览: 119

8. 激活函数和优缺点1

激活函数的种类、优缺点和应用场景激活函数是神经网络中的一种重要组件，用于引入非线性因素，使得神经网络能够学习和表示更加复杂的关系。常见的激活函数有sigmoid、tanh、relu和Leak relu等。 1. sigmoid sigmoid函数是一种常用的激活函数，其函数表达式为g(z) = 1 / (1 + exp(-z))，其中z是一个线性组合。sigmoid函数的功能是把一个实数压缩至0到1之间，使得其输出可以看作是一种分类的概率。例如，输出为0.9可以解释为90%的概率为正样本。sigmoid函数的性质是可以把分隔平面压缩到[0,1]区间的一个数（向量），在线性分割平面值为0时候正好对应sigmoid值为0.5，大于0对应sigmoid值大于0.5，小于0对应sigmoid值小于0.5；0.5可以作为分类的阀值。然而，sigmoid函数也存在一些缺点。例如，容易饱和，使得在反向传播中容易出现梯度消失，导致权重无法更新，无法学习输入数据。此外，sigmoid函数的输出不是0均值的，这会导致后层的神经元的输入是非0均值的信号，对梯度产生影响。 2. tanh tanh函数是sigmoid函数的变形，图形如上图右所示。tanh函数把实值输入压缩到-1~1的范围，因此它基本是0均值的，也就解决了上述sigmoid函数的第二个缺点。然而，tanh函数还是存在梯度饱和的问题。 3. relu relu函数是一种非常流行的激活函数，常见于卷积层。relu函数的优点是：Krizhevsky et al. 发现使用 ReLU 得到的 SGD 的收敛速度会比 sigmoid/tanh 快很多。此外，relu函数的计算复杂度也较低，只需要一个阈值就可以得到激活值。然而，relu函数也存在一些缺点。例如，在训练的时候很”脆弱”，一不小心有可能导致神经元”坏死”。如果这个情况发生了，那么这个神经元之后的梯度就永远是0了，也就是relu神经元坏死了，不再对任何数据有所响应。 4. Leaky relu Leaky ReLU 是用来解决 ReLU 坏死的问题的。和 ReLU 不同，当x<0时，它的值不再是0，而是一个较小斜率（如0.01等）的函数。这样，既修正了数据分布，又保留了一些负轴的值，使得负轴信息不会全部丢失。选择合适的激活函数对神经网络的性能有着非常重要的影响。不同的激活函数有其优缺点，需要根据具体情况进行选择。

Sigmoid激活函数是一种常用的非线性激活函数，其数学公式为： $$ f(x) = \frac{1}{1+e^{-x}} $$ 其函数图像为一个S形曲线，将输入值映射到0到1之间的输出值。 Sigmoid激活函数的优点： 1. 输出值在0到1之间，可以用于二分类问题的输出层，输出为1代表正样本，输出为0代表负样本。 2. Sigmoid函数有良好的导数性质，导数为$f(x)(1-f(x))$，容易求导，方便在反向传播中更新权重。 Sigmoid激活函数的缺点： 1. Sigmoid函数在输入的绝对值很大或很小的时候，函数的导数会趋近于0，这就会导致梯度消失的问题。 2. Sigmoid函数的输出不是以0为中心的，即输入很大或很小时，输出接近于1或0，这会导致输出的均值远离0，影响模型的收敛速度。 3. Sigmoid函数的计算比ReLU等函数计算开销大。综上所述，Sigmoid激活函数适合用于二分类问题的输出层，但在深度神经网络中，由于其存在梯度消失和输出均值偏移的问题，常常被其他激活函数所替代，如ReLU、LeakyReLU、ELU等。

阅读全文

详细阐述Sigmiod激活函数的原理与概念以及优缺点

相关推荐

关于激活函数

深度学习 激活函数概念

如何用代码画一个Sigmiod激活函数曲线

Sigmoid函数的分段非线性拟合法及其FPGA实现-论文

机器学习：逻辑回归与Python代码实现

卷积神经网络中Sigmiod函数的优缺点

简述sigmiod分类函数雨softmax分类函数的区别

设计一个sigmiod函数,要求可以实现从a到b的变化，在很短时限内完成

softmax和sigmiod

sigmiod怎么用

为什么Sigmiod更适合二分类

sigm激活函数

基于springboot大学生就业信息管理系统源码数据库文档.zip

基于java的驾校收支管理可视化平台的开题报告.docx

原木5秒数据20241120.7z

毕业设计&课设_基于 Vue 的电影在线预订与管理系统：后台 Java（SSM）代码，为毕业设计项目.zip

基于springboot课件通中小学教学课件共享平台源码数据库文档.zip

基于java的网上购物商城的开题报告.docx

最新推荐

基于springboot大学生就业信息管理系统源码数据库文档.zip

基于java的驾校收支管理可视化平台的开题报告.docx

原木5秒数据20241120.7z

毕业设计&课设_基于 Vue 的电影在线预订与管理系统：后台 Java（SSM）代码，为毕业设计项目.zip

基于springboot课件通中小学教学课件共享平台源码数据库文档.zip

全国江河水系图层shp文件包下载

管理建模和仿真的文件

Keras模型压缩与优化：减小模型尺寸与提升推理速度

MTK 6229 BB芯片在手机中有哪些核心功能，OTG支持、Wi-Fi支持和RTC晶振是如何实现的？

点云二值化测试数据集的详细解读

深度学习激活函数概念