1000字介绍卷积神经网络常用的激励函数

时间: 2023-10-30 16:53:52 浏览: 37
卷积神经网络 (Convolutional Neural Networks, CNNs) 是深度学习中应用广泛的一类神经网络,常常用于图像处理和计算机视觉任务。激活函数是神经网络中一个非常重要的组成部分,它们能够在神经元之间传递信号,从而实现神经网络的非线性映射。本文将对卷积神经网络中常用的激活函数进行介绍。 1. Sigmoid 函数 Sigmoid 函数是最早被使用的激活函数之一,它可以将任意实数映射到区间 (0, 1) 上。它的公式为: $$f(x) = \frac{1}{1+e^{-x}}$$ Sigmoid 函数的优点是在输入较小时输出接近于 0,在输入接近于无限大时输出接近于 1。但是,当输入较大或较小时,函数的导数会趋近于 0,从而导致梯度消失的问题。此外,Sigmoid 函数的输出不是以 0 为中心的,这可能会对后续层的表现产生负面影响,这也是 Sigmoid 函数逐渐被淘汰的原因之一。 2. Tanh 函数 Tanh 函数是另一种常用的激活函数,它可以将任意实数映射到区间 (-1, 1) 上。它的公式为: $$f(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}}$$ Tanh 函数也存在梯度消失的问题,但它的输出是以 0 为中心的,这意味着其输出的均值为 0,这有助于减少后续层的偏差。因此,在某些情况下,Tanh 函数的表现可能比 Sigmoid 函数更好。 3. ReLU 函数 ReLU 函数是最流行的激活函数之一,它可以将所有负值都归零,将所有正值保持不变。其公式如下: $$f(x) = max(0, x)$$ ReLU 函数具有以下优点:(1)它不会导致梯度消失问题;(2)它的计算速度非常快;(3)它可以使网络更加稀疏,从而减少过拟合的风险。但是,ReLU 函数也存在一些问题,例如它可能会导致神经元死亡、输出不是以 0 为中心等等。 4. Leaky ReLU 函数 Leaky ReLU 函数是对 ReLU 函数的改进,它在输入为负值时不会完全归零,而是乘上一个小的斜率。其公式如下: $$f(x) = max(\alpha x, x)$$ 其中,$\alpha$ 是一个小的正数。Leaky ReLU 函数的优点是可以避免神经元死亡问题,同时仍然可以使网络更加稀疏。 5. ELU 函数 ELU 函数是另一种对 ReLU 函数的改进,它在输入为负值时不会完全归零,而是使用一个类似于 Sigmoid 函数的曲线。其公式如下: $$f(x) = \begin{cases} x, & \text{if } x > 0 \\ \alpha (e^x - 1), & \text{otherwise} \end{cases}$$ 其中,$\alpha$ 是一个小的正数。ELU 函数的优点是可以避免神经元死亡问题,同时可以使输出以 0 为中心,从而避免后续层的表现受到负面影响。 6. Softmax 函数 Softmax 函数是一种特殊的激活函数,常用于多分类问题中。它可以将多个实数映射到 (0, 1) 区间上,并且这些实数的和为 1。其公式如下: $$f(x_i) = \frac{e^{x_i}}{\sum_{j=1}^Ke^{x_j}}$$ 其中,$K$ 是类别数量。Softmax 函数将每个输入值都转化为代表该类别概率的值,可以用于分类任务的输出层。 总之,卷积神经网络中常用的激活函数有 Sigmoid 函数、Tanh 函数、ReLU 函数、Leaky ReLU 函数、ELU 函数和 Softmax 函数。不同的激活函数适用于不同的场景,需要根据具体情况进行选择。

相关推荐

最新推荐

recommend-type

卷积神经网络研究综述_周飞燕.pdf

同时,还分别介绍了卷积神经网络的监督学习、无监督学习训练方法以及一些常用的开源工具.此外,该文以图像分类、人脸识别、音频检索、心电图分类及目标检测等为例,对卷积神经网络的应用作了归纳.卷积神经网络与递归...
recommend-type

使用卷积神经网络(CNN)做人脸识别的示例代码

主要介绍了使用卷积神经网络(CNN)做人脸识别的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
recommend-type

Tensorflow实现卷积神经网络用于人脸关键点识别

主要介绍了Tensorflow实现卷积神经网络用于人脸关键点识别,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
recommend-type

基于卷积神经网络的高光谱图像深度特征提取与分类.docx

Deep Feature Extraction and Classification of Hyp全文翻译(带公式)
recommend-type

深度卷积神经网络在计算机视觉中的应用研究综述_卢宏涛.pdf

本文首先简要介绍深度学习和卷积神经网络的兴起与发展,概述卷积神经网络的基本模型结构、卷积特征提取和池化操作。然后综述了基于深度学习的卷积神经网络模型在图像分类、物体检测、姿态估计、图像分割和人脸识别等...
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

MATLAB柱状图在信号处理中的应用:可视化信号特征和频谱分析

![matlab画柱状图](https://img-blog.csdnimg.cn/3f32348f1c9c4481a6f5931993732f97.png) # 1. MATLAB柱状图概述** MATLAB柱状图是一种图形化工具,用于可视化数据中不同类别或组的分布情况。它通过绘制垂直条形来表示每个类别或组中的数据值。柱状图在信号处理中广泛用于可视化信号特征和进行频谱分析。 柱状图的优点在于其简单易懂,能够直观地展示数据分布。在信号处理中,柱状图可以帮助工程师识别信号中的模式、趋势和异常情况,从而为信号分析和处理提供有价值的见解。 # 2. 柱状图在信号处理中的应用 柱状图在信号处理
recommend-type

HSV转为RGB的计算公式

HSV (Hue, Saturation, Value) 和 RGB (Red, Green, Blue) 是两种表示颜色的方式。下面是将 HSV 转换为 RGB 的计算公式: 1. 将 HSV 中的 S 和 V 值除以 100,得到范围在 0~1 之间的值。 2. 计算色相 H 在 RGB 中的值。如果 H 的范围在 0~60 或者 300~360 之间,则 R = V,G = (H/60)×V,B = 0。如果 H 的范围在 60~120 之间,则 R = ((120-H)/60)×V,G = V,B = 0。如果 H 的范围在 120~180 之间,则 R = 0,G = V,B =
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。