神经网络训练策略与适用性探讨

需积分: 10 10 浏览量更新于2024-07-17 收藏 594KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"神经网络实际训练中的问题探讨深入到神经网络设计的实际应用中，选择合适的网络结构和训练策略至关重要。作者参考了马丁·Hagan编著的《神经网络设计》第二版第22章，该章节主要关注了以下几个关键点： 1. 问题适用性评估：在开始神经网络训练之前，首先要确定问题是否适合神经网络解决，而非线性问题如拟合难题才可能需要它。如果标准线性方法能满足需求，就不必引入复杂性更高的神经网络。 2. 网络结构选择：选择网络类型（如多层、竞争、动态等）和结构，包括确定层数、每层的神经元数量。这一步需要根据具体问题的特性来决定，比如输入向量的维度和变量之间的关系。 3. 数据准备：数据收集与预处理是关键步骤，确保数据覆盖所有可能的输入范围，以便训练出泛化能力强的模型。可能需要使用各种技术进行数据采样，尤其在高维输入空间中，如网格采样或应对输入变量的相互依赖。 4. 训练过程：分为三个阶段：训练前的准备工作，包括数据选择和预处理；训练阶段，选择合适的训练算法；以及训练后的分析，评估网络性能，通过调整数据、结构或算法来优化模型。 5. 训练流程：图1展示了一个典型的训练迭代流程，包括数据集划分（训练集、验证集和测试集）、网络结构设定、训练算法选择，以及训练完成后对网络性能的检验和改进。 6. 训练前工作：涉及数据选择、预处理，以及网络类型和结构的选择。数据选择要尽可能涵盖应用领域的所有输入情况，而网络设计需适应问题的复杂度。总结来说，神经网络的实际训练是一个结合理论和实践的过程，需要对问题特性有深入理解，并且灵活运用各种技术和方法来优化网络结构，以达到最佳的性能。通过不断的试错和优化，才能有效地训练出能够解决实际问题的神经网络模型。"

资源详情

资源推荐

3). 特征提取

特征提取通常应用在这种情况下：原始输入向量维数非常大，且输入向量组成有冗余。

特征提取的思想是减少输入空间的维度，通过从每个输入向量计算出一小组特征，用特征作

为网络的输入。例如，神经网络可以用于分析心电图（EKG），以定位心脏问题。数分钟之

内以高采样频率测得的心电图可能牵涉 12 至 15 个信号，将其直接应用到神经网络，数据则

显得过多。取而代之的是，从心电图信号提取特定的某些特征，例如特定波形间的平均时间

间隔，特定波形的平均幅值。

4). 主成分分析

也有一些通用的特征提取方法，主成分分析（PCA）就是其中的一种。这种方法将原始

输入向量变换为线性不相关的向量。而且，变换后的向量按方差从大到小排列。我们通常仅

仅保留变换后的前几个主要成分，因为他们在原始向量中方差最大。如果原始向量高度相关，

这就会极大减小输入向量的维数。PCA 的缺点是只考虑了输入向量间的线性相关性。如果

用线性变换减小维度，那么可能丢失一些非线性信息。因为使用神经网络的主要目的，就是

要获取它强大的非线性映射能力，所以对于运用主成分分析来减小输入向量维数应该非常谨

慎。有一种非线性版的 PCA，叫做 kernel PCA．

5). 编码目标

当输入和目标无论何时都只接受离散值时，编码也是一个重要的必要的预处理步骤。例

如，在模式识别问题中，每个目标都代表有限类别中的一个，这种情况就需要一个对输入和

目标编码的过程。如果一个模式识别问题具有四个类别，那么对目标编码至少有三种常见的

方法。一是，可以用标量目标接收四个可能的值（如：1、2、3、4）。二是，可以用二维目

标按二进制码表示四个类别（如：[0,0]、[0,1]、[1,0]、[1,1]）。三是，可以用四维目标，一

次激活一个元素（如：[1,0,0,0]、[0,1,0,0]、[0,0,1,0]、[0,0,0,1]）。在实验中第三种方法比较

容易产生最好的结果。离散输入编码也可以采用同样的方式。

当编码目标值的时候，还需要考虑网络输出层所用的传输函数。对于模式识别问题，通

常使用 sigmoid 函数：log-sigmoid 或者 tangent-sigmoid 函数。如果在最后一层选用 tangent-

sigmoid 函数，那么可以考虑用函数的渐近线-1 和 1 作为目标值。但是这样会为训练算法带

来麻烦，算法会试图使函数饱和来迎合目标值。目标值的最佳点是在二阶导数最大的地方。

对于 tangent-sigmoid 函数，输入-1 和 1 对应输出为-0.76 和 0.76．

应用在多层模式识别网络中的另一个传输函数是 softmax 函数。该函数形如公式 3：

softmax 函数的输出可以解释为与每个类相关的概率。每个输出都落在[0,1]的区间上，

且输出的总和等于 1．

6). 丢失数据

还有一个要考虑的实际问题是丢失数据的处理。这是经常出现的情况，特别是处理有缺

剩余18页未读，继续阅读

吴少风

粉丝: 131
资源: 5

神经网络训练策略与适用性探讨

MATLAB神经网络43个案例分析.pdf 源码.rar

人工神经网络原理及实际应用.pdf

matlab神经网络43个案例分析.pdf

物理信息神经网络:用于解决涉及非线性偏微分方程的正逆问题的深度学习框架.pdf

arcgis深度学习.pdf

刘金锟rbf神经网络自适应控制matlab仿真pdf

matlab 神经网络43个案例分析 pdf

mit deep learning.pdf

深度学习——卷积神经网络算法原理与应用 pdf

卷积神经网络代码作业PDF

神经网络设计原书第二版pdf

matlab 神经网络工具箱 教程 pdf

斯坦福大学-深度学习基础教程.pdf

神经网络 函数拟合 pdf

动手学深度学习 pytorch.pdf csnd

matlab神经网络30个案例 pdf

小波神经网络理论及应用pdf东北大学出版社

深入浅出图神经网络 pdf下载

deep-learning-with-pytorch.pdf 15章

envi deep learning v1.0深度学习操作教程_202003.pdf

最新资源

matlab 神经网络工具箱教程 pdf

神经网络函数拟合 pdf