GaussNewton-QuasiNewton法解决前馈神经网络残量问题

需积分: 8 201 浏览量更新于2024-08-12 收藏 336KB PDF 举报

"这篇论文是2004年发表在《武汉大学学报(工学版)》第37卷第1期上的一篇工程技术类论文，由徐晋和暴振法共同撰写。研究主要关注如何有效解决前馈神经网络在学习过程中遇到的小残量和大残量问题。" 正文: 在前馈神经网络的学习过程中，优化算法的选择对于网络的性能至关重要。传统的最速下降法虽然简单，但在处理非凸和多模态的损失函数时可能会陷入局部最小值，而GaussNewton法则通过近似Hessian矩阵来加速收敛，但对大残量问题可能不够有效。针对这一问题，该论文提出了一种新的综合算法，将GaussNewton法和QuasiNewton法结合起来，形成GaussNewton-QuasiNewton法的前馈神经网络。 QuasiNewton算法是一种优化方法，它通过近似Hessian矩阵的逆来更新权重，其优点在于不需要直接计算Hessian矩阵，减少了计算复杂性，尤其适合于高维问题。而GaussNewton法是另一种优化策略，它在最小二乘问题中特别有效，通过对梯度的泰勒展开式进行线性化来近似Hessian矩阵，从而快速收敛。论文中，作者根据每次迭代后的结果来判断当前问题是属于小残量还是大残量，然后灵活选择使用GaussNewton迭代步还是QuasiNewton迭代步。这种动态切换的策略旨在平衡这两种算法的优点，既能快速收敛，又能处理大残量问题，提高神经网络的全局优化能力。实验部分，论文对比了新提出的GaussNewton-QuasiNewton法的前馈神经网络与基于最速下降法的经典前馈神经网络以及仅使用GaussNewton法的前馈神经网络。实验结果表明，新算法在解决残量问题上表现出色，具有更好的收敛性和稳定性，这在实际应用中具有重要意义，因为快速收敛和稳定性是神经网络模型训练的关键指标。总结起来，这篇2004年的研究工作提出了一个创新的优化算法，将GaussNewton法和QuasiNewton法结合，解决了前馈神经网络学习中的小残量和大残量问题，提升了神经网络的训练效果。这一算法的提出对于当时的神经网络理论发展和实践应用有着积极的推动作用，也为后来的深度学习优化策略提供了有益的参考。

第

卷第

期

2004

年

月

文章编号

:1671-8844(2004)01-113-04

武汉大学学报(工学版)

Engineering Journal

Wuhan University

前馈神经网络新型综合算法

徐晋1，

暴振法

(l.上海交通大学管理学院，上海

200030;2.

山东理工大学管理学院，山东淄博

255049)

l. 37

No.

Feb. 2004

摘要:为了实时解决前馈神经网络学习过程中可能遇到的小残量问题和大残量问题，引入

QuasiNewton

优化算

法，并与

GaussNewton

法相结合，构建基于

GaussN

ewton-QuasiN

ewton

法的前馈神经网络.根据每次迭代的结

果判断属于大残量问题还是小残量问题，进而选择采取

GaussNewton

迭代步或

QuasiNewton

迭代步.与基于最

速下降法的经典前馈神经网络以及与基于

GaussNewton

法的前馈神经网络的对比实验表明，所构造的基于

GaussNewton-QuasiNewton

法的前馈神经网络较好地解决了残量问题，具有良好的收敛性和稳定性.

关键词:前馈神经网络;

GaussNewton

法;

QuasiNewton

法;残量问题;收敛性;稳定性

中图分类号

:TP18

文献标识码

A new integrated algorithm of feed-forward neural network

Jin!.2 ,

Zhen-fa

(l.

School of Management. Shanghai Jiaotong University. Shanghai

200030.

China;

2. School of Management. Shandong Polytechnic University.

Zibo

255049.

China)

Absíract:

order

solve

the

little

and

large

residual

problems

the

same

time

QuasiNewton

algo-

rithm

introduced

and

combined

with

the

GaussNewton

algorithm

form

feed-forward

neural

network

based

GaussNewton-QuasiNewton

algorithm.

According

the

iteration

result

little

large

residual

problem

could

identified;

and

steps

based

GaussNewton

QuasiNewton

algorithm

could

chosen

口

sequence.

Comparing

with

the

feed-forward

neural

network

based

fast

de-

scent

GaussNewton

algorithm

the

new

feed-forward

neural

network

based

GaussNewton-QuasiN-

ewton

algorithm

can

solve

the

residual

problem

properly;

and

its

convergence

and

stability

perform

wel

Key

words:

feed-forward

neural

network;

GaussNewton

algorithm;

QuasiNewton

algorithm;

residual

problem;

convergence;

stability

前馈神经网络

(Feed-forward

Neural

Net-

work)

在神经网络理论研究与非线性系统建模及

控制中占据非常重要的地位

[IJ

目前的研究重点主

要集中在网络权值学习算法川、误差函数川、网络

结构

[4J

以及相关的收敛性和稳定性等方面.基于优

化理论可以给出许多权值学习算法，包括应用较为

广泛的最速下降法，以及近年来提出的基于

ussN

ewton

法的权值学习算法，并因此派生出

许多衍生算法与应用研究

[5J

许多文献对基于

收稿日期:

2003-10-10

GaussNewton

法的前馈神经网络进行改进，并取

得良好成果

[6J

值得商榷的是，有些应用和研究不

加证明地假定基于

GaussNewton

法的权值学习算

法具有全局二阶收敛性.事实上，无论是基于

GaussNewton

法还是其衍生算法的权值学习算

法，在解决小残量或零残量问题时具有局部二阶收

敛速度，而在解决神经网络学习过程中可能出现的

大残量问题时，则可能收敛很慢或不收敛而导致网

络性能不稳定.这主要因为在

GaussNewton

法及

作者简介:徐

晋

0976-)

.男，江苏涟水人，博士研究生，副教授，研究方向为风险投资、复杂性理论.

基金项目

国家自然科学基金资助项目(编号

:7017200

1).

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38627603

粉丝: 0

GaussNewton-QuasiNewton法解决前馈神经网络残量问题

详解三层前馈神经网络的BP算法原理与应用

前馈神经网络与SSA算法的预测与数据处理

基于推广卡尔曼滤波的前馈神经网络快速学习算法

前馈神经网络混合训练算法及其应用 (2014年)

前馈神经网络混合训练算法及其应用.pdf

前馈神经网络中BP算法的一种改进 (2001年)

基于单隐层前馈神经网络的优化算法.pdf

复前馈神经网络算法

针对近似建模的前馈神经网络训练算法 (2009年)

前馈神经网络的混沌BP混合学习算法 (2004年)

最新资源