一般认为,增加隐层数可以降低网络误差(也有文献认为不一定能有效降低),提高精
度,但也使网络复杂化,从而增加了网络的训练时间和出现
“
过拟合
”
的倾向。
一般来讲应设计
神经网络应优先考虑
3
层网络(即有
1
个隐层)。
一般地,靠增加隐层节点数来获得较低的误
差,其训练效果要比增加隐层数更容易实现。对于没有隐层的神经网络模型,实际上就是一个
线性或非线性(取决于输出层采用线性或非线性转换函数型式)回归模型。因此,一般认为,
应将不含隐层的网络模型归入回归分析中,技术已很成熟,没有必要在神经网络理论中再讨论
之。
二
在
BP
网络中,隐层节点数的选择非常重要,它不仅对建立的神经网络模型的性能影响很大,
而且是训练时出现
“
过拟合
”
的直接原因,但是目前理论上还没有一种科学的和普遍的确定方
法。 目前多数文献中提出的确定隐层节点数的计算公式都是针对训练样本任意多的情况,而且
多数是针对最不利的情况,一般工程实践中很难满足,不宜采用。事实上,各种计算公式得到
的隐层节点数有时相差几倍甚至上百倍。为尽可能避免训练时出现
“
过拟合
”
现象,保证足够高
的网络性能和泛化能力,确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能
紧凑的结构,即取尽可能少的隐层节点数。研究表明,隐层节点数不仅与输入
/
输出层的节点数
有关,更与需解决的问题的复杂程度和转换函数的型式以及样本数据的特性等因素有关。
在确定隐层节点数时必须满足下列条件:
(
1
)
(其中
N
为训练样本数),否则,网络模型的系统误差与训练
样本的特性无关而趋于零,即建立的网络模型没有泛化能力,也没有任何实用价值。同理可推
得:输入层的节点数(变量数)必须小于
N-1
。
(2)
训练样本数必须多于网络模型的连接权数,一般为
2~10
倍
,否则,样本必须分成几部分
并采用
“
轮流训练
”
的方法才可能得到可靠的神经网络模型。
总之,若隐层节点数太少,网络可能根本不能训练或网络性能很差;若隐层节点数太多,虽然
可使网络的系统误差减小,但一方面使网络训练时间延长,另一方面,训练容易陷入局部极小
点而得不到最优点,也是训练时出现
“
过拟合
”
的内在原因。因此,合理隐层节点数应在综合考
虑网络结构复杂程度和误差大小的情况下用节点删除法和扩张法确定。