区间神经网络的极端学习机:IELM算法

2 下载量 6 浏览量 更新于2024-08-26 1 收藏 420KB PDF 举报
"这篇论文探讨了区间神经网络(Interval Neural Network)的学习方法,尤其是在面对不确定性、不精确性或可变性的问题时,区间数据作为信息表示的优势。文章提出了一种新的学习机制——区间极限学习机(Interval Extreme Learning Machine, IELM),它是基于极限学习机(Extreme Learning Machine, ELM)的扩展,旨在解决区间神经网络中反向传播(BP)算法学习速度慢的问题。ELM以其快速的学习速度优于BP算法,而在IELM中,作者将ELM的第一步随机生成权重的方法应用到区间神经网络,但在确定隐藏层到输出层权重的第二步,由于非线性约束,无法直接使用ELM的原方法。因此,他们借鉴BP算法的思想来形成一个非线性优化问题,以适应IELM的需求。数值实验结果显示,IELM不仅在学习速度上远超BP算法,而且在泛化性能上也表现出显著优势,尽管其训练误差略高于BP,暗示BP可能过拟合。" 在区间计算(Interval Computation)领域,区间神经网络是一种处理区间数据的有效工具,其输入和输出都包含区间成分,权重为实数。传统的反向传播算法在处理这类网络时效率低下,而极限学习机(ELM)的引入为解决这一问题提供了新思路。ELM的核心在于其两步学习过程:首先,随机生成输入层到隐藏层的权重;然后,通过Moore-Penrose逆广义化确定隐藏层到输出层的权重。在IELM中,第一步可以被直接应用,但第二步需要针对区间神经网络的特性进行调整。 通过对区间神经网络的深入研究,作者提出了IELM,它在保留ELM高效学习能力的同时,能够处理区间数据的非线性约束。通过对常规前馈神经网络的改进,IELM在实际应用中展现出更优的泛化能力和更快的训练速度。这些发现对于处理不确定性问题的机器学习模型有着重要意义,特别是在需要考虑区间数据特性的复杂系统中,如工程、科学计算以及数据分析等领域。通过IELM,可以更好地理解和预测系统行为,减少因不确定性导致的错误。