基于重构误差的DBN网络深度自动确定方法

115 浏览量更新于2024-09-03 1 收藏 388KB PDF 举报

"DBN网络的深度确定方法是解决深度信念网络（Deep Belief Network, DBN）在训练时隐含层层数选择困难的问题。该方法基于数学生物学的分析，探讨了随机初始化的梯度下降法导致网络训练失败的原因，并通过实验验证了RBM（受限玻尔兹曼机）重构误差与网络能量的正相关性。进而提出了一种利用重构误差来判断网络深度的方法，在训练过程中让网络自组织地调整其结构，以更接近人类处理问题的方式来解决人工智能问题，如手写数字识别。实验证明，这种方法能提高运算效率并降低计算成本，对无监督学习和数字识别具有积极影响。" 深度信念网络（DBN）是一种多层的无监督学习模型，由多个受限玻尔兹曼机（RBM）层堆叠而成，常用于特征学习和预训练。在DBN中，隐含层的数量是一个关键参数，它直接影响到模型的复杂性和学习能力。然而，选择合适的层数一直是一个挑战。传统的做法是通过尝试不同的层数来寻找最优解，这既耗时又可能错过最佳结构。该研究首先从数学和生物学的角度出发，深入剖析了随机初始化的梯度下降法在训练DBN时可能导致失败的原因。随机初始化可能导致网络陷入局部最优，无法有效地探索全局解决方案。通过实验，研究人员证明了RBM的重构误差与网络的能量函数存在正相关关系。这意味着重构误差可以作为衡量网络性能的一个重要指标。基于这个发现，他们提出了一种新的网络深度判断策略。在训练过程中，该方法会监测RBM的重构误差，当误差达到一定阈值时，添加新的隐含层，以期望进一步降低误差。这一过程允许网络自适应地调整其深度，使得网络结构更加优化，更适应数据的复杂性。通过这种方式，DBN能够在处理AI问题时，模仿人类的思维方式，逐步构建和改进其表示能力。实验在手写数字识别任务上验证了该方法的有效性。手写数字识别是机器学习领域的一个经典问题，通常使用MNIST数据集进行测试。结果显示，采用这种基于重构误差的网络深度确定方法，不仅提高了运算效率，还降低了计算成本，这对于资源有限的环境尤其重要。这项工作为DBN的网络深度选择提供了一个新的理论依据和实践方法，对于优化深度学习模型的性能和训练过程具有重要意义。同时，这种方法可能对其他依赖深度学习的领域，如图像识别、自然语言处理等，也具有参考价值。

第 30 卷第 2 期

Vol. 30 No. 2

控制与决策

Control and Decision

2015 年 2 月

Feb. 2015

DBN 网络的深度确定方法

文章编号: 1001-0920 (2015) 02-0256-05 DOI: 10.13195/j.kzyjc.2013.1390

潘广源, 柴伟, 乔俊飞

(北京工业大学电子信息与控制工程学院，北京 100124)

摘要: 针对DBN网络隐含层层数难以选择的问题, 首先从数学生物学角度分析了随机初始化的梯度下降法导致网

络训练失败的原因, 并进行验证, 证明了 RBM 重构误差与网络能量的正相关定理; 然后根据隐含层和误差的关系, 提

出一种基于重构误差的网络深度判断方法, 在训练过程中自组织地训练网络, 使其能够以一种接近人类处理问题的

方式解决 AI 问题. 手写数字识别的实验表明, 该方法能够有效提高运算效率, 降低运算成本.

关键词: 深度信念网络；网络深度；无监督学习；数字识别

中图分类号: TP273 文献标志码: A

Calculation for depth of deep belief network

PAN Guang-yuan, CHAI Wei, QIAO Jun-fei

(College of Electronic Information and Control Engineering，Beijing University of Technology，Beijing 100124,

China．Correspondent：QIAO Jun-fei，E-mail：pgy yuki@outlook.com)

Abstract: In order to calculate the depth of deep belief network(DBN) in its applications, the reason of failure in training by

using random initialization in gradient-based is analyzed in both math and biology, and then veriﬁed by the test. The theorem

that the reconstruction error of restricted boltzmann machine(RBM) is related to network’s energy function is proved. After

that, a method to calculate the depth by using restructure error in RBM is proposed based on the relationship between hidden

layers and errors. DBN approaches human-level performance in AI tasks after the self-training. The experiment of hand

writing digital recognition shows that the proposed method can improve the efﬁciency and lower the cost.

Keywords: deep belief network；depth；unsupervised learning；digital recognition

0 引引引言言言

人工神经网络是对大脑工作方式的模拟, 在机器

学习 (ML) 和人工智能 (AI) 等领域发挥着重要作用.

生物学家发现哺乳动物的大脑具有一种层次的结

构

[1]

, 这种结构使动物在认知世界时, 不断提取从外

界接收的信号, 每次提取信号中一个或多个方面的特

征, 最终在最后一层将一个抽象的概念传递给大脑,

形成动物对世界的认知

[2]

. 人的认知过程是逐层进

行、逐步抽象的, 并且深层结构的神经网络能够有效

提高工作效率, 避免所谓维数灾难或降低其危害. 根

据这种思想, 多伦多大学的 Hinton 教授提出了深度信

念网络 (DBN)

[3]

, 实现了人工神经网络在多隐含层建

立工作中的突破.

DBN 已成功应用于多个领域

[4-8]

, 但仍处于发展

初期, 许多问题值得深入研究. 目前 DBN 缺乏有效的

并行训练算法, 因此其在应用中仍使用经验法选择隐

含层层数和神经元个数, 这样不仅误差较大, 而且不

利于网络的扩展应用, 造成计算成本较高, 效率较低.

蒙特利尔大学的 Bengin 教授在文献 [9] 中指出: 能否

确定一个合适的网络深度, 使 DBN 能够向人类处理

问题那样, 解决几乎所有的 AI 问题? 该问题是开放性

的, 研究该问题, 探索 DBN 在 AI 领域的应用研究, 具

有重要意义.

因 DBN 涉及的范围较广, 难以给出一个标准答

案, 所以可将问题进行转化, 即不以人为方式对网络

深度进行规定, 而是通过设置一个机制, 让网络自身

来计算最合适的深度. 因此, 根据问题和要求的不同,

得出的结果也不同. 首先, 本文通过分析 DBN 中有监

督学习和无监督学习的训练过程, 得出网络深度和

训练误差之间的关系, 并以此为基础, 提出一种基于

收稿日期: 2013-10-09；修回日期: 2014-01-12.

基金项目: 国家杰出青年科学基金项目(61225016)；国家自然科学基金重点项目(61034008)；北京市自然科学基金青

年基金项目(4144067).

作者简介: 潘广源(1987−), 男, 博士生, 从事深度神经网络的结构优化、智能控制的研究；乔俊飞(1968−), 男, 教授, 博

士生导师, 从事神经网络结构与算法优化、污水处理控制与优化等研究.

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38650150

粉丝: 5
资源: 910

基于重构误差的DBN网络深度自动确定方法

DBN实例1深度信念网络,dbn深度置信网络,matlab源码.rar

深度学习最佳深度的确定.pdf

【Java机器学习算法库：深度信念网络（DBN）实现】：构建深度学习模型的捷径

dbn在深度学习中的发展意义

DBN深度置信网络是否适合用于回归问题

DBN网络和BP神经网络

DBN深度置信网络如何用于回归问题

深度信念网络dbn matlab

matlab dbn网络

python如何实现DBN深度信念网络

最新资源