深度置信网络在数值属性分类中的新方法

需积分: 35 1 下载量 197 浏览量 更新于2024-09-05 收藏 532KB PDF 举报
"这篇论文提出了一种改进的深度置信网络(DBN)分类方法,针对数值属性进行优化,以解决由于受限玻尔兹曼机(RBM)输入通常是二值向量导致的信息损失问题,从而提高分类效果。通过在sigmoid单元中引入噪声,使输入在[0,1]范围内,然后利用一个具有高斯隐藏节点的顶层RBM进行分类。这种方法不仅用作特征提取,还能作为预训练的神经网络。DBN由于其连接权值的初始化方式,相对于传统神经网络,其分类性能更优。实验在UCI数据集上验证,显示DBN分类法相比SVM有更高的准确性。" 深度置信网络(DBN)是一种深度学习模型,由多个受限玻尔兹曼机(RBM)层堆叠而成。RBM是一种二分图的统计模型,它能学习数据的潜在表示。然而,当RBM处理数值属性时,由于通常需要将数据二值化,可能会丢失原始数据的精度和信息。论文中提出的解决方案是在sigmoid激活函数中添加噪声,以线性缩放输入到[0,1]区间,保持更多原始信息。 传统的浅层学习方法如支持向量机(SVM)、Boosting和逻辑回归等,在处理复杂分类任务时可能面临泛化能力的限制。相比之下,深度学习,特别是深度置信网络,通过构建多层抽象特征,能够捕捉数据的复杂分布式特征表示,从而增强模型的表达能力。 DBN的训练过程通常包括两阶段:预训练和微调。预训练阶段,每个RBM逐层自下而上地学习数据的层次表示;微调阶段,整个DBN被视作一个大型神经网络,使用反向传播算法进一步优化网络权重,以提高分类性能。论文指出,由于DBN的预训练初始化了权重,而不是随机赋值,因此其在分类任务中的表现优于传统BP算法训练的多层神经网络。 在实验部分,该方法在UCI数据集上与SVM进行了比较,结果显示,基于数值属性的DBN分类方法在准确性上超越了SVM,这证实了所提出方法的有效性。这项工作提供了一个改进的深度学习模型,适用于处理包含数值属性的数据集,对于复杂分类问题具有更高的准确性和泛化能力。