优化胶囊网络:设计与效率提升

0 下载量 186 浏览量 更新于2024-06-20 收藏 1.15MB PDF 举报
"本文探讨了神经网络胶囊的设计与运行效率优化,重点关注了胶囊网络在处理模式变体时的优势以及如何通过优化路由方案提升模型的效率。文章由李红阳、郭晓阳、戴波、欧阳万里和王晓刚共同完成,分别来自香港中文大学和悉尼大学SenseTime计算机视觉研究小组。主要讨论的关键词包括网络架构设计、胶囊特征学习、路由方案等。" 神经网络胶囊是深度学习领域的一种创新架构,旨在解决传统卷积神经网络(CNN)在处理物体的多视角、旋转和变形等变化时的局限性。与CNN中单个神经元检测特定特征不同,胶囊网络中的胶囊由一组神经元构成,输出向量形式的信息,能够表示模式的多种变体,如姿态、形状和纹理等。这种向量输出能捕捉到特征的多个方面,提高了模型对物体识别的鲁棒性。 传统的CNN需要通过堆叠多层来处理模式的多种变体,这增加了计算复杂度和内存需求。胶囊网络通过一种称为路由的机制解决了这个问题,使得较低层的胶囊只激活与其高层对应物相似的模式。然而,这种路由过程在大规模网络中可能会变得非常耗时。针对这一问题,作者提出了一种新的两分支路由方案,包括主分支和辅助分支。主分支负责收集下层直接相邻胶囊的主要信息,而辅助分支则利用其他下层胶囊编码的模式变体来补充信息。这种快速、有监督的一次性路由策略显著降低了模型复杂性和运行时间。 为了解决信息在层间传递过程中可能的损失,作者设计了反馈协议单元,它将高层胶囊的反馈信息传递给下层,起到了网络正则化的效果。反馈协议基于最佳运输发散来比较低层和高层胶囊的分布,帮助维持信息的一致性。这种反馈机制进一步增强了胶囊网络的表现。 实验结果显示,提出的En-capNet模型在CIFAR10/100、SVHN和ImageNet的子集上优于先前的技术,验证了胶囊网络和优化的路由方案在特征学习和网络效率上的优势。这项工作为构建更高效、更具适应性的深度学习模型提供了新的思路和方法。