加法网络：无乘法深度学习的突破

需积分: 13 175 浏览量更新于2024-07-14 收藏 881KB DOCX 举报

本文主要探讨了深度学习中的计算效率问题，特别是针对卷积神经网络(CNN)中大量使用的浮点乘法运算的效率瓶颈。论文标题“AdderNet:深度学习真的需要乘法吗？”提出了一个新颖的想法，即通过构建名为“加法器网络”(AdderNet)的模型，以低成本的加法代替昂贵的乘法运算，从而降低计算成本。在传统的CNN中，卷积层通过测量输入特征与滤波器之间的相似性来工作，这一过程涉及大量浮点乘法，而AdderNet则重新定义了这种相似性度量，使用滤波器与输入特征间的距离作为输出响应。论文的核心贡献包括： 1. **新相似性度量**：作者提出了一种新的度量方式，将距离而非乘积作为衡量特征与滤波器关系的基础。这种改变允许网络以更直观的方式进行计算，减少了复杂的乘法操作。 2. **反向传播方法优化**：为了提高性能，论文设计了一种特殊的反向传播算法，研究了全精度梯度，以便更好地处理加法网络中的梯度计算。 3. **自适应学习速率策略**：针对每个神经元梯度的大小，论文提出了一种自适应学习速率策略，以增强训练过程，提升网络的性能。实验结果显示，尽管没有使用任何卷积层的乘法，AdderNet结合Res-Net50在ImageNet数据集上达到了相当高的性能，实现了74.9%的Top-1精度和91.7%的Top-5精度，证明了其在降低计算成本的同时保持了较高的识别精度。论文还提到了当前深度学习计算面临的挑战，尤其是在移动设备上部署GPU的限制。由于高端GPU的能耗较高，如GeForce RTX 2080 Ti，这限制了深度学习在便携设备上的应用。因此，研究高效、适用于移动设备的深层神经网络对于推动其在诸如图像分类、对象检测、分割和人脸识别等领域的实际应用至关重要。尽管深度神经网络二值化（如二进制连接、BNN和相关工作）在减少计算负担方面取得了进步，但原始识别精度的保持仍是一个挑战。加法器网络作为一种替代方案，试图在保持精度的同时，进一步优化计算效率，为深度学习模型的优化提供了新的思考方向。

为了降低卷积神经网络的计算复杂度，人们提出了一些工作来消除无用的

计算。

2.1. 网络修剪

基于修剪的方法旨在消除冗余的权重，以精简和加速原始网络。丹顿等人

利用奇异值分解，将全连通层的权值矩阵分解为简单的计算。韩氏等人认为建

议在预先训练好的深度网络中放弃细微的权重，以在不影响性能的情况下省略

它们的原始计算。王志等人认为，进一步将卷积滤波器转换为 DCT 频域，并消

除了更多的浮数乘法。此外，胡等人还表示赞同，丢弃了影响较少的冗余过滤

器，以直接减少由这些过滤器带来的计算量。罗奥等人认为，根据重建错误丢

弃了冗余的滤波器。他等人说，利用 LASSO 回归，通过求解最小二乘重建来

选择重要的通道。庄庄等人，引入了额外的损失来考虑信道的识别能力，并为

便携式网络选择了最具识别力的信道。庄庄等人，引入了额外的损失来考虑信

道的识别能力，并为便携式网络选择了最具识别力的信道。

2.2. 高效的块设计

与其直接降低预先训练的重型神经网络的计算复杂度，许多工作集中在设

剩余23页未读，继续阅读

YukieXxy

粉丝: 1
资源: 1

加法网络：无乘法深度学习的突破

基于jsp的网上办公系统--开题报告.docx

python_docx-0.8.10-py2.py3-none-any.whl

云计算开发服务平台用户手册-Cloud-paas-v1.2.docx

大学体验英语四-课后翻译.docx

新视野大学英语第三版-book-2-课后翻译.docx

2225060346-汤岚淇-实验04-006班.docx.docx

毕业证及学士学位证书-日文翻译.docx

人民当家做主------教学设计.docx

Data clustering：50years beyond k-means翻译.docx

班级管理----完美教室.docx

最新资源