高效神经结构搜索：渐进式方法与最新技术对比

186 浏览量更新于2024-06-20 收藏 831KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"本文主要介绍了渐进式神经结构搜索（Progressive Neural Architecture Search，PNAS）作为一种高效的方法，用于学习卷积神经网络（CNN）的结构。与传统的基于强化学习和进化算法的方法相比，PNAS 提供了更高的效率和计算速度，同时在CIFAR-10和ImageNet数据集上达到了最先进的分类精度。该方法采用了顺序的基于模型的优化（Sequential Model-Based Optimization，SMBO）策略，逐步增加网络复杂性，通过学习代理模型来指导搜索过程。这使得PNAS能够在减少模型评估次数的同时，找到高性能的网络结构。 1. 渐进式神经结构搜索（PNAS） PNAS的核心思想是通过逐步增加网络结构的复杂性来优化搜索过程。这种方法避免了从头开始设计复杂的网络，而是从简单的结构开始，逐步添加更复杂的组件。这有助于降低计算成本，同时保持搜索的有效性。 2. 顺序的基于模型的优化（SMBO） PNAS使用SMBO策略，它是一种在结构搜索空间中进行迭代优化的技术。在每一步中，代理模型被用来预测不同结构的性能，指导搜索向更可能产生高精度结构的方向发展。这种方法减少了实际评估大量网络模型的需求，从而提高了搜索效率。 3. 搜索空间与卷积单元 PNAS构建了一个结构化的搜索空间，其中包含了可以组合成最终CNN的基本单元——卷积单元。这些单元由多个操作（如卷积、池化等）组成，可以按照特定规则重复堆叠，形成整个网络。这种模块化的设计使得PNAS能够灵活地适应不同规模和任务需求的网络。 4. 性能与效率尽管PNAS在搜索过程中减少了模型评估的数量，但它在CIFAR-10和ImageNet上实现了与当前最先进方法相当甚至更高的分类精度。相比于强化学习方法（如Zoph等人在2018年的研究），PNAS在模型评估数量上提升了5倍的效率，总计算速度提高了8倍。 5. 自动化网络设计的优势与人工设计网络架构相比，自动学习神经网络结构的方法如PNAS能够探索更大范围的结构空间，从而有可能发现超出人类直觉的高效结构。尽管自动化方法需要大量的计算资源，但PNAS在效率上的提升使得这一过程更加可行和实用。 6. 应用与未来方向 PNAS的高效搜索策略对于资源有限的环境尤其有价值，比如移动设备或嵌入式系统。此外，这种方法可能进一步扩展到其他类型的神经网络和任务，如序列模型或生成模型。未来的研究可能集中在如何进一步提高搜索效率，优化搜索空间，以及将这些技术应用于更多领域。总结： PNAS通过引入SMBO策略，为神经结构搜索提供了一种更高效、更节省资源的解决方案。它不仅在准确性上与现有方法匹敌，而且显著降低了计算需求，为自动学习神经网络架构开辟了新的可能性。"

资源详情

资源推荐

C. Liu等人

3.1

单元拓扑

细胞是一个完全卷积的网络，它将一个H×W×F张量映射到另一

个

′

张量。如果我们使用步长1卷积，则

′

和

′

;如

果我们使用步长2，则

′

H/2和W

′

W/2。每当空间激活减半时，

我们采用一种常见的启发式算法将过滤器（特征图）的数量加

倍，因此对于步幅1

，

′

，对于步幅2，

′

单元可以由由

块组成的DAG表示每个块是从2个输入张量到1个输

出张量的映射。我们可以将单元c中的块b指定为5元组（

，

），其中

，

∈

指定块的输入，

，

∈

指定应用于输入

的操作

，

∈ C

指定如何组合

和

以生成与该块的输出对应的特征映

射（张量），我们将其表示为

。

可能输入的集合Ib是该单元中所有先前块的集合

{

，

. . .

，

}

，加上前一个单元的输出，

−1

，加上

−1

前一个-前一个单元格，

。

算子空间

是以下8个函数的集合，每个函数在单个张量

上操作：

•

3x3深度可分离卷积

•

5x5深度可分离卷积

•

7x7深度可分离卷积

•

1x7后接7x1卷积

•

身份

•

3x3平均合并

•

3x3最大池化

•

3x3扩张卷积

这少于[41]中使用的13个运算符，因为我们删除了他们的RL方法发现

从未使用过的运算符。

对于可能的组合算子空间

，[41]考虑了元素级加法和级联。然

而，他们发现RL方法从未选择使用连接，因此为了减少搜索空间，

我们总是使用加法作为组合运算符。因此，在我们的工作中，一个块

可以指定一个4元组。

我们现在量化搜索空间的大小以突出搜索问题的大小

。

让该空间的

os i

s i e

s ies i s i

为

，

当

（

−

1）

，

和

|C|

1时。对于

1，我们有

{

−

，

−

}，它们是

B B

前两个单元格，所以有

= 256个可能的块结构。

如果我们允许多达

= 5个块的单元，则单元结构的总数由下式给

出：

|B1

：

= 2

= 5

然而，在这个空间中存在某些对称性，允许我们将其修剪到更合理的

大小。例如，仅存在由1个块组成的136个唯一单元。唯一单元格的总

数是10

。这比[41]中使用的搜索空间小得多，其大小为10

，但它仍

然是一个非常大的搜索空间，并且需要有效的优化方法。

深度可分离卷积实际上是ReLU-SepConv- BatchNorm的两个重复;当张量大小

不匹配时，也会插入1x 1卷积

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

高效神经结构搜索：渐进式方法与最新技术对比

基于渐进式学习的神经网络端到端验证码识别.pdf

基于轻量化渐进式残差网络的图像快速去模糊.docx

面向星上实时目标检测的神经网络压缩方法.pdf

实数神经网络的渐进稳定

apdl渐进结构优化算法编程

神经网络的渐进，稳定，神经网络的质数稳定，神经网络的军方稳定，神经网络的绝对稳定，神经网络的Lagrange稳定，神经网络的Hyers-Ulam稳定性等等

神经网络的渐进稳定，神经网络的指数稳定，神经网络的均方稳定，神经网络的绝对稳定，神经网络的Lagrange稳定，神经网络的Hyers-Ulam稳定性等等

数据结构中渐进时间复杂度是什么

如何决定快速渐进算法和缓慢渐进算法更优

基于渐进结构优化ESO算法的悬臂梁优化的Python代码示例

什么是渐进式框架 他的优缺点

vue 使用渐进式和使用渐进式的区别

渐进最优快速探索随机树法和快速探索随机树法的不同

渐进因子分析 python

函数的渐进表达式怎么计算

谈谈你对渐进式框架的理解

java 渐进式_JAVA转换jpg图片为渐进式图片

redis渐进式rehash

flink 渐进式窗口

vue渐进式框架的渐进式是什么意思

最新资源

什么是渐进式框架他的优缺点