DARTS-架构搜索:提升性能与稳定性研究
61 浏览量
更新于2024-11-14
收藏 716KB ZIP 举报
该方法由楚湘香、王晓星、张波、陆顺、魏小林和严俊池六位研究人员共同发表。DARTS-是基于DARTS(Differentiable Architecture Search)的一种改进方法,旨在解决原始DARTS在搜索过程中会遇到的性能崩溃问题。DARTS是一种神经网络架构搜索(NAS)的方法,通过可微分的方式来进行网络结构的搜索,从而避免了传统NAS方法中需要大量计算资源和时间的问题。DARTS-的核心思想是引入了一种基于梯度的算法,可以在没有性能指标的情况下进行超参数优化,从而在保持搜索效率的同时,提高搜索过程的稳定性和最终模型的性能。"
在DARTS-的研究中,作者提供了在CIFAR-10和CIFAR-100数据集上的实验验证,说明了DARTS-在不同的搜索空间(S0-S4)中能够有效地搜索到性能更优的网络结构。具体而言,通过脚本文件scripts/run_darts_minus.sh可以在S0-S4的搜索空间中进行模型的搜索,其中S0对应于代码中的S5。此外,作者还提供了scripts/run_darts_minus_fulltrain.sh脚本用于在所有搜索空间中评估CIFAR-100模型,以及在S4中评估CIFAR-10模型的性能。对于剩余的CIFAR-10模型,可以通过执行script/eval SGAS代码来进行评估。
在体系结构搜索的过程中,一个重要的环节是黑森特征值的计算,这是评估模型损失景观的一个重要指标。在DARTS-中,默认情况下会关闭计算黑森特征值(--compute_hessian)的选项。搜索完成后,可以独立于已保存的检查点来计算Hessian特征值,这有助于进一步分析和理解模型在搜索空间中的表现和特性。相关脚本start_calc_hessian.sh可用于启动黑森特征值的计算。
DARTS-的研究成果被整理和封装在了名为"DARTS--main"的压缩包子文件中,该文件包含了相关代码以及脚本,研究人员和工程师可以下载并利用这些资源来复现实验结果或是进一步开发和优化DARTS-方法。文件标签为"Python",说明该代码和脚本可能是使用Python语言编写的,这在深度学习和机器学习领域非常常见,因为Python有着丰富的库和框架支持,比如TensorFlow、PyTorch等,这些都为深度学习模型的开发提供了极大的便利。
点击了解资源详情
405 浏览量
点击了解资源详情
2021-02-11 上传
2022-09-23 上传
2021-06-24 上传
405 浏览量
141 浏览量
106 浏览量

weixin_42097189
- 粉丝: 39
最新资源
- C#实现自定义尺寸条形码和二维码生成工具
- Bootthink多系统引导程序成功安装经验分享
- 朗读女中文朗读器,智能语音朗读体验
- Jupyter Notebook项目培训教程
- JDK8无限强度权限策略文件8下载指南
- Navicat for MySQL工具压缩包介绍
- Spring和Quartz集成教程:定时任务解决方案
- 2013百度百科史记全屏效果的fullPage实现
- MATLAB开发电磁转矩电机瞬态响应研究
- 安卓系统短信问题解决方案:使用BlurEmailEngine修复
- 不同版本Android系统的Xposed框架安装指南
- JavaScript项目实验:模拟骰子与颜色转换器
- 封装高效滑动Tab动画技术解析
- 粒子群优化算法在Matlab中的开发与应用
- 网页图书翻页效果实现与turnjs4插件应用
- JSW: 一种新型的JavaScript语法,支持Coffeescript风格