AutoML：自动化模型构建与超参数调整

150 浏览量更新于2024-08-31 收藏 500KB PDF 举报

"AutoML是自动机器学习(Automated Machine Learning)的缩写，它旨在通过自动化流程来简化机器学习和深度学习模型的构建、训练和优化过程，减轻数据科学家和工程师的工作负担。AutoML的核心目标是使非专业人员也能高效地应用复杂的机器学习技术。" 在机器学习领域，建立一个高性能的模型涉及多个关键步骤，包括数据预处理、模型选择与设计、训练策略、超参数调优以及结果验证。这些步骤往往需要大量的专业知识和时间。AutoML的出现就是为了自动化这些流程，特别是针对模型构建和超参数调整这两部分。 AutoML能够自动进行深度学习网络的架构搜索，寻找最佳的神经网络结构，同时也能进行超参数的重要性分析，以确定哪些参数对模型性能影响最大。它并不简单地依赖暴力或随机搜索，而是结合了各种优化方法，如贝叶斯优化、强化学习、元学习和迁移学习等，以更加智能和高效的方式寻找最优解。贝叶斯优化是AutoML中常用的一种超参数调优方法，它通过构建概率模型来预测不同超参数组合对模型性能的影响，并利用这些信息指导后续的搜索方向。这种方法相对于网格搜索和随机搜索更具有针对性，因为它能够利用历史搜索结果来更新对超参数空间的理解，从而避免无效的搜索。 1. **网格搜索**：这是一种穷尽所有可能的超参数组合的策略，适合超参数数量较少的情况。然而，随着超参数数量增加，其计算成本急剧上升，效率较低。 2. **随机搜索**：与网格搜索相比，随机搜索允许对每个超参数定义一个概率分布，从中随机采样生成超参数值。这种方法在处理不敏感的超参数时更为有效，因为它可以在更大的范围内进行探索，而无需过于密集的采样。 3. **基于模型的超参数优化**：这类方法将超参数调优视为优化问题，尝试构建一个模型来预测超参数的效果。贝叶斯优化是其中的一个典型代表，它利用贝叶斯统计建立先验和后验概率模型，通过连续迭代优化搜索策略，逐步接近最优解。 AutoML工具如Hyperopt、NNI(微软的Neural Network Intelligence)和Autokeras等，为实践者提供了实现自动化的平台，使得他们可以更快速、更便捷地构建和优化模型，而不必深入掌握所有技术细节。总而言之，AutoML是机器学习领域的一个重要进展，它通过自动化技术降低了机器学习的门槛，提高了模型开发的效率，同时也推动了机器学习的普及和应用。随着技术的不断发展，我们可以期待AutoML在未来将带来更多的创新和突破。

AutoML

什么是AutoML？

目前一个优秀的机器学习和深度学习模型，离不开这几个方面：

一、优秀的数据预处理；

二、合适的模型结构和功能；

三、优秀的训练策略和超参数；

四、合适的后处理操作；

五、严格的结果分析

这几方面都对最终的结果有着举足轻重的影响，这也是目前的数据工程师和学者们的主要工作。但由于这每一方面都十分繁

琐，尤其是在构建模型和训练模型上。而大部分情况下，这些工作有无须过深专业知识就能使用起来。所以AutoML主要的作

用就是来帮助实现高效的模型构建和超参数调整。例如深度学习网络的架构搜索、超参数的重要性分析等等。当然AutoML并

不简单的进行暴力或者随机的搜索，其仍然需要机器学习方面的知识，例如贝叶斯优化、强化学习、元学习以及迁移学习等

等。目前也有些不错的AutoML工具包，例如Alex Honchar的Hyperopt、微软的NNI、Autokeras等。

自动化超参数搜索的方法有哪些？

目前自动化搜索主要包含网格搜索，随机搜索，基于模型的超参优化

网格搜索：

通常当超参数量较少的时候，可以使用网格搜索法。即列出每个超参数的大致候选集合。利用这些集合进行逐项组合优化。

在条件允许的情况下，重复进行网格搜索会当优秀，当然每次重复需要根据上一步得到的最优参数组合，进行进一步的细粒度

的调整。网格搜索最大的问题就在于计算时间会随着超参数的数量指数级的增长。

随机搜索：

随机搜索，是一种用来替代网格搜索的搜索方式。随机搜索有别于网格搜索的一点在于，我们不需要设定一个离散的超参数集

合，而是对每个超参数定义一个分布函数来生成随机超参数。随机搜索相比于网格搜索在一些不敏感超参上拥有明显优势。例

如网格搜索对于批样本数量（batch size），在[16,32,64]这些范围内进行逐项调试，这样的调试显然收益更低下。当然随机搜

索也可以进行细粒度范围内的重复的搜索优化。

基于模型的超参优化：

有别于上述两种的搜索策略，基于模型的超参调优问题转化为了优化问题。直觉上会考虑是否进行一个可导建模，然后利用梯

度下降进行优化。但不幸的是我们的超参数通常情况下是离散的，而且其计算代价依旧很高。

基于模型的搜索算法，最常见的就是贝叶斯超参优化。有别于的网格搜索和随机搜索独立于前几次搜索结果的搜索，贝叶斯则

是利用历史的搜索结果进行优化搜索。其主要有四部分组成，1.目标函数，大部分情况下就是模型验证集上的损失。2、搜索

空间，即各类待搜索的超参数。3、优化策略，建立的概率模型和选择超参数的方式。4、历史的搜索结果。首先对搜索空间

进行一个先验性的假设猜想，即假设一种选择超参的方式，然后不断的优化更新概率模型，最终的目标是找到验证集上误差最

小的一组超参数。

AutoML for Image Classification

We already have many good solutions for image classificaiton. Inception, Resnet…Why use AutoML? 如果可以通过自动搜

索，找到比人类设计的最好算法还好的算法，那么说明这一领域的研究价值。图像分类任务已经被很好学习了，AutoML以此

为起点更加合适。

NAS（Neural Architecture Search）One example of AutoML

NAS简介

Neural Architecture Search基本遵循这样一个循环：首先，基于一些策略规则创造简单的网络，然后对它训练并在一些验证集

上进行测试，最后根据网络性能的反馈来优化这些策略规则，基于这些优化后的策略来对网络不断进行迭代更新。

使用强化学习

之前的NAS工作可以大致分为两方面，首先是强化学习，在神经结构搜索中需要选择很多的元素，如输入层和层参数（比如

选择核为3还是5的卷积操作）的设置，设计整个神经网络的过程可以看作一系列的动作，动作的奖赏就是在验证集上的分类

准确率。通过不断对动作更新，使智能体学习到越来越好的网络结构，这样强化学习和NAS就联系起来了。

使用遗传算法

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38618024

粉丝: 0
资源: 938

AutoML：自动化模型构建与超参数调整

深度学习领域的AutoML探索

AutoML实践：云中部署与模型优化

深度AutoML：自动机器学习的现状与挑战

automl

automl：Google Brain AutoML

Google_Brain_AutoML_automl.zip

automl_space:探索AutoML系统的搜索空间

AutoML:ZazuML-用于对象检测的简易AutoML

YOLOv4-to-AutoML:将YOLOv4 Darknet格式的txt文件转换为AutoML csv格式以进行Cloud AutoML Vision对象检测

AutoML技术白皮书-《引入AutoML破局企业智能》

最新资源