AutoML中的服务关联模型：机器学习流程生成

需积分: 0 82 浏览量更新于2024-08-04 收藏 2.33MB PDF 举报

"这篇文献探讨了机器学习流程生成中的一个重要课题——综合数据特征与服务关联。文章关注如何自动生成机器学习pipeline，特别是通过AutoML（自动化机器学习）技术解决选择合适模型、训练优化参数的问题。文章指出，AutoML的目标是让用户仅需提供数据，系统自动选择最佳方法。当前的AutoML方法包括网格搜索、随机搜索、贝叶斯方法、启发式方法和基于语法的方法。文献中提到了一些代表性的AutoML工具，如AutoWeka、Auto-sklearn、TPOT和AlphaD3M，但指出它们存在耗时长或性能不足的问题，并未充分利用pipeline中服务之间的关联。作者赵汝涛和王菁提出从primitive服务关联的角度出发，定义了primitive服务关联模型和挖掘算法。他们通过分析历史pipeline，识别primitive之间的关联关系，进而设计了一个结合服务关联的机器学习流程生成方法。这种方法有望提高流程生成的效率和性能，降低数据分析的复杂性和门槛，尤其适用于需要大量数据分析的领域。" 本文的核心知识点包括： 1. AutoML（自动化机器学习）：一种自动选择、训练和优化模型以适应特定数据集的技术，降低了数据分析的专业门槛。 2. Machine Learning Pipeline：一个序列化的机器学习过程，包括数据预处理、特征工程、模型选择、训练和评估等步骤。 3. Primitive服务关联：pipeline中的基本操作单元，理解它们之间的关联能优化流程生成。 4. 搜索策略：AutoML中用于修剪搜索空间的策略，如网格搜索、随机搜索、贝叶斯优化、遗传编程和强化学习。 5. AutoML工具比较：包括AutoWeka、Auto-sklearn、TPOT和AlphaD3M，它们各有特点，但普遍面临耗时和性能挑战。 6. Primitive服务关联模型与挖掘算法：为解决现有AutoML问题，提出的新型方法，旨在利用历史pipeline中的关联信息改进流程生成。这个研究对于提升机器学习流程的自动化程度，特别是在大数据环境下服务计算的有效性和效率具有重要意义。

宋罗世家技术屋

粉丝: 1346
资源: 109

AutoML中的服务关联模型：机器学习流程生成

机器学习十大算法.zip

基于机器学习的城市生成方法研究.pdf

人工智能之机器学习研究报告.pdf

层次分类中的机器学习方法研究.pdf

从IB方法的角度试谈机器学习与人类学习之关联.pdf

数据质量决定机器学习效果.pdf

数据挖掘技术与关联规则挖掘算法.pdf

机器学习算法知识手册.pdf.rar

关联规则数据挖掘.pdf

大数据与大数据机器学习.pdf

最新资源