自建AutoML:从DTD到MOF元模型的WebML转换

1星 需积分: 13 4 下载量 72 浏览量 更新于2024-09-08 1 收藏 3.22MB PDF 举报
本文主要探讨了如何从头开始构建AutoML(自动机器学习)系统,特别是在WebML(Web模型语言)与模型驱动工程(Model-Driven Engineering, MDE)之间的桥梁。作者Alexander Mamaev分享了他在Sberbank Data Science Journey AutoML竞赛中的经验,他的解决方案获得了第五名,但未能获得高额奖励。 首先,传统机器学习方法依赖于数据科学家进行特征工程,即从数据中提取新特征并选择关键特征,然后训练算法在训练集上,最后在测试集上评估性能。然而,这种方法可能无法达到理想精度,因为人工干预在特征工程过程中可能存在局限性。 AutoML则试图通过自动化这些过程来减少人类介入。它使用自动化工具进行特征生成、模型选择和超参数优化,旨在提高效率和准确性。文章提到,由于WebML目前没有明确基于MDE的元模型,它定义为文档类型定义(DTD)和工具内部的隐式表示,这限制了与其他MDE工具的互操作性和标准化存储、交换和转换模型的能力。 为了克服这个局限,作者提出了一种半自动的方法,通过利用DTD生成基于对象管理组元对象设施(Meta Object Facility, MOF)的元模型,将WebML与MDE融合。这种元模型有三个主要目标:一是促进WebML设计方法论中引入MDE技术的初步步骤;二是确保与MDE工具的兼容性,从而支持标准交互;三是为未来的Web建模提供一个通用的元模型框架。 通过将WebML与MOF元模型相结合,作者希望简化代码生成过程,使用可扩展样式表语言转换(XSLT)进行模型到代码的转换,从而实现更高效、标准化的AutoML开发流程。虽然在Sberbank竞赛中未获奖,但这篇文章对于那些希望在AutoML领域深入探索和应用MDE的人来说,提供了一个有价值的参考,特别是在处理非基于元模型的Web建模语言时。
2021-03-27 上传