没有合适的资源?快使用搜索试试~ 我知道了~
软件影响14(2022)100407原始软件出版物Modelly:一个用于开发机器学习模型的开源All in One Python包迪沙?沙阿?图沙尔?萨尔卡尔?天气-孟买,印度A R T I C L E I N F O关键词:XBNet模型神经网络分类非线性模型A B标准各种机器学习算法被开发用于分类和预测目的。这些模型已经开发出来,以提供解决方案,并减轻我们在许多领域的日常生活。神经网络广泛应用于各个领域,但开发它们是一个困难和耗时的过程。在本文中,我们讨论了我们的包Modelly,它提供了交互式的无代码以及低代码选项的开发,测试,和调整神经网络及其变体,如XBNet。此外,我们还在我们的包中提供了基于树的模型,这些模型也可以交互式构建。我们的软件包旨在促进开发机器学习和深度学习模型的整个过程,以简化开发真实世界应用程序的过程代码元数据当前代码版本1.4.6用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2022-143Reproducible Capsule的永久链接https://codeocean.com/capsule/0983862/tree/v1法律代码许可证MIT使用Git的代码版本控制系统使用Python 3的软件代码语言、工具和服务编译要求,操作环境依赖sklearn,pandas,matplotlib,torch,numpy,xgboost,flask,kivy如果可用,链接到开发人员文档/手册问题支持电子邮件tusharsarkar866@gmail.com,gmail.com软件元数据当前软件版本1.4.6指向此版本可执行文件的������������������������������������������������永久 链路 到可再生胶囊闪烁晶体闪烁晶体闪烁晶体0983862闪烁晶体闪烁晶体1������������������������������法律软件许可证MIT计算平台/操作系统Linux,OS X,Microsoft Windows,类Unix安装要求依赖sklearn,pandas,matplotlib,torch,numpy,xgboost,flask,kivy如果可用,请链接到用户手册-如果正式发布,请包括对参考书目问题支持电子邮件tusharsarkar866@gmail.com,gmail.com1. 介绍我们使用各种形式来表示数据。表格数据表示就是其中之一表格数据表示为一组行,原文DOI:https://doi.org/10.1016/j.iswa.2022.200097。列,其中每个数据样本都有一组属性。 当我们需要预测特定列或结果的值时,一堆预先设定好的输入这就是分类问题。本文中的代码(和数据)已由Code Ocean认证为可复制:(https://codeocean.com/)。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。*通讯作者。电子邮件地址: tushar. somaiya.edu(T. Sarkar)。https://doi.org/10.1016/j.simpa.2022.100407接收日期:2022年7月9日;接收日期:2022年7月27日;接受日期:2022年8月5日2665-9638/©2022作者。由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表软件影响杂志 首页:www.journals.elsevier.com/software-impactsT. Sarkar和D. Shah软件影响14(2022)1004072Fig. 1. Web界面的着陆页。表格数据分类的应用包括诊断患者的疾病,检测垃圾邮件,图像分割,欺诈检测,客户行为预测等等[1预定义算法可以使用一组已知参数来训练分类模型。这些训练的分类模型预测数据的未知值。决策树、逻辑回归和XGBoost是一些普遍使用的训练分类模型的算法[6我们的软件包引入了一种交互式的方式来构建神经网络和类似的架构,如XBNet以及传统的基于树的线性模型,用于解决表1Modelly上提供不同的型号。型号名称Vanilla神经网络XGBoost随机森林LightGBM决策树上述分类问题[9]。对神经网络进行编码是一个耗时的过程,因为层数、每层节点数以及它们与结果的对应关系都不确定,这使得它容易进行大量的实验[10]。这些实验需要每次修改代码并运行整个管道,这浪费了大量时间。此外,做一些修改,如提高某些层,在实现XBNet和类似架构时,这是一个繁琐的过程。我们的软件包使整个迭代建模过程易于实现快速原型设计功能。它为表格数据提供了更好的性能,训练稳定性和可解释性,并且在创建任何有或没有提升的神经网络时具有最低的编码要求。总的来说,它大大降低了编码要求,甚至使非技术人员也可以根据自己的要求使用最新的技术2. 方法我们使用不同的组件来为我们软件包的用户提供灵活性,以便所有功能都可以同步或单独提供。我们的软件包为用户提供了两种选择(1) 没有使用交互式界面的代码实现。在该替代方案中,向用户提供交互式图形用户界面(web和桌面应用程序),其中必须上传数据集。上传数据后,必须选择要使用的模型。随后,必须提供关于模型的信息,其包括在神经网络和XBNet的情况下对应于层的参数以及用于其他模型的超参数。可以通过利用图表和系统生成的不同度量的性能来基于结果进行分析。图1、2、3和4说明了使用我们的应用程序的过程。(2) 低代码实现,提供额外的灵活性,超参数调整,并轻松将XBNet和普通神经网络集成到其他软件中。包的这一部分被分解为几个模块,如training_utils(train,test,predict和其他实用程序函数),Seq(重写的PyTorch Sequential基类)和模型。上述所有功能都可以独立集成,也可以根据应用程序的用例按顺序集成。Seq是为了实现像XBNet这样的方法而创建的,我们需要改变数据的顺序流以及梯度计算和更新的管道。 我们已经添加了一个XGBoost模型,但可以在那里添加任何其他模型,以创建两种或更多种技术的融合。 模型为构建的体系结构定义类在神经网络上,而其他基于树的模型在应用程序中定义。这些模型包括用于实现模型的不同功能的各种方法,并且还提供了在需要时开发新架构的灵活性。Training_utils包含用于训练、验证和评估模型的各种函数。它还包含我们模型的结果所依据的默认指标 进行评估。图5演示了如何使用低代码实现中的一些功能,并显示了低代码实现如何通过允许用户根据其需求更改任何组件来增加系统的灵活性。使用Modelly,我们可以在一行代码中定义、训练、验证和预测普通神经网络和XBNet的结果(见表1)。3. 软件影响我们的软件已被用于将XBNet应用于各种数据集,结果记录在论文[9]中。我们的实验表明,它的性能优于国家的最先进的模型对四个T. Sarkar和D. Shah软件影响14(2022)1004073图二、如果 选择神 经网络 ,则 第二页用于输入详细信息。图3.第三章。如 果 选择XGBoost,第二页为超参数调优。见图4。 训练后的结果T. Sarkar和D. Shah软件影响14(2022)1004074图五. 低代码实现的示例。在七个数据集中。它表现出强大的性能,并很好地概括了看不见的数据。由于我们的包在训练后提供了各种指标的性能,并绘制了训练和测试的图表,因此我们可以轻松地分析训练过程并进行任何必要的更改,而无需编写一行代码。Kaggle上的无数笔记本电脑在竞争中使用了我们的软件包,并取得了优异的成绩。Modelly的低代码要求,即使是非技术专业人士也可以使用这种尖端技术轻松有效地解决业务问题。在训练模型后,XBNet提供的指标使评估过程变得更容易,这有助于超参数调整的过程。我们的软件包在发布后被下载了14,285次,这体现了它在研究社区中卓越的可用性,受欢迎程度和性能。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作致谢我要感谢Chandan Sarkar、Mallika Sarkar、Pinki Shah和NehalShah,感谢他们不断的指导和宝贵的反馈。我也感谢AparnaSarkar,Sneha Kothi和整个感谢社区的宝贵建议,这些建议对改善我们的套餐大有帮助。引用[1]M.A. 梅 什 琴 斯 卡 Ojamies , A. 拉 科 斯 特 湾 Neil , A. 萨 法 里 河 米 德 , G.M.Hautbergue,J.D.霍尔布鲁克湖Ferraiuolo,机器学习在神经退行性疾病诊断和治疗中的应用,Nat.Rev.Neurol。16(8)(2020)440-456.[2]S. Nandhini,J.M. KS,用于电子邮件垃圾邮件检测的机器学习算法的性能评估,在:2020年信息技术和工程新兴趋势国际会议,IC-ETITE,IEEE,2020年,pp.一比四[3]A.D. Kulkarni , Deep Convolution Neural Networks for Image Classification ,TheScience and Information(SAI)Organization,2022。[4] K.拉马尼岛Suneetha,N. Pushpalatha,P. Harish,用于信用卡欺诈检测的梯度提升技术,J。 代数Stat. 13(3)(2022)553[5]T.扎托纳茨卡岛Dluhopolskyi,T.阿尔秋赫湾Tymchenko,预测目标细分市场的行为,以激活广告工具:移动运营商沃达丰乌克兰的案例,经济。创新Res.J. 10(1)(2022)87-104.[6]Y.-- Y.松湖,澳-地Ying,Decision tree methods:applications for classificationandprediction,Shanghai Arch. Psychiatry 27(2)(2015)130.[7]R.E. Wright,Logistic Regression,American Psychological Association,1995。[8]T. Chen C., 马缨丹 属Guestrin, Xgboost: 一个可 扩展 的树提 升系 统, 在:Proceedings第22届ACM Sigkdd知识发现和数据挖掘国际会议,2016年,pp.第785-794页。[9]T. Sarkar,XBNet:一个极度增强的神经网络,Intell。系统申请(2022)200097,http://dx.doi.org/10.1016/j.iswa.2022.200097,URLwww.sciencedirect.com/science/article/pii/S2667305322000370。[10] S.- C. Wang , Artificial neural network , in : Interdisciplinary Computing inJavaProgramming,Springer,2003,pp. 81比100
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功