没有合适的资源?快使用搜索试试~ 我知道了~
基于混合核的支持向量回归预测云数据中心主机利用率
沙特国王大学学报基于混合核的支持向量回归的云数据中心Priyanka Nehra,A.长良寿印度拉贾斯坦邦中央大学Bandarsindri,Kishangarh,Ajmer 305817阿提奇莱因福奥文章历史记录:收到2020年2021年3月26日修订2021年4月25日接受2021年5月28日网上发售保留字:云计算虚拟机整合主机利用率支持向量回归预测A B S T R A C T云数据中心的快速增长需要动态资源供应来维持服务质量参数。为了保证这一点,虚拟机迁移作为虚拟机整合的一部分具有重要作用。高效的VM迁移需要提前了解主机由于云资源使用和动态工作负载的高度变化,使用利用率历史预测主机利用率具有挑战性。本文提出了一种基于支持向量回归的方法来预测主机提出了一种由径向基函数和多项式核函数组成的混合核函数,并利用多资源利用历史训练与现有的基于多元线性回归的预测方法、欧氏距离和基于绝对求和的回归方法相比,该方法在均方根误差、均方误差、平均绝对百分比误差、平均绝对误差和R2方面表现更好。结果部分得出结论,在评估误差百分比时,所提出的方法的预测误差为16%,并且预测宿主利用率的准确度分别比MRHOD、MDRHU-ED、MDRHU-AS方法高7%、64%和67%。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍云计算是一种分布式并行系统,包括互连的同构和异构物理机,基于按使用付费模型提供按需服务(Hu等人,2011; Armbrust等人,2010年)。云计算塑造了客户使用现有IT基础设施、应用程序和系统软件的方式,并迅速崛起(Buyya等人, 2010年)。各种政府组 织 、 行 业 、 电 子 商 务 、 医 疗 保 健 和 学 术 界 都在 云 数 据 中 心(CDC)上提供服务。云数据中心消耗大量能源,导致运营成本高。数据中心的高能耗不仅是因为大量的资源,还因为资源利用效率低下(Nehra和Nagaraju,2019年,*通讯作者。NH-8,拉贾斯坦邦中央大学,计算机科学系,Bandarsindri,Kishangarh,Ajmer,Rajasthan,305817,印度。电子邮件地址:2015phdcs02@curaj.ac.in(A.Nagaraju)。沙特国王大学负责同行审查2019. ).降低能耗的一个解决方案是提高资源利用率,这可以在虚拟化技术的帮助下实现(Jennings和Stadler,2015;Ferdaus和Murshed,2014)。虚拟化技术允许在多个虚拟机上共享物理系统。所有虚拟机(VM)都作为一个虚拟计算机系统,具有CPU、内存、带宽和其他资源。有效地利用数据中心(DC)的资源,诸如CPU周期、存储器和带宽,显著地减少DC的能量消耗(Abdelsamea等人,2014年)。虽然需要降低能耗,但它也必须在不违反服务水平协议(SLA)的情况下提供服务。对于静态工作负载,文献中提出了几种调度机制(Jennings和Stadler,2015;Nehra和Nagaraju,2019;Mahrishi和Nagaraju,2012VM Consolidation被认为是一种可以处理动态工作负载并实现其他参数的突出方法。 VM整合是将运行中的VM从一个物理机迁移到另一个物理机的过程(Khan等人, 2017年)。迁移决策取决于欠载和过载主机检测。为了检测过载和欠载的主机云https://doi.org/10.1016/j.jksuci.2021.04.0111319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comP. Nehra和A. Nagaraju沙特国王大学学报6482( Amiri 和 Mohammad-Khanli , 2017 年 ;DineshKumar 和Umamaheswari,2012年)。在文献中,一些回归方法,如线性回归,多元线性回归已被引入预测。然而,线性回归只有在数据之间存在线性关系相比之下,支持向量回归(SVR)是众所周知的,著名的分类问题。支持向量回归机接受数据中的非线性,允许误差的灵活性,并提供一个有效的预测模型,以获得所需的精度。在这里,我们已经提到了一些需要考虑的挑战(Abdelsamea等人,2014)进行虚拟机整合:1. 过载主机检测:决定检测过载主机的参数,并在检测时执行VM迁移以确保SLA。2. 主机欠载检测:决定检测欠载主机的参数;检测到后,所有VM迁移,主机切换到睡眠模式,以提高资源利用率。3. VM选择:在检测到过载的主机时,将执行选择过程以选择要迁移的VM4. VM放置:确定合适的PM以放置所选VM的放置过程。本文考虑到上述挑战,提出了一种基于混合核的支持向量回归机方法,建立在多资源使用的预测主机的利用率虚拟机放置使用我们早期的研究工作负载平衡多维装箱(LBMBP)启发式平衡主机之间的负载。1.1. 动机随着云计算的出现,包含计算和存储设备的云数据中心(CDC)正在以十到数千的范围增长这种状态需要一种实用的资源调度方法和策略来处理可伸缩性或动态资源配置。这项工作预测资源使用情况对过度配置和不足配置问题有直接影响预测可以帮助防止过度使用,避免违反服务级别协议。通过防止利用不足,可以减少资源的能源消耗(Masdari和Khoshnevis,2019)。第二部分是宿主检测技术。第三节提出了一种预测主机利用率的混合核支持向量回归机(HKSVR)和一种检测主机过载的算法。第(4)节描述了实现细节和不同预测方法的比较最后一部分是本文的结论和未来的发展方向。1.2. 贡献本文提出了一种基于混合核支持向量回归机的预测方法,该方法考虑了多个资源使用历史来检测云环境中的过载主机。该工作在MATLAB中进行模拟,并使用阿里巴巴于2017年8月发布的数据集进行评估(A.集团,2017年)。所提出的工作比较了另一种现有的预测方法对不同的性能参数,如均方根误差(RMSE),平均绝对误差(MAE),平均绝对百分比误差(MAPE),均方误差(MSE)和R2。2. 文献调查动态资源调度是云计算中的一个关键问题,它能以最小的SLA冲突提供服务来自研究目标的研究人员在文献中对有效的VM合并进行了各种预测分析。已经做了很多研究来预测主机利用率,以检测过载和欠载主机。表1显示了文献中各种技术的比较及其优缺点。识别过载和欠载主机的技术分为两种方式:静态阈值和动态阈值。静态阈值反映的是一个固定的利用率阈值,它决定了主机的过载和欠载,即使资源在动态阈值技术中,阈值根据资源使用情况随时间变化。动态阈值的变化取决于资源使用和阈值,并由机器学习或统计分析的任一种方式决定Gahlawat 和 Sharma ( 2016 ) 提 出 了一 种使 用 支 持 向 量 机(SVM)检测云中过载主机的方法。作者将所提出的SVM方法与动态最小二乘支持向量机(DLS-SVM)和最小二乘支持向量机(LS-SVM)进行了比较,发现DLS-SVM的预测精度更高,误差最小。Abdullah等人(2020)提出了一种支持向量回归技术来预测未来的资源使用情况。该算法使用径向基核函数和序列最小优化算法进行训练和回归。该方法提高了预测精度,降低了误差百分比。Beloglazov和Buyya(2012)提出了一种用于过载主机检测的自适应基于阈值和基于回归的启发式算法。在第一种方法中,中值绝对偏差(MAD)(统计离散度的量度)确定阈值MAD,即,数据偏离其中位数的绝对值的中位数。与方差和标准差相比,使用MAD确定阈值更稳健。在第二种方法四分位距(IQR)中,统计离散度使用利用值和计算的第一和第三四分位数之间的差异来识别IQR。同样,使用IQR计算阈值。然而,平均值和标准差易于变化,并且对于动态资源利用效率较低。基于回归的启发式局部回归(LR)和局部鲁棒回归(LRR)模型更适合检测过载主机。Sharma和Saini(2016)提出了一种动态VM整合方法,可以满足服务水平协议和能源效率之间的权衡。作者提出了一种基于中值的方法,用于自动调整上限和下限阈值。主机分为两组,这些组的中位数有助于确定阈值的下限和上限。尽管所提出的方法最小化了SLA违规或提供了最大的服务质量(QoS),但能量控制仍然存在。消费仍然更高。Li等人(2019),为了实现能量效率和服务质量,提出了一种基于离散差分进化的算法。计算每个资源的概率分布函数虽然该模型通过避免不必要的过载条件来提高服务质量,但并没有关注最小化VM迁移。Mahdhi和Mezni(2018)使用核密度估计(KDE)技术来预测未来的迁移流量和资源。拟议工作在第一级,●●●P. Nehra和A. Nagaraju沙特国王大学学报6483表1比较现有的不同方法。纸考虑的参数用技术强度弱点Gahlawat和SharmaCPU使用率支持向量机-DLS-SVM预测优于- 比较错误度量MAPE和(2016年)LS-SVM和SVM仅最大误差Abdullah等人(2020年)CPU使用率支持向量回归技术- 准确性增强- 与基于单一资源的序贯最小预测方法优化算法别洛格拉佐夫和布亚CPU使用率自适应(IQR和MAD)和- 高效- 受影响的(2012年)回归(LR)方法- 减少能源消耗由终端值产生,不适合动态资源需求Sharma和Saini(2016)CPU使用率绝对偏差方法- 提供服务水平协议- 最小的性能退化- 功耗较高Li等人(2019)CPU使用率离散差分方法-降低能耗-不关注资源利用率从而导致动态资源需求Mahdhi和Mezni(2018)CPU,RAM和存储使用核密度估计技术- 降低能耗-高通信量Li等人2016年CPU使用率线性回归-减少能耗- 减少SLA违规- 仅适用于数据Abdelsamea等人( 2020)CPU,RAM和带宽使用混合线性回归-减少能耗- 减少SLA违规- 使用固定点归一化的预测值,由于该固定点,性能降低El-Alfressy等人04 The Famous(2012)和带宽使用回归方法与欧氏距离和绝对求和- 减少能源消耗- 改进提供服务级协议- 减少移徙人数。- 仅KDE技术预测每个物理机器的下一个请求的资源在第二级,预测服务器放置新VM的容量。它是考虑CPU、RAM和存储以进行VM整合的方法之一Li等人(2016)提出了一种基于线性回归预测模型的节能VM整合技术,以避免违反SLA。提出了一种RobustSLR方法,利用历史负载预测和IQR方法检测欠载主机。该模型最大限度地减少了功耗和SLA违规。但是,整合过程只包括CPU利用率;不考虑其他资源。Abdelsamea等人(2020)为了增强VM整合,提出了一种基于多重回归的过载主机检测算法,即,你好。CPU、内存和网络等众多因素被结合起来开发主机利用率,使其适合云应用多元回归虽然该算法优于现有的方法在能源消耗方面,它给SLA违规的结果不佳。El-Alfressy等人(2012),考虑了多个因素:CPU,内存和带宽利用率过载主机检测。提出了一种基于多维回归的主机检测算法,该算法通过欧几里德距离(ED)将CPU、内存和带宽相结合,即,MDRHU-ED和绝对求和(AS),即,MDRHU-AS。拟议的工作减少了能源消耗,也提供了服务质量。文献的结论是,它是可取的预测主机利用率提前处理动态资源需求,并提供服务质量。3. 基于支持向量回归的主机过载检测模型本节包含机器学习方法的详细描述:用于主机利用率预测的支持向量回归和检测过载主机的算法。3.1. 问题公式化我们假设一个云数据中心有多个互连的主机,这些主机有多个资源。多个资源利用率,如CPU,带宽和网络利用率将包括在主机利用率评估。我们得到一个输入训练数据集{(x1;y1),(x2;y2),. . 其中,X是RI(多资源使用数据),Y是Y(实际利用率值),Y = R,i = 1,2,3.. . ,l,是总数样本数量使用此信息,系统将被训练以更准确地预测主机利用率。3.2. 全球架构图1所示的整个过程的全局架构包括n个虚拟机(VM)和m个物理机(PM),其由以下资源组成:CPU MIPS、RAM和带宽。该模型涉及多个实体进行资源分配:云数据中心实体是一个异构计算系统的集合,允许资源共享,按需向用户提供服务,并负责分配过程中的通信Broker实体工作在用户和云数据中心之间,将用户资源管理包括模块的数量、初始分配、处理动态资源需求的预测、过载和欠载主机的检测,以及在检测时,在三个步骤中执行的VM迁移:VM选择、主机选择,然后VM分配。3.3. 混合核支持向量回归模型支持向量机(SVM)是一种统计学习理论,在机器学习中变得非常流行和进化。SVM被发现是分类问题的一种突出方法(Cristianini和Shawe-Taylor,2000)。在分类问题中,对线性数据进行分类很容易,但对非线性数据进行分类,需要一种将非线性数据映射到更高维数据的方法。支持向量机最吸引人的地方在于它能将样本映射为高维特征来解决非线性问题P. Nehra和A. Nagaraju沙特国王大学学报6484LmTT2XXX不.!-jx-xj2nÞ¼2nn混合22LLL2n mn我我1XTT令函数将l维向量x映射为m维向量x,其中m>l,并且映射可以表示为(Vapnik,1995):X<$x]1;½x]2;. . 半个x! X]1;X]2;. . . ;1/2X]T1/2/2x1/4假设原始输入训练集给定为:{(x1;y1),(x2;y2),... . 其中,X是R1;Y是Y,Y = R,i = 1,2,3.. . ,l是样本总数。下一步是计算决策边界和分离超平面,使用:fxw:xb<$05决策边界的最大边缘宽度降低了错误率,提高了准确率。因此,优化问题可以写为:max1JJW JJ服从:minjw T X nnbj¼ 1;n/1; 2;.. . L可以写成jw Xnbjynw Xnb6为了解决最优化问题,Fig. 1. 全球架构。如:米; 1wTw1000受:ynw TX nb P 1; n ¼ 1; 2;. . ;l8可以写成:ynwTXnb-1P 091wT w-anywTXnb-1P 0 10合适的核函数可以执行非线性变换。核函数有助于为更高维度提供决策边界,而无需复杂的计算。在文学中,有四种类型的核函数:径向基函数(RBF)、线性函数(LINEAR)、多项式函数(POLY)、Sig-Basis-Function(Sig)。拉格朗日公式为:LLw;b;awT w-aywTXn1b模型 函数( SIGMOID)有 其优点 ,缺点 ,并 显示出 不同的 特性(Cristianini和Shawe-Taylor,2000)。RBF核函数又称局部核函数,具有较强的学习能力,但泛化能力较弱.多项式核函数,又称全局核函数,具有很强的泛化性能。为了充分利用这两种核函数的优点,我们将RBF核函数和多项式核函数相结合,对支持向量机分类器进行了改进。根据核函数复合条件,两个核函数之和仍然是核函数(CristianiniandShawe-Taylor,2000)。因此,在本文中,我们将使用混合核函数:解Eq。(11)w.r.t w,我们得到:Lw-anynXn<$012n1Lnn1解Eq。(11)w.r.t b,我们得到:Lanyn<$014n1KrkωK- 是的1-rk!ωKð1Þ为了求解w.r.tanP0,将等式(11)中的(13)和(14)LaXan-1XXanayy XXm15n1n1m 1mial核函数和RBF核函数,其中,06k6 1。多项式核函数Kx;x½x:x1]d2RBF核函数从等式(四)XnXm在核函数Eq. (16)可以写成:KXn;Xm/xT/xm172K=x;xi=expr2ð3Þ卢恩在替换Eq。(17)等式(15)空间(Vapnik,1995; Lauer,2018)。统计学习理论认为n聚RBF其中,k是用于调节多项式的不同效应的常数我P. Nehra和A. Nagaraju沙特国王大学学报64852n m2n mXxX如图所示。 2、输入数据集收集多个资源最小值1XXanamyyn1m 1KXn;Xm18每个主机的使用。输入数据集分为两部分:训练-测试数据集。 非线性函数映射到高可以写成:1l l lminanamy y KXn;Xman19n1m 1n1多维数据使用本文提出的混合核函数,设置参数,然后求解支持向量回归方程来训练模型。测试数据集作为训练模型的输入,预测主机的利用率值,最小差异-实际值和预测值之间的差异显示了当量(19)给出了具有最大余量的决策边界。使用输入的训练数据集,模型被训练来计算决策边界,对数据点进行分类,并预测未来数据点的类别。3.4. 云环境为了避免违反服务水平协议并提高能源效率,有必要处理动态资源需求。动态资源需求需要一个基于过去的利用历史来预测未来利用率的系统。本文提出了一种基于混合核支持向量回归(HKSVR)的方法来预测主机利用率,利用可用的利用历史。图2描述了训练模型的步骤,然后在给定的数据集上对其进行测试,以预测利用率值。基于预测,检测过载的主机,并且执行迁移以提供服务质量(QoS)。本文为了预测主机利用率,首先利用现有的阿里巴巴数据集(A.集团,2017年)用作输入。由于多个资源可能会影响利用率,因此我们考虑了多个资源,例如CPU利用率、内存利用率和带宽利用率进行预测。建议的方法。HKSVR的预测方法是在云环境中实现,以通过预测主机利用率和决定给定主机是否过载来处理动态资源需求。在检测到过载主机时,进行VM选择过程以选择用于迁移的VM,随后进行VM放置过程以将VM放置在另一主机上。算法1.主机利用率预测输入:CPU使用率、内存使用率和带宽使用历史。输出:决策边界1输入模型的输入2 应用混合核函数将非线性数据映射到高维空间。3 加载训练数据集(输入)和训练模型,以确定分类数据的边界线。4 对于新数据(CPU、内存、带宽),预测利用率(Pi)算法(1)描述了作为输入的多资源利用历史以及训练HKSVR模型以决定边界线所采取的步骤。算法2.过载主机检测输入:HostList、其作为HostListutilization的利用率列表和决策边界输出:检测到每个Pi,isn的过载主机12 决定Pi3 如果Pi越过决策边界,则主机被视为过载4 执行了VMMigration算法,其他5个6不需要对当前资源进行任何迁移7结束主机利用历史作为算法(2)的输入给出它描述了检测给定主机是否过载的步骤类似地,阈值决定检测负载不足的主机。一旦检测到负载不足的主机,所有VM将迁移到其他主机以保证服务质量在这种情况下,系统将只有迁移成本的开销。在动态整合中,在检测到过载主机时,执行VM选择以选择用于迁移的VM执行VM迁移,使得其最小化能耗和迁移时间。在文献中,存在用于VM 选择的方法:随机选择(RS)、最小利用率(MU)、最大相关性(MC)、最小迁移时间(MMT)和恒定固定选择(CFS)。1. 随机选择(RS):该方法根据均匀分布的随机变量随机选择用于迁移的VM。图二. 基于HKSVR的预测模型P. Nehra和A. Nagaraju沙特国王大学学报6486¼图3.第三章。主机47和主机241的144个点的利用率跟踪(a)主机47的利用率跟踪的图和(b)主机241的利用率跟踪的图图四、不同方法在主机47上的预测结果(a)主机47上的6点预测的图形和(b)主机47的12点预测的图形图五、主机241上不同方法的预测结果(a)主机241的6点预测的图形和(b)主机241上的12点预测的图形2. 最小利用率(MU):在此方法中选择具有最小CPU利用率的VM,以最小化处理开销。3. 最大相关性(MC):在该方法中,计算应用的资源使用之间的概率相关性,并且选择具有该相关性的最大值的VM用于迁移。4. 恒定固定选择(CFS):在该方法中,VM也是随机选择的,但是选择是恒定的,即,选择在起始、中心或最后位置5.最小迁移时间(MMT ):在这种方法中(Beloglazov 和Buyya,2012),选择将花费最小迁移时间的VM。迁移时间计算如下:其中Vm是VM使用的RAM,B代表带宽。因此,具有此比率最小值的VM将在迁移中花费最少的时间。本文提出并实现了预测未来资源使用的方法。根据预测值,决定是否需要迁移。在检测到过载主机时,迁移VM以减少能量消耗,并且使用上述MMT方法进行VM选择选择VM后,使用我们之前提出的纸张负载平衡装箱方法(Nehra和Nagaraju,正在审查)预定义的阈值用于检测负载不足的主机。如果发现任何主机利用率低于该阈值,则将其视为负载不足的主机,将其上分配的VM迁移到其他活动主机,并关闭该主机。虽然虚拟机迁移是时间迁移时间VmBð20Þ和能量消耗,但是在迁移中消耗的能量小于未充分利用的主机P. Nehra和A. Nagaraju沙特国王大学学报6487X1¼英寸- -一种Þð阿吉岛X¼ni¼1Yitu4. 绩效评价本节将讨论一些性能参数的组合预测方法,实验设置,结果和分析。4.1. 性能参数在本文中,我们比较了建议HKSVR预测方法,其他现有的预测方法。不同的度量(Mason等人,2018)来分析准确性和性能评估。为了比较和验证SVM与其他基准方法的性能,考虑以下指标:1. 均方根误差(RMSE):RMSE是残差的标准偏差(即,实际值和预测值的差它告诉数据离最佳拟合线有多近。RMSE函数可以表示为:Yi是实际值,Pi是预测值,n是观测数,MAPE的值越小,精度越高。3. 均方误差(MSE):MSE是误差平方的平均值这里,误差是估计值和实际值之间的差异。它也被称为风险函数,反映了估计量的质量度量。MSE函数表示为:nMSE Y P223ni¼1其中Yi是实际值,Pi是预测值,n是观测数。函数返回的值总是非负的,最好是接近零。4. R平方(R2):R2决定系数也被称为优度函数,它决定了回归预测实际数据点的效果。R2函数表示为:XYi-Pi2vuXn2R21-i我ð24 ÞRMSE¼Yi-Pi1/1ð21ÞYi-An其中Yi是实际值,Pi是预测值,n是观测数2. 平均绝对百分比误差(MAPE):MAPE是预测准确性的度量,用作机器学习中的损失函数。使用此函数的精度可以表示为:n其中Yi是实际值,Pi是预测值,A是预测或观察数据的平均值。接近1的值表示完美地拟合数据。5.平均绝对误差(MAE):MAE是绝对误差的平均值,即估计值和实际值之间的差值。该值将始终为非负数。处理计算函数MAE表示为:MAPE¼1XYi-Pið22 Þ见图6。 使用不同核方法的实际值和预测值的比较。2P. Nehra和A. Nagaraju沙特国王大学学报6488X1½小时- -一种吉吉阿吉岛表2不同预测方法的比较分析性能参数SVM MDRHU-AS MDRHU-EDMRHODRMSE 11.52 12.10 14.66 11.831.09 1.02 0.23毛里求斯统计局132.81 145 215 133R20.98- 33-35.02 1.08MAE 1.90 6.40 8.78 4.76图7.第一次会议。不同预测方法的实际值和预测值之间的图表(a)所提出的混合核SVM的预测图(b)MDRHU-AS的预测图(c)MDRHU-ED的预测图和(d)MRHOD的预测图。nMAEPY25n1/1其中,Yi是实际值,Pi是预测值,n是观测值的数量。4.2. 实验装置和结果在本文中,在MATLAB(Levy等人,2019;MATLAB,2016)版本R2016 a。 为了评估性能,提出了基于混合核SVM的预测方法以 及 现 有 的预 测 模 型 ( El-Kensy 等 人 , 2012 年 ; Ferdaus 和Murshed,2014年),并在上述性能指标上进行比较,系统规格为:CPU Intel Core i5- 8265 U,1.80 GHz,RAM 8 GB,操作系统为Windows 10 pro。 为了实验的目的,阿里巴巴数据集(A。Group,2017)包含以下信息:时间戳、机器ID、CPU利用率、内存利用率和带宽利用率。所有利用率值均以百分比表示该数据集包括1300台机器(主机)12小时的数据那里表3支持向量机不同核函数的比较分析性能参数RBF PolynomialHybridRMSE 18.44 19.37 11.52(a)在2004年12月31日之前,2019 -01 -25 0.92 0.98马埃8.84 10.48 1.90P. Nehra和A. Nagaraju沙特国王大学学报6489图9.第九条。不同算法的MAPE值的箱形图见图10。不同算法MAE值的箱形图。每台机器总共有144个实例,每个实例平均占用300秒。数据集包含每个主机的144个点,每个点5分钟。我们随机选择了两个主机:主机47和主机241,对所有144个点进行性能测量在144个点中,使用120个点的模型进行训练,并对接下来的6个点和12个点的数据进行预测。图3示出了主机47和主机241的所有144个点的利用率轨迹。 图图4示出了在主机47的接下来的6点和12点上的不同预测方法的实际数据和预测数据之间的曲线图。图5示出了针对主机241的接下来的6点和12点的不同预测方法的在这两个图中,使用所提出的混合核SVM的预测更接近于实际值,表明比其他预测方法更准确支持向量回归预测还依赖于用于映射高维数据的核函数。RBF和多项式核函数是应用最广泛的核函数。在本文中,我们使用了混合核函数,这是一个组合的RBF和多项式核函数表示在方程。(1)并用于不同的应用(Tania和Shill,2019)。 图图6显示了分别使用多项式、RBF和混合核函数训练SVR的实际值和预测值的图。从图中可以看出,核函数在高维数据映射和预测中起着重要作用。混合核函数的SVR显示出更好的预测,其次是RBF和多项式。为了评估所提出的方法的性能,我们考虑了阿里巴巴数据集(A。Group,2017),包括作为输入的各种主机使用数据。数据集分为两部分:训练数据集和测试数据集,比例为80:20。80%的数据集用于训练模型,20%的数据集用作 测试 数 据 集。 在 评价 误 差 百分 比 时 , SVM、MDRHU-ED、MDRHU-AS和MRHOD的预测误差分别为16%、70%、72%和21%。所提出的方法预测主机利用率准确率分别比MRHOD、MDRHU-ED、MDRHU-AS方法高7%、64%和67%。表2显示了com-对给定性能参数的现有和拟议的预测方法的概述。表2显示MDRHU-ED表现最差,其次是MDRHU-AS。MAPE的低值表示更高的准确性,并且在这里,对于所提出的方法,MAPE值最低。R2值接近1反映了拟合数据的完美性,从表2中可以看出,所提出的方法的值比现有方法更接近。所提出的方法优于并显示出更好的预测精度,其次是MRHOD,MDRHU-ED和MDRHU-AS。图7显示了四种不同方法的曲线图,绘制在实际值和预测值上。如我们所见,图8(a)的实际值和预测值之间的差异,即,使用所提出的基于混合核SVM的方法绘制的图是最小的,指示更高的精度。对于现有的方法MDRHU-AS和MDRHU-ED,预测对于某些点是准确的,如图所示。8(b)和(c)。如图7(d)所示,在所提出的方法之后,MRHOD给出了比其他两种现有方法更好的预测精度在这里,从图中,我们可以得出结论,通过所提出的SVM方法的预测比上述方法更准确。表3表示SVM中使用的不同核函数的比较。从表3中,我们可以得出结论,使用混合核函数训练SVM在MAPE,RMSE,MAE,R2与RBF和多项式核函数的比较 图图8显示了针对不同预测方法生成的RMSE值的盒须图。正如我们在图中看到的,SVM的最大范围值高于MRHOD,但混合核SVM的平均RMSE值比MRHOD最小,因为其最小值,中位数和四分位数范围小于MRHOD。基于SVM的方法优于MDRHU-AS和MDRHU-ED。图9示出了针对不同预测方法生成的MAPE值的盒须图。该图显示,基于混合核SVR的方法优于MRHOD、MDRHU-ED和MDRHU-AS,其值范围从接近零到1。MAPE的低值指示较高的准确性,并且从图中,SVM反映较高的准确性,因为值较低。图10显示了针对不同预测方法生成的MAE值的箱须图。在图中,我们可以看到基于混合核SVR的方法优于MRHOD,MDRHU-ED和MDRHU-AS。5. 结论和今后的工作资源调配和虚拟机整合被认为是处理动态资源需求、提高资源利用率和避免违反服务级别协议的有效方法。研究工作提出了一种基于SVR的方法来预测云环境中的主机利用率。我们提出了一个算法来检测过载主机,一个VM选择方法,和一个VM放置方法。结果部分描述了基于SVM的方法在RMSE和MAPE方面优于现有的MRHOD、MDRHU-ED和MDRHU-AS预测方法,并且还比较了基于SVM的预测方法观察到的到Mrhod,MDRHU-ED,MDRHU-AS。今后的工作可以有许多方向;今后工作的主要方向之一是实施拟议的办法并使用PlanetLab工作负载跟踪来预测主机利用率。使用负载平衡多维装箱方法实现VM选择和放置选定的VM。此外,实施以验证新数据集的拟议方法。P. Nehra和A. Nagaraju沙特国王大学学报6490竞争利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作。引用Hu,F.,Qiu,M.,李杰,格兰特,T.,泰勒,D.,McCaleb,S.,巴特勒湖,Hamner河,2011.云计算综述:架构和安全设计挑战。Armbrust,M.,福克斯,A.,格里菲斯河,约瑟夫,公元,卡茨河,Konwinski,A.,Lee,G.,帕特森,D.,Rabkin,A.,斯托伊卡岛Zaharia,M.,2010.云计算的观点。Buyya河,Yeo,C.S.,Venugopal,S.,Broberg,J.,布兰迪奇岛云计算和新兴IT平台:将计算作为第五实用程序FUT. 将军Comput. 系统doi:10.1016/j.future.2008.12.001。Nehra,P.,Nagaraju,A.,2019..云数据中心的可持续能源消耗建模。2019年IEEE第五届国际技术融合会议,I2CT 2019。Jennings,B.,斯塔德勒河,巴西-地云计算中的资源管理:调查和研究挑战。网络系统管理。doi:10.1007/s10922-014-9307-7。Ferdaus,M.H.,Murshed,M.,2014. IaaS云计算中的节能虚拟机整合。Abdelsamea,A.,Hemayed,E.E.,Eldeeb,H., Elazhary,H. 虚拟机整合挑战:回顾。创新空间科学Res. J.Nehra,P.,Nagaraju,A.,2019.云环境下资源利用与负载均衡调度。第四届全球可持续发展计算国际会议。Mahrishi,M.,Nagaraju,A.,2012.利用粗糙集模型优化云服务提供商调度2012年云计算技术、应用和管理国际会议论文集,ICCCTAM 2012。Khan,医学硕士Paplinski,A.,Khan,A.M.,Murshed,M.,Buyya河,2017年。用于高能效云资源管理的动态虚拟机整合算法:综述。反对:反对有效。云能源服务 原则与实践。阿米里,M.,Mohammad-Khanli,L.,2017年。云资源配置应用预测模型研究综述Dinesh Kumar,K.,Umamaheswari,E. 使用预测模型的云计算资源配置:调查。Int. J.纯应用数学Masdari,M.,Khoshnevis,A.,2019.云计算工作负载预测方法综述与分类。群集计算,1-26A.组阿里巴巴cluster-trace-v2017.网址:https://github.com/alibaba/clusterdata。Gahlawat,M.,夏尔马,P.,2016.基于支持向量机的云主机过载检测模型。信息和通信技术国际会议论文集《可持续发展》,Springer,pp. 369-376.阿卜杜拉湖,Li,H.,Al-Jamali,S.,Al-Badwi,A.,Ruan,C.,2020.利用支持向量回归技术预测多属性主机资源利用率。IEEE Access 8,66048-66067。Beloglazov,A.,Buyya河,2012.优化的在线确定性算法和自适应算法,用于云数据中心中虚拟机的节能和性能高效动态在:并发计算实践和经验。Sharma,O.,Saini,H.,2016.使用基于中值的阈值方法进行云数据中心的VM整合。Procedia计算Sci.Li,Z.,Yu,X.,Yu,L.,(1995 - 1996),美国,Guo,S.,Chang,V.节能和质量感知VM整合方法。FUT.计算机将军系统doi:10.1016/ j.future.2019.08.004.Mahdhi,T.,Mezni,H.,2018. IaaS云数据中心中基于预测的VM整合方法。J. 系统软件doi:10.1016/j.jss.2018.09.083。Li,L.,董,J.,Zuo,D.,Wu,J.使用鲁棒线性回归预测模型在云数据中心进行SLA感知和节能VM整合。IEEE Access. doi:10.1109/ACCESS.2019.2891567.Abdelsamea,A.,El-Alfressy,A. A.,Hemayed,E.E.,Eldeeb,H.使用混合回归算法的虚拟机整合增强。埃及INF.J. doi:10.1016/j. eij.2016.12.002。El-Alfressy,A. A.,Abdelsamea,A.,卡姆兰河,萨阿德,M。用于云计算中主机过载检测的多维回归主机利用率算法(MDRHU)。J.云计算doi:10.1186/s13677-019-0130-2。克里斯蒂安尼尼,N.,Shawe-Taylor,J.,2000.介绍支持向量机和其他基于核的学习方法。Vapnik,V.N.,1995.统计学习理论的本质。Lauer,F.构造内核函数。网址:https://mlweb.loria.fr/book/en/constructingkernels.htm。Nehra,P.,Nagaraju,A.在云数据中心中使用负载平衡多维装箱启发式算法进行高效资源分配和管理在:国际通用计算机科学杂志(undetr审查)。Mason,K.,达根,M.,巴雷特,E.,Duggan,J.,Howley,E.使用进化神经网络预测云中的主机CPU利用率。FUT.计算机将军系统doi:10.1016/j.future.2018.03.040.Levy,M.,Raviv,D.,贝克,J.,2019.使用信息物理系统镜头在MATLAB和simulink中部署数据中心仿真。在:2019年IEEE第9届年度计算和通信研讨会和会议,CCWC 2019。MathWorks,掌握机器学习。MATLAB逐步指南。塔尼亚,佛罗里达州,希尔,P.C.,2019.一种改进的混合核支持向量机用于疾病诊断。在:BECHANICON 2019
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 高清艺术文字图标资源,PNG和ICO格式免费下载
- mui框架HTML5应用界面组件使用示例教程
- Vue.js开发利器:chrome-vue-devtools插件解析
- 掌握ElectronBrowserJS:打造跨平台电子应用
- 前端导师教程:构建与部署社交证明页面
- Java多线程与线程安全在断点续传中的实现
- 免Root一键卸载安卓预装应用教程
- 易语言实现高级表格滚动条完美控制技巧
- 超声波测距尺的源码实现
- 数据可视化与交互:构建易用的数据界面
- 实现Discourse外聘回复自动标记的简易插件
- 链表的头插法与尾插法实现及长度计算
- Playwright与Typescript及Mocha集成:自动化UI测试实践指南
- 128x128像素线性工具图标下载集合
- 易语言安装包程序增强版:智能导入与重复库过滤
- 利用AJAX与Spotify API在Google地图中探索世界音乐排行榜
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功