收稿日期:20140916;修回日期:20141121
作者简介:刘晓艳(1988),女,江苏连云港人,硕士研究生,主要研究方向为云计算、资源管理、虚拟机调度等(lxy_yr@163.com);王颖(1989),
女,硕士研究生,主要研究方向为资源管理、云计算等.
基于改进云模型的云计算负载预测
刘晓艳,王 颖
(南京邮电大学 计算机学院,南京 210003)
摘 要:针对云平台负载预测方法中对 CPU、内存利用率等不同类型负载之间的相关性考虑不足且准确度较低
的问题,提出一种基于改进云模型的负载预测方法。该预测方法考虑了 CPU、内存之间的相关性,通过提出亲密
云和重叠云的概念对云概念模型进行跃升,并综合考虑了负载数据的历史特性和当前变化趋势,由此建立基于
云模型的负载预测模型。仿真实验表明,基于云模型的预测方法的预测精度高于其他预测模型,是云计算中负
载预测的一种有效方法。
关键词:云计算;负载预测;云模型;概念跃升
中图分类号:TP393.09 文献标志码:A 文章编号:10013695(2015)10312404
doi:10.3969/j.issn.10013695.2015.10.056
Forecastingofcloudcomputingloadbasedonimprovedcloudmodel
LiuXiaoyan,WangYing
(CollegeofComputer,NanjingUniversityofPosts&Telecommunications,Nanjing210003,China)
Abstract:Tosolvetheproblemsthattheforecastingmodelsofcloudcomputingloadstakeinsufficientaccountofthecorrela
tionbetweendifferentloadsandhavelowaccuracy
,thispaperproposedaloadforecastingbasedonimprovedcloudmodel.By
presentingtheconceptsofsimilarcloudandoverlapcloudtoobtainthezoomingconceptionscloudmodel,itconsideredthecor
relationbetweenCPUandmemoryandcombinedthehistoricalfeaturesandthecurrenttrends.Thesimulationresultsshowthat
theforecastingmodelbasedonimprovedcloudmodelprovidemorepreciseofforecastingthantheotherforecastingmodels.
Thus,theforecastingbasedonimprovedcloudmodelisdemonstratedtobeefficientfortheloadforecastingofcloudcomputing.
Keywords:cloudcomputing;loadforecasting;cloudmodel;conceptionzooming
!
引言
近年来,随着云计算技术的不断发展,使得云计算能够灵
活、可扩展、按需地为应用分配所需资源。为了有效地管理资
源,实现资源利用率最大化,云计算系统通常在资源管理中引
入预测技术,根据负载预测值,进行合理地资源调度,同时也能
够避免不必要的虚拟机迁移
[1]
。因此,负载预测技术是云计
算中一个优化资源分配和节能的显著有效的方法。
云平台规模不断地扩大,负载预测的难度也在不断增加。
首先,由于云平台中的主机负载变化是非线性、非平稳且随机
的
[2]
,传统的预测方法,如移动平均法
[3]
、指数平滑法、差分自
回归移 动平均 法 (autoregressiveintegratedmovingaveragemo
del,ARIMA)
[4]
、灰色模型
[5]
等,对负载趋势的拟合程度不高,
预测精度较低。而后提出基于 BP神经网络
[6]
和基于 Elman
神经网络的预测模型
[7]
,但神经网络模型存在如收敛速度慢、
参数选择敏感及容易陷入局部最优解等不足。文献[8]通过
用遗传算法和文献[9]用粒子群算法来对神经网络的参数及
学习算法进行优化,提高了预测精度。但是该类基于神经网络
受到网络结构复杂性和样本复杂性的影响较大,并且神经网络
的训练需要花费大量的时间,对于不同结构的数据序列,预测
的差异性较大,预测效果的稳定性较差。其次,研究表明仅通
过单时间序列来预测将来负载的预测精度通常较低,考虑不同
资源之间相关性,有助于提高预测精度
[10]
。然而现有预测算
法在考虑相关性的时候存在局限性。文献[
11]提出了应用于
云计算环境的多时间序列预测模型,来进行负载的特征描述和
预测。该模型考虑的是不同分组之间相关性。文献[12]提出
了一种基于多个子基础模型自回归的预测方法,考虑的是不同
虚拟机之间的关系。文献[11,12]没有考虑不同类型负载之
间的关系。文献[13]提出一种基于自回归模型考虑 CPU和内
存利用率的负载预测算法,但是该算法用简单的函数来表示两
者之间的关系,而实际中
CPU利用率与内存利用率之间关系
较为复杂。
针对上述问题,本文提出一种基于改进云模型的负载预测
方法 (predictionmethodbasedonimprovedcloudmodel,PM
CM)。目前,云模型方法已经成功应用于智能控制、数据挖掘、
入侵检测、大系统评估等多个领域中。但是,有关在云计算领
域中应用云模型的文献极少。云模型是在模糊数学和概率统
计的基础上提出的定性定量互换模型
[14]
,综合考虑了模糊性、
随机性以及两者之间的关联性
[15]
,使得它非常适合云计算环
境中负载的随机性和非线性的特征,并且单个云滴并不影响云
的整体特征,所以云模型能够有效解决样本缺失及噪声干扰问
题。综上,本文采用云模型来研究云环境中负载预测问题,通
过提出亲密云和重叠云来进行概念跃升,然后挖掘 CPU、内存
第 32卷第 10期
2015年 10月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol32No10
Oct.2015