组件(处理器、存储器、网络元件、存储装置等)或有限可用性的虚
拟组件(操作系统),
其中SN
a
、SN
b
和SN
c
是在http服务器、J2EE服务器和数据库服务器上完
成的事务的平均数量。
CPU
、内存等(
Manvi
和
Shyam
,
2014
)。
为了预测
CPU
利用率,
Adane
和
Kakde
(
2018
)评估了五种机器
学习算法在从并行数据库存档中提取的服务器日志上的性能。实验是
使用
Weka
工具进行的选择线性回归
(LR)、K-近邻(KNN)、神经
网络(NN)、
随机森林(
RF
)和支持向量机(
SVM
)作为资源供
给预测模型。这种方法提供了一步预测(预测下一个时间间隔)。
它还扩展到提供多步预测。
结果表明,支持向量机是最好的性能,除了训练预测模型需要很
长的时间。另一方面,本文的工作证明了单个预测模型可以很好地用
于特定类型的工作负载,而不适合其他类型的工作负载。
Di等人(2014)提出的工作允许预测未来时间间隔内的负载波动和
连续未来时间间隔内的负载波动。 他们专注于CPU和内存利用率。该
预测研究基于Google数据中心的工作负载。预测方法是基于贝叶斯分类
器。
贝叶斯分类主要包括五个步骤:首先,确定所有的目标状态。然
后,基于样本计算目标状态的概率分布。计算每个目标状态的联合概率
分布。然后,计算后验概率。最后,实现预测值。
将该方法与自回归、移动平均、噪声滤波等八种方法进行了比较。
贝叶斯方法比其他方法平均提高5.6%~ 50%.然而,这种方法无法适应工
作量的变化(Amiri和Mohammad-Khanli,2017)。
在同一类别中,Amiri et al.(2018)提出了一种基于顺序模型提取
的预测模型,称为POSITING,用于预测下一时间间隔的资源未来使用情
况。POSITING考虑应用程序过去的行为,提取行为模型(情节),同时
考虑资源之间的相关性,并将其存储在离线模型库中。在序列中寻找模
式被 称为 情节 提取 。情节 是一 起发 生的 事件 的集合 。例 如episode=
( CPU , high ) ; ( Memory , medium ) ; ( Network , high )
(CPU,低);(磁盘,低) (网络,非常弱)。基于提取的事件和最
近的应用行为,预测模型 预测未来的资源需求。与其他方法相比
,
POSITING显示出更好的预测精度。但是,它无法适应工作量的变化。此
外,存储所有数据然后对其进行处理,无法实现最佳资源消耗。计算资
源的消耗和预测模型的执行时间应该是合理的(Amiri和Mohammad-
Khanli,2017)。
在基于C2类的方针中,业绩评价
预测诸如吞吐量、响应时间、可用性的度量。在这第二类作品中,我们
可以参考(吴 例如,2013年)。这项工作使用排队模型(QM),
以反映多级应用程序的工作量和响应时间之间的关系。一个多级应用程
序由I
个
组件组成,每个组件由M
个
事务组成。
响应时间根据等式
1
获得:
HTTP服务器、J2EE服务器和数据库服务器的请求速率。
在给定工作负载的情况下,使用QM模型计算预测结果,并将其与观
察到的测量响应时间进行比较。估计误差小于15%。估计请求的到达率
和服务时间等参数是昂贵的。此外,该预测模型无法管理变化和所有类
型的工作负载。
Li et al.(2017)提出了一种贝叶斯网络模型(BNM),以预测云
服务在下一个时间间隔的响应时间和可用性
该方法主要包括四个步骤:首先,收集数据:响应时间,可用性,
进程数,CPU使用率和物理内存使用率。然后,处理数据。事实上,如
果每个数据都属于合理的变化范围,则它取值True,否则取值False。
在此基础上,利用互信息理论建立了贝叶斯网络,并利用贝叶斯网络中
节点间的依赖关系,建立了贝叶斯网络模型。然后,每个节点具有条件
概率表(CPT),其被定义为在所有可能的条件概率下相对于父节点列
出每个节点。最后,利用联合树引擎推理方法对云服务的服务质量进行
了预测。
实验表明,BNM与神经网络、ARIMA等方法相比,具有更好的性
能。然而,在样本数据分散或难以获取的情况下,贝叶斯网络的建立需
要专家知识,且不适应应用领域的变化。
在
Liu
和
Chen
(
2019
)中,
Liu
和
Chen
开发了一种基于聚类和信
任感知协作过滤(
CF
)方法的新方法,以实现服务质量的个性化预
测,从而可以推荐可靠的云服务此服务建议将提供给最终用户。
首先,提出了一种
K
中心点算法。它综合用户任务的相似性来识
别相似用户。其次,设计了一种信任感知的
CF
方法来重建集团的用
户网络,以确保实现可靠的云服务推荐
虽然这种方法给出了良好的预测精度和超越国家的最先进的方法
在 预 测 的 准确 性 方 面 , 它 有 一 个 多 项式 的 复 杂 性
O
(
m2
) 的
K-
medoids
算法的一个单一的迭代与
CF
信任意识的复杂性,它等于
O
(
m2
logm+mn
),其中
m
表示的用户数和
n
的服务的数量。
在第三类(C3)的作品中,我们可以参考(Liuet al.,2005年)。
本文使用控制理论来确定一个简单的线性模型,可以预测下一个时间间
隔的平均响应时间(MRT)。MRT的值与参考值进行比较,并且两个值
之间的差被馈送到闭环控制器。这允许调整CPU使用率,以保持MRT在
期望的响应时间附近测量。虽然,在这项工作中提出的模型捕捉了大部
分的数据波动与合理的准确性,它错过了一些峰值,由于其简单性。
如Amiri和Mohammad-Khanli(2017)所述,很难使用线性控制器
对云中的工作负载行为进行建模。因此,这种预测方法无法管理所有类
型的工作负载。
在同一类别C3中,Bankole和Ajila(2013)研究了
三种机器学习技术的应用:SVM,ANN