表
1
为系统运行分析收集的日志信息列表
指标描述
为每个作业
已提交作业的
用于作业的
队列类
链接方向上请求的计算节点数
链接方向上请求的计算节点数
链接方向上请求的计算节点数
在
链路方向上分配的计算节点数
在
链路方向上分配的计算节点数
在
链路方向上分配的计算节点数
极限然而,它受到
节点配额
的限制。在本研究中,我们假设 的
带宽
。
这是 注意到密集型 就业倾向 要求 计算
节点,以防止密集型应用程序遇到来自其他作业的干扰。因此,
这样的工作实现了高带宽水平。 然而,这些作业的和内存利用
率低于其他节点布局的情况下。此外,由于与其他节点布局情况相比,
固定节点布局中的作业集倾向于使用更大量的磁盘空间,因此我们发
现所需的计算节点布局在文件方面存在
已执行作业的运行时间
由
node-quota
选项指定的每个计算节点分配的磁盘空
间
闪烁文件
的总
字节
数
持续
相对于峰值
的比率
计算一维()、二维()和形状中的节点布局。在日志信息
中,作业仅在 然后把注意力集中在 和 工作 把数字放进去,
然后把注意力集中在 。最后,工作
与和工作相比, 和工作从大的工作。工作被进一步分离
在我们寻找答案时,使用日本财政部年下半年至年上半年的
就业统计日志数据,
分为两组,计算节点布局有变化和没有变化我们将作业分为3D
(相同),如果
(
)(
)(
)的文件
否则,我们将工作分成3D(可延展),
大。在这两年中使用测井数据有两个原因
术语选择年下半年作为开始时间,是因为也标志着上述使用温度
日志数据的电力预测过程的建立,而选择年上半年作为结束时间,
是因为我们从年下半年开始进行冷却系统检查(其中冷却水温度被
故意改变)。这意味着我们不能使用估计模型来预测这段时间的电力。
使用了来自日志数据的以下指标
•
:按
节点配额
为每个节点分配的磁盘空间
•
:中分配的计算节点数
计算活动。如前所述,作业中较高的文件相比之下,作
业中较高的计算活动往往导致增加的电力。对于这些相关系数评估,
我们使用了
Python
模块为了消除单个相关函数的依赖性,我们使用
了
SciPy
包提供的以下三个相关函数:
•
使用
scipy.stats.pearsonr
的
积差相关系数,指标
转换为对数标度(以下称为Pearson(Log))
•
的 斯皮尔曼 排名顺序 相关性 系数使用
scipy.stats.spearmanr
(以下简称
斯皮尔曼
)
由node-quota选项指定
•
:已
用
磁盘空间相对于
可实现
的最大大小的比率
•
:持续相对于峰值的比率
•
:持续内存带宽利用率相对于理论带宽的比率
•
功率
:每个计算节点的最大功率,
scipy.stats.kendalltau
(以下简称
Kendall
)
应注意,对数尺度中的转换度量用于 积差相关性评估,以减轻
离群值的影响,如其他研究所述
3.1.
与之间的相关性
由于众所周知密集型应用程序往往会降低利用率,因此我们
接下来检查 并以彩色图描述和
图
中。
计算节点和接受的作业使用到,个计算
结在下文中,我们将在此队列类中执行的作业描述为
大的工作。
虽然上述指标中有四个与文件活动有关,但其余指标与电力有
关与文件相关的两个
指标和
说明
如下:
我们做到了,反之亦然。还应注意,接近零的几个红色图是显示磁盘
空间利用率较低的作业,即使已通过较高值分配了大量磁盘空间另
外,图()表明,有些工作在年达到了较高的比率,而它们
达到的比率却相当低。
在3D和3D情况下都具有低值
(可延展)
工作,并且在这种情况下给出的值也很小。意思是
虽然,3D(相同)的 工作在图。图()和()显示了两个不同
的组。
闪烁
,
闪烁
,
闪烁
是
每个节点的
实际文件
大小
,
最大值
在这里,一组由面向的作业组成,这些作业从分布到
最大
闪烁时间和持续时间
限制
。注意