Joumal of Computer Applícations
计算机应用,
2015
,
35(
9):
2476 - 248J
ISSN 1001-9081
CODEN JYIIDU
2015-09-10
http://www.joca.cn
文章编号:
1001-9081
(2015
)09-
2476-06
doi: 10.
1l
772/j.
iss
日
.1001-9081.2015.09.2476
基于异常检测模型的异构环境下
MapReduce
性能优化
侯佳林,王佳君,聂洪玉
(西南交通大学'信息科学与技术学院,成者
f1610031)
(吨通信作者电子邮箱
houjia_lin@
foxmai
l.
com)
摘
要:针对"落伍者"的选择问题,提出利用故障诊断领域内通常使用的异常检测模型来选择"落伍者"的方法。
首先,利用异常检测算法来发现集群中的"慢节点然后改进
MapReduce
任务分自己算法和推测执行算法,不再给"慢
节点"分自己任务并将"慢节点"中的任务分配至有空闲任务槽的正常节点中
O
在改进的推测执行算法中,因相同网段
内的节点通常物理邻近,可提高数据传输速度,首次将"慢节点"中的任务分配至同网段的正常节点中,以便数据传
输。实例验证结采表明,使用异常检测算法后可迅速检测出异常节点,且与
Hadoop-LATE
算法相比,处理相同任务量
可缩短集群
17%
的任务处理时间,说明所提算法在集群整体性能优化中表现优异。
关键词:异常检测;
MapReduce
性能优化;推测执行;异构环境
中图分类号
:T
凹
02
文献标志码
:A
MapReduce performance optimization based
on
anomaly detection model in heterogeneous
cI
oud environment
HOU
Jialin
, W
ANG
Jiajun
,
NIE
Hongyu
(5chooL
of
1.
呐
rmation 5c
阳时
e
and
TechnoLogy, 50uthwest
Ji
ωto
略
University
,
Chengdu 5ichuan
610031
, China)
Abstract:
To
effectively select the straggler machines, an anomaly detection model generally adopted ín failure analysís
was proposed. Firstly
, an anomaly detection algorithm was employed
to
detect the slow nodes in the cluster. Secondly, task
assignment algorithm and speculative executíon algorithm were improved
to
stop assígníng
new
tasks
to
slow nodes and these
tasks were assígned
to
normal nodes with idle slots.
1n
the improved speculatíve execution, it
was
for the first tíme that those
tasks ín slow nodes were transferred into the normal nodes in the same network segment
, since data transferring can be
physically accelerated ín one network segmen
t. The experimental results demonstrate that the straggler machines are quickly
detected after running the anomaly detection algorithm. Compared with the algorithms in Hadoop-LATE
, 17% of the
processing tíme can be saved when the same amount of the tasks are processed
, which concludes that the proposed algorithm is
more suitable for improving the overall performance of the clusters.
Key
words:
anomaly detection; MapReduce performance optimization; speculative execution; heterogeneous
envlronment
。
引言
近年来,随着互联网的快速发展,网络所产生的数据量成
指数级增长,几乎每三年翻一番
[1]
。据互联网数据中心预
测,到
2020
年全球产生的数据量将达
40
ZB[2]
,高效的存储、
查询、分析、并理解这些数据使其为人类服务是当前计算机科
学界所关注的热点问题。文献
[3
- 5
]提出了目前通用的解
决方案:设计建造由局域网互联的具有超强计算能力的并行
计算中心,用其来快速地存储、处理这些数据。
由Go
ogle
公司提出的谷歌文件系统(Go
ogle
File System ,
GFS)
和
MapReduce
编程模型,是当前最为流行的大规模文件存
储和数据处理的方法。其中,
MapReduc
以其较强的可扩展性、良
好的可用性及较好的容错能力成为并行计算领域的研究热点
[3]
。
然而,早期的
MapReduce
以同构环境为应用前提:即研
究者认为集群中所有节点都有相同的硬件配置、相同的信息
收稿日期
:2015-04-30
;修回日期
:2015-07-08
。
处理能力。可随着数据量的不断增加,使用者亟须向集群中
新增计算节点来提高其性能。由于硬件更新换代较快,新增
节点和旧节点配置往往不同,这就造成了集群中的异构环境。
因此,早期针对同构环境而设计的
MapReduce
并行算框架已
远不能满足当前需求,异构环境下
MapReduce
性能优化已成
为当前研究热点。
在集群中落伍者"的出现将严重影响其性能。为此,
早期
Dean
等
[3]
将这些异常节点中的任务拷贝到其他正常节
点中运行,以缩短任务执行时间,提高集群性能。这种推测执
行
(speculative
execution)
算法,为
Google
缩短了约
449
毛的任
务执行时间。
针对上述情况,本文提出如下解决方案:第一,利用异常
检测模型,通过收集集群中所有节点的状态信息,快速、高效
地检测当前集群中异常节点。第二,检测出异常节点后,优化
MapReduce
任务分配算法和推测执行算法,以提高异构环境
基金项目:中央高校基本科研业务费专项资金专题研究项目
(SWJT
U1 1Z
T0
8)
;国家语委"十二五"科研规划项目(
YBI25
-4
9)
。
作者简介:侯佳林(1
990
- )
,男,河南洛阳人,硕士研究生,主要研究方向:
MapR
e.
duce
并行计算、藏语舆情监测:
王佳君(
1990
一)
,男,河北
茹城人,硕士研究生.主姿研究方向:藏语舆情监测:
聂洪玉(1
989
- )
,女,
IJ
Ij川内i:
r
卢人,硕士研究生,主要研究方向:藏语舆情
)~f
ìÞ!IJ
c