第
34
卷第
14
期
Vo
1.3
4
No.14
计算机工程
Computer
Engineering
2008
年
7
月
July
2008
·软件技术与数据库·
文章编号
100
←-3
428(2008)14
→
075
→
3
文献标识码
A
中固分类号
TP312
分布式网格系统的任务调度算法
DE
Scheduling
子祥杨矗鲁杨学目。
2
贺铭
2
(1.中国安全生产科学技术研究院,北京
100029;
2.
南开大学信息技术科学学院计算机科学与技术系,天津
300071)
摘要:目前研究的动态任务调度算法都基于集中式或部分分布式网格系统,系统中心节点(组)进行资源管理。该文提出一种面向无资源
管理的完全分布式网格系统动态任务调度算法
DE
Scheduling
。该算法使用任务冗余调度算法屏蔽解决系统的动态性问题,通过动态调节冗
余量减少无效计算和保证系统负载均衡。使用给定平均连接度的无标度网络演化模型构造具有
1
000
个节点的
Intemet
网络模型仿真任务
处理过程。仿真结果表明,任务数为
10
000-100
000
时该系统冗余调度次数均为
2
次,冗余计算量占总计算量的比例不超过
0
.3
5%
,且随
着任务数增加而递减。
关键词:分布式网格系统;任务调度;冗余调度
DE Scheduling: Scheduling Algorithm for Distributed Grid System
YU
Yang
I,
YANG
Yu_lu
2
,
YANG
Xue-gani
,
HE
Mini
(1. China Academy
of
Safety
Scienc
巳&
Technology,
B
巳
ijing
100029; 2.
Departm
巳
nt
of
Computer Science & Technology,
College
of
Information Technical Science,
r
、,
ankai
University, Tianjin 300071)
(Abstract]
A dynamic scheduling algorithms studied in
references
缸巳
based
on
centralized grid system or part -distributed grid system, in which
there are center node(s) to manage
r
巳
sources.
A dynamic scheduling algorithm for the fully distributed grid system without resource management,
named
DE
Scheduling,
is
proposed. In
th
巳
algorithm
,出
e
redundant scheduling
is
used
to
solve the dynamic
of
environment, and
th
巳
tim
巳
of
redundant
sch
巳
duling
is set dynamically to reduce void calculations and balance the load
of
th
巳
system.
A group
of
simulations have been
don
巳
by
using the Intemet model with 1 000 nodes based on
th
巳
evolving
model for scale-free network with given mean connected
degre
巳.
Wh
en
the number
of
tasks is from
10
000
to
100 000, the time
of
redundant scheduling always equals 2,
th
巳 redundant
ca
Ic
ulations account
of
the total amount
is
less
than 0
.3
5%, and reduces with the increasing
numb
巳
r
oftasks
(Key
words]
distributed grid
syst
巳
m;
task scheduling; redundant scheduling
1
概述
在科学计算领域,聚合
Internet
上大量普通节点的闲置
计算能力进行大规模分布式计算,是网格计算的一个重要研
究方向,资源管理和任务调度是网格系统的
2
类关键技术。
不同于目前大多数网格系统,完全分布式网格系统
[1-2J
不存在
任何节点来管理全局或局部的资源动态信息,节点各自管理
自己的资源,在大规模动态环境中具有良好的可靠性和可扩
展性。
由于完全分布式网格系统中不进行全局或局域性资源管
理,因此任务调度算法对系统的运行性能和特性具有重要的
影响。任务调度的目的是将计算任务以最优方式分配到合适
的计算资源上进行计算,复杂的结构和环境的动态性决定了
网格系统大多使用动态调度算法。
常用的一类动态任务调度算法通过在运行过程中收集、
存储并分析节点和任务的状态信息,决定任务的下一步调度。
但由于网格系统在实际运行中难以获取准确的环境动态信
息,网格系统规模巨大,如果采用实时检测的方法来监测系
统的动态信息,由此带来的开销是不可忽略的,同时完全分
布式网格系统不进行全局/局域资源管理,因此这类算法不适
用于本文的网格系统。另一类动态任务调度算法不需要获取
当前系统状态、负载分布等动态环境信息,典型的有
Eager
Scheduling
算法
[3]
、
RR
算法
[4]
等。但是这类算法都需要获取
全系统资源使用信息作为调度算法的辅助信息,不能直接应
用于完全分布式网格系统。
本文参考
Eager
Scheduling
算沽,提出一种应用于完全
分布式网格系统的动态任务调度算法
DE
Scheduling
,不需要
获取系统运行中的动态信息和全系统资源的使用信息。该算
法通过任务冗余调度解决系统的动态性容错问题,通过动态
调节冗余量减少资源浪费和保证系统负载均衡。
2
完全分布式网格系统
完全分布式网格系统不存在任何管理节点,整个网络采
用自组织方式构成。系统中每个节点各自管理自己的资源,
其地位相等,功能相同。需要计算能力的用户在每个节点上
都能够提交应用,用户将某个应用分解成多个可以并行的任
务,在自己拥有的节点上提交(本文称该节点为任务源节点)
;
用户提交的任务或从别的节点转发来的任务均保存在本地任
务队列中。系统通过每个组成节点对各自的信息管理和任务
调度向用户提供计算能力。
3 DE
Schedu
Ii
ng
算法
完全分布式网格系统中节点的信息管理是任务调度的基
基金项目:国家自然科学基金资助项目
(60473088);
天津市重点科技
攻关专项基金资助项目
(05YFGZGX23900)
作者俯介:于洋(1
979
一),女,工程师、博士,主研方向:网格计
算,并行机系统结构;杨愚鲁,教授、博士生导师;杨学刚、贺
铭,
硕士研究生
收稿日期
2007-08-30
E-mail:
yuyang_79@yahoo.co
肌
cn
一
75
一