第
24
卷第
10
期
2011
年
10
月
传感技术学报
C
Hl
NESE
JOURNAL
OF
SENSORS
AND
ACTUATORS
Vol.
24
No. lO
Oc
t.
2011
。Le缸
ning-Based
Routing Mechanism for Multi-Sink Wireless Sensor Networks *
ZHOU Shuli
1
,
ZHAGN
Yun
1
, CHEN
Zhi
1
ι3
,
4*
,
HU
Luoquα
n
5
,
YUE
Wenjing
4
1.
College
01
Computer
,
Nanjing University
01
Posts
and
Telecommunications
,
N
,
α
njing
210003
,
Chin
α;
2.
State Key
La
bor
,
创
ory
lor
Novel
S
q,加
are
Technology
,
Nanjing University
,
Nanjing
210093
,
China;
3. Jiangsu High Technology Research Key
La
boratory
lor
Wireless
Sensor Networks
,
N
,
α
njing
210003
,
China
;
4.
Key
La
b
01
Broadband
Wireless
Communication
α nd
Sensor Network
Technology
,
Ministry
01
Education
,
N
α
可
'ing
210003
,
China;
5.S
时
hou
Entry-
Exit
lns
μ
ction
and
Quarantine
Bure
α
u
,
Suzhou Jiangsu
215104
,
China
Abstract
:
Th
e
traditional
single-Sink sensor networks have some disadvantages
,
such
as consuming
energy
of
the
nodes
on the key
path
too
quick
,
the singleness
of
routing
algo
出
h
叽
the
invalidation of the Sink node
,
etc.
Whi
le multi-Sink
WSNs can solve these problems efficienÙy
,
protocols
of
multi-Sink WSNs are studied and a new routing mechanism based
on
Q-learning is presented.
By
using Q-learning
,
nodes take various
kinds
of conditions into account
,
study periodically
and
achieve their
optimal
routing.
Finally the source node chooses the optimal path to send signals according to the
Q
value.
Case study
shows that this mechanism
saves
the
node energy
,
prolongs the
life
of sensor networks.
Key
words:
Q-leaming
;
wireless
sensor
networks;
multi -Sink
node;
routing
mechanism
EEACC
,
6150P
doi:
10.
3969/j.
issn.1004-1699.
2011.10.
022
基于
Q
学习的多
Sink
节点元线传感网路由机制研究*
周淑俐
1
,章韵
1
,陈志
1
,
2
,
3
,
4\
雇罗全
5
,岳文静
4
1.南京邮电大学计算机学院,南京
210003
;
2.
南京大学计算机软件新技术国家重点实验室,南京
210093
;
3.
江苏省无线传感网高技术研究重点实验室,南京
210003
;
4.
宽带无线通信与传感网技术教育部重点实验室,南京
21
∞
03
;
5.
苏州出入境检验检疫局,江苏苏州
215104
摘
要:单
Sink
节点无线传感网存在部分关键区域节点能量消耗过快、路由选择算法单一及
Sink
节点失效的问题。多
Sink
节点无线传感网能有效解决上述问题,研究多
Sink
节点传感网的路由协议及其存在的不足,提出了一种基于
Q
学习的路由选
择机制。利用该学习方法节点综合考虑各种环境因素,进行周期性的学习训练,优化路径选择,最后按照计算得到的
Q
评估
值选择最优的路径进行数据传送。实例分析表明,基于
Q
学习的路由机制能有效延长网络的使用寿命。
关键词
:Q
学习;元钱传感网;多
Sink
节点;路由机制
中图分类号
:T
P3
93
文献标识码
:A
文章编号
:1004-1699(2011)10-1479-05
无线传感网节点一般能量供应、计算和通信能力
有限,在部署节点和设计各种协议时要考虑有效利用
各种资源[
1]
。在无线传感网中,传感器节点采集环境
变量并将它们传送给
Sink
节点(网关节点或汇聚节
点)
,
Sink
节点通过元线方式接收各传感器节点的数
据并以有线或无线的方式将数据传送给最终用户
O
无线传感网在许多领域都得到了很好的应用,但在传
统的单
Sink
传感网中存在许多问题,比如靠近
Sink
节点或者关键路径上的节点能量消耗过快,会引起节
点的能量消耗不均衡;单
Sink
节点的失效会引起整
个无线传感网的通信中断,当传感网的规模不断增
加,节点数目不断扩充,靠近
Sink
节点的传感节点比
其他节点消耗的能量更快,因为他们需要传递大量的
消息,因此延长整个传感网的寿命成了一个至关重要
项目来源:国家自然科学基金项目(
60905040)
;江苏省基础研究计划(自然科学基金)项目
(B
K2
011756)
;江苏高校优势学科
建设工程项目(
yx
l
∞
2
∞
1
)
;江苏省博士后科研资助计划项目(
1101006B)
;江苏省高校自然科学研究计划
(08KJB52
∞
07
,
11
KJB51
∞
18)
;南京邮电大学科研基金项目(
NY207020
,
NY21
00
11
,
NY211
009
)
收稿日期
:2011-04-22
修改日期
:2011-07-21