收 稿日期 : 2008-02-19; 修 回日 期: 2008- 05-10 基 金 项 目: 国 家 自 然 科 学 基 金 资 助 项 目 ( 60673179) ; 浙 江 省 自 然 科 学 基 金 资 助 项 目
( Z106727, Y105356)
作 者简介 : 谢 满德 ( 1977-) , 男, 湖南 人, 博士, 主要 研究 方向为 分布 式系统 、P2P 网络( xiemd@ mail. zjgsu. edu. cn) ; 魏 贵义 ( 1973- ) , 男, 江 西人 ,
副教授 , 博 士, 主要 研究方 向为 移动计 算、P2P 网络 ; 凌 云( 1965- ) , 男 , 浙 江人 , 教 授, 硕士, 主 要研究 方向 为分布 式计算 、自组织 网络.
无 结 构 对 等 中 网 络 资 源 发 现 方 法 研 究 的 最 新 进 展
*
谢满德, 魏贵义, 凌 云
( 浙江 工商 大学 计算 机与 信息 工程 学院 , 杭州 310018)
摘 要: 为 了提 高无 结构 对等 网络 的资 源查 找效率 , 消除 冗 余 网 络 流 量, 出 现 了 许 多 查 询算 法 。在 分 析 这 些 算
法特 点的 基础 上, 将它 们大 致分 成四类 : 基于 前向传 递的 方 法、基于 缓 存 的 方 法、基于 查 询 和 数 据双 重 复 制 的 方
法、基于拓扑 优化 的方法 。进 一步 深入 分析 其优 缺点之 后, 指 出任 何一类 查询 算法 都只 优化 了 某一 方 面 的性 能 ,
如果 能将 某几 类方法 有机 集成 , 使它们 相互 补充 , 定 能取 得更 好的 效果 。最 后给出 了一 些重 要的 结论 。
关键 词: 无 结构 对等 网络 ; 拓扑 失配 ; 覆盖 网; 搜 索效 率
中图 分类 号: TP393 文 献标 志码: A 文 章编 号: 1001-3695( 2008) 11-3214-04
Survey on resource discover methods in unstructured P2P network
XIE Man-de, WEI Gui-yi, LING Yun
( College of Computer Science & Information Engineering, Zhejiang Gongshang University, Hangzhou 310018, China)
Abstract: Many search methodshave been presented to avoid the large volume of unnecessary traffic incurred by the flooding-
based search in unstructured P2P systems. According to the features of presented search methods, roughly divided into four
categories: forwarding-base methods; cache-based methods; methods based on replication of both query and data; methods
based on topology optimization. After analyzed the merits and shortcomings of all kinds of methods, the paper pointed outthat
any kind of search methods could only optimize a certain aspect of performance. If integrated several kinds of search algorithms
smoothly, the optimization performance will be better. At last, gave some importantconclusions.
Key words: unstructured peer-to-peer; topology mismatch; overlay; search efficiency
近年来, 对等网络( P2P) 日益成为一 个热门的话 题。 通过
将分布在 Internet边缘的众多节 点联系 起来, 集合它 们的计 算
能力以及存储空间等资源, 对等网络能以极低的代价形成巨大
的服务能力。在这种对等网 络中, 所有 节点处 于对等 地位, 每
个节点都可以既是服务提供 者, 同时也 可以是 服务请 求者, 而
整个对等网络的服务能力则由 网络中 的节点 所提供 的共享 资
源来决定。根据对等网络中节点对共享资源的索引方式不同,
可以将目前的对等网络大致分 成中心 式对等 网络和 非中心 结
构式对等网络、非中心无结构式对等网络三类。无结构对等网
络对其中的节点没有任何束 缚, 且具有 查询方 式灵活、可适 应
高度动态的 Internet 环境 等优 点, 所以 如 Gnutella
[ 1]
、KaZaA
[ 2]
等类型的无结构对 等网 络成 为 了主 流 P2P 网络, 其 资源 发 现
方法也受到了研究人员的高度关注。
无结构 P2P网 络中 通常 采 用泛 洪搜 索 的资 源发 现 方法。
这种搜索方法简单、灵活, 能提供匿名性, 但是也会产生巨大的
网络负载。文献[ 3, 4] 指出 民流 行 P2P 系统 所产 生的 流量 已
经成为一股最 大的 网络 流量。文 献[ 5] 进一 步指 出在一 个 只
有 50 000 个节点、任意两节点之间 95% 的 物理跳数 不超过 7、
TTL =7 的 Gnutella系统 中, 泛洪 搜 索每 月产 生 的网 络流 量 达
到了 330 TB。泛洪搜索带来 的巨大 网络流 量严重 限制了 P2P
网络的扩展性。为了减少泛洪搜索中的冗余网络流量, 提高搜
索性能, 大量算法已经被提出来。
1 基于前向传递的方法
基于前向传递方法的基本 思想是 通过优 化或改 变传递 查
询请求消息的策略来减少网络流量。
针对泛洪 搜索 的 缺 点, 文 献[ 6] 提 出了 迭 代 泛 洪 搜 索 方
法。该方法进行多次泛洪搜 索, 每 次搜索 深度递 增, 当 查询 的
结果满足要求或者已经到 达最大 的深度 限制时 过程结 束。 在
泛洪中, 随着深度的增加, 节点个数指数增长。因此, 如果能 够
在小于 D( D为最大深度限制) 的深度内找到满意的结果, 与直
接以深度为 D 进行泛洪搜索相比, 很 多节点就 不必查 询, 节 省
了大量的资源。但是在不理想的情况下, 迭代泛洪可能要进行
到最后一次迭代。这时, 迭 代泛洪 就比直 接泛洪 更糟糕, 因 为
多 次迭代 在网 络上 发送 了大 量的 resend 消息, 占 用了 网络 带
宽, 也给节点增加了处理负担。文献[ 7] 提出 了广度 优先的 搜
索策略。该方法 以源 节 点为 根, 建立 网 络图 的广 度 优先 生 成
树, 源节点根据广度优先 生成树 将查询 消息发 送到每 个节点。
这样可以保证每个节点都收到查询消息, 而且每个节点只收到
一次查询消息, 避免了普 通泛洪 搜索中 的节点 多次遍 历问题。
但是进行广度优先搜索需要知 道关于 所有节 点的网 络拓扑 结
构。在 P2P网络中, 虽然 可 以通 过 节点 之间 相 互交 换信 息 来
获得所有节点的网络拓扑, 但是这 需要大 量的信 息交换, 会 给
网络带来很大的负载。而且, 由于 P2P 网 络的动 态特性, 节 点
频繁地加入或退出, 这样获 得的网 络结构 图是不 准确的, 生 成
的广度优先生成树也 是不 可靠 的。随机 行走 ( RW) 算法
[ 8]
则
是一种深度优先的搜索算 法。 它在泛 洪的过 程中随 机选取 一
个邻居节点转发信息, 而不是像普通泛洪算法那样向所有的邻
居节点转发信息。很显然, RW 算法 的通信负荷 减少了一个 数
量级, 但是 RW 的搜索效率 很低, 用户 可能需 要为一 条查询 而
第 25 卷第 11 期
2008 年 11 月
计 算 机 应 用 研 究
Application Research of Computers
Vol.25 No. 11
Nov. 2008