收稿日期: 2005-07-22; 修返日期: 2005-11-16
基金项目: 国家 自 然 科 学 基 金 资 助 项 目 ( 60373108) ; 国 家
“863”计划资助 项 目 ( 2005AA4Z3050-1) ; 国家 教 育 部博 士 点
基金资助项目( 2069901)
P2 P 数 据 管 理 研 究 趋 势
*
余 敏, 李战怀, 张龙波
( 西北 工业 大学 计算 机学 院, 陕 西 西安 710072)
摘 要: Peer-to-Peer 模 型是 一种 新型 的体 系结 构模型 , 许多 优 势有 待 于 进一 步 发 掘 , 拥 有广 阔 的 应 用 前 景。 首
先指 出基 于模 式的 高可 扩展 的 P2P 系统 可以 满足 P2P研 究领 域中 对语 义支 持的 需求 以及对 高可 扩展 性的 需求 ,
是 P2P数 据管 理的 发展 趋势 ; 通 过综 述基 于模 式 P2P 系 统和 高可 扩展 性 P2P 系统 的 研 究现 状, 指 出 现 有 P2P 数
据管 理研 究项 目分 别从 P2P网 络的 语义 重叠 网络 和重 叠网络 两个 方面 改善 P2P 网络 的性能 和服 务质 量, 两者 之
间缺 乏衔 接, 各自 的研 究成 果无 法 直 接 结 合 产 生 基 于 模 式 的 高 可 扩 展 的 P2P 系 统 ; 给 出 基 于 模 式 的 高 可 扩 展
P2P 系统 的研究 目标 , 分析该 方面 的初 步研 究成 果; 最后 指出 未来 需要 进一 步研 究的问 题。
关键 词: Peer-to-Peer; 基 于模 式; 高 可扩 展
中图 法分 类号 : TP311. 13 文 献标 识码 : A 文 章编 号: 1001-3695( 2006) 08-0004-04
Trend of P2P Data Management
YU Min, LI Zhan-huai, ZHANG Long-bo
( School of Computer Science, Northwestern Polytechnical University, Xi’an Shanxi 710072, China)
Abstract: Peer-to-Peer is a new model of architecture, which hasalot of advantagesto be further discovered and has acheer-
ful application future. Firstly, the paper points out that the schema-based highly scalable P2P systemcan satisfy the needs for
both semantic supportand high scalability in P2Presearch area, and so itis the trend of P2Pdatamanagement. Then, through
the survey on the currentschema-based P2Psystems and the highly scalable P2Psystems, the paper points outthat the current
P2P data management research projects improve the efficiency and quality of service of the existing P2P network from two
facets: the semantic overlay and the overlay, and the lack of connection between them makes it too difficult to generate the
schema-based highly scalable P2P system fromthem. After that, the goals of the schema-based highly scalable P2P system are
given, and the initial resultof this research areaisanalyzed. Finally the issueswhichneed to be further studied are pointed out.
Key words: Peer-to-Peer; Schema-based; Highly Scalable
1 引言
随着计算机技术的发展, 在当今软硬件技术环境下, 客户 /
服务器模型已不能满足需求, 其单点故障和热点问题已经变得
越来越不可接 受。Peer-to-Peer 模型 ( 又称 P2P 模型 或对 等 计
算模型) 是一种新型的体系结构 模型, 具有许 多优势 有待进 一
步发掘
[ 1]
: ①P2P 系 统的 每个 成 员均 可 贡献 数 据 和计 算 资 源
( 如未用的 CPU周期和 存储资 源) , 新 成员的 加入可 能引入 系
统中原来缺乏的特殊数据或 资源, 因此 随着系 统成员 增加, 系
统的丰富性、多样性等各 种有 益的 特性 得以 扩大; ② P2P 系 统
具有 分散性, 因此系统的 健壮性、可用性和性 能可能随着 Peer
数量 的增加 而扩展; ③ 通过在 许多 Peer 间路 由请求 和复制 内
容, 系统可以隐藏数据提 供者和 消费者 的身份, 使个 人的隐 私
得到保护
[ 1]
。因此 P2P被认为是未来重构分 布式体 系结构 的
关键技术
[ 2]
。P2P 在搜索引擎、数据流管理、语义 Web、协 作信
息过滤等领域具有广阔的应用前景。
目前, P2P模型已经成功地用于交换音乐文件, 出现了 Nap-
ster, Gnutella, KaZaA 等一 批成功 的文 件共 享系 统。然 而, 当 前
的 P2P 系统具有局限性: 仅支持 无语义或弱语义的、大粒度( 文
件级) 的数据共享; 用户通过文件的标识符进行查找( 通常按名
检索)
[ 1]
, 但很难准确地选择表达信息需求的文 件标识符, 因此
难以找到真正需要的文件; 并且, 许多标识符 相近、但语 义不相
干的答案被返回给用户, 浪费了大量的带宽与计算资源, 极大地
限制了 P2P潜能的发挥。显然, 这种缺乏语 义的共享既 不能很
好地满足用户的需求, 也不能有效地利用系统的资源
[ 3]
。
P2P系统的 大 多 数 问 题 都 可 归 结 为 数 据 放 置 和 检 索 问
题
[ 4]
, 但 P2P 网络本身缺乏对语义、数据转换 和数据 联系的 支
持, 而处理这类问题是数据 库研究 团体的 强项, 因此 有必要 在
P2P系统中引入数据管理技 术。Gribble 等人
[ 1]
最先 注意到 这
一点, 于 2001 年提出使用数据管理技术( 如用查询、视图、完整
性约束表达对象间联系, 用 已有对 象定义 新对象, 在 多个数 据
源上提出复杂查询 以及 物化 查询 结果 以备 将来 使 用等 ) 更 好
地解决 P2P系统 的数 据 放置 问题。 另一 方面, 由于 数据 库 系
统已经向更高度分布的方向发展, 使得高可扩展性已经成为数
据库领域和 P2P系统追求的共同 目标。基于 模式的 高可扩 展
P2P系统可以解决 P2P研究 领域中 对语义 支持的 需求 以及 数
据库领域中提高可 扩展 性的 需 求, 是 P2P 上数 据管 理的 发 展
·4· 计算机应用研究 2006 年