2008 年 12 月
第31卷 第6期
北京邮电大学学报
Journal of Beijing U niversity of P osts and T eleco m m unications
Dec .2008
Vol.31 No.6
文章编号 :1007-5321(2008 )06-0109-04
信息提供类 Web 服务与 RDF 数据源的集成
赵文峰 , 孟祥武 , 陈俊亮
(北京邮电大学 网络与交换技术国家重点实验室 , 北京 100876 )
摘要 :为了在更大范围内实现数据集成 ,提出一种基于本体的数据查询描述模型 .通过将信息提供类 web 服务描
述为访问模式受限的数据视图 ,使该模型能像普通的 resource description framework(R DF )数据源一样用来回答数
据查询 .同时给出相应的查询—数据源匹配算法 .基于 web 服务动态调用技术 ,设计了 1 个集成这 2 种数据源的
数据集成系统 ,并实现了原型对其可行性进行的验证 .
关 键 词 :数据集成 ; web 服务 ;语义 web ;资源描述框架
中图分类号 : T P393 文献标识码 : A
Integration of Infor m ation-Providing W eb
Services and R D F D ata Sources
Z H A O W en-feng , M E N G X ian g- w u , C H E N Jun-lia n g
(State K ey L a boratory of N etw orking and S witching Technology , Beijing U niversity of Posts a nd T eleco m m u nications , Beijin g 100876 , China )
A bstract : Ai m ed at data integratio n in a larger extent ,an o ntology-based descriptio n m odel of data
q u er y is p ut for w ar d . B y d e pictin g infor m ation-providing w eb services as data vie w s with li m ited access
pattern ,the m odel enables the m to ans w er data queries as ordinary resource description framework
(R D F ) data so urces do . T he m atching alg orith m of corresp on din g q uery-data so urces is presented .
B ased on the d yna m ic invocation tech n olog y of w eb services ,a data integratio n sy ste m is d esig n e d
w hich co m bines such t w o kinds of data sources . A n d a prototy pe is i m ple m ented successfully thro ug h
w hich the feasibility is validated .
K ey w ords : data integration ; w eb services ; se m antic w eb ;
resource descriptio n fra m e w ork
收稿日期 :2007-11-25
基金项目 :国 家自然科学基金项目(60432010 ); 国家科技支撑计划项目(2006BA H02A11 );国 家“973 计划”项目(2007CB307103)
作者简介 :赵 文峰(1980— ),男 ,博士生 , E-mail:zhaowenfeng @ g m ail.com ; 陈俊亮(1933— ), 男 , 中国科学院院士 , 中国 工程院院士 .
近年来 ,互联网上的数据量急剧增加 ,大量的彼
此间密切关联的数据分布于不同的位置 . 因此 ,迫
切需要一种数据集成系统使用户只输入 1 次查询即
可得到来自多个数据源的查询结果 .
在数据提供形式上 ,随着语义 web 研究的兴
起,为了使数据能更便于理解、交换 ,用 R D FS/O W L
( W 3C 制定的 2 种本体语言 )本体进行建模 ,用 RDF
三元组形式存储并提供 SPARQL( W3C 制定的
R D F 查询标准 )查询接口的数据源在互联网上频频
出现 .而商品报价、天气预报、传感器数据等因具有
简单且动态变化的特点 ,更适合于通过 web 服务的
形式来访问 .
传统数据库领域的研究
[1-2 ]
建立了数据集成系
统的理论框架 ,但未考虑语义 web 数据的特点 .文
献 [3-4 ]讨论了基于语义 web 的数据集成 ,也未考虑
与 web 服务数据源的集成问题 .而对 web 服务的语
义化的研究
[5 -7 ]
又侧重于通用 web 服务的自动发现
和自动组合 ,却很少把 web 服务作为 1
个数据源与