秦陇纪
2010
数据简化
DataSimp
数据科学资料库
请关注“数据简化 DataSimp、科学 Sciences”微信公众号!15 时 11 分 46 秒 2017 年 3 月 8 日星期三
图 3.RDF 图和 SPARQL 查询图
2、知识图谱目前的应用
本章简单介绍一下知识图谱在工业界,尤其是在互联网领域中的相关应用。其实知识图谱技术在其他领域,包
括工业设计和产品管理、知识出版、健康医疗和情报分析等领域,目前都出现了不少的应用,由于篇幅有限,这里
主要介绍互联网领域的相关公司的产品。
如前所述,知识图谱的活跃得益于 Google 的 Knowledge Graph 项目。Google 通过构建知识图谱,将内部信息
资源都唯一的关联起来。例如“姚明”是知识图谱中的一个实体,包含相关的一些属性例如出生时间、地点、身高。
同时,可以将搜索引擎中所爬取的和“姚明”相关的文档和图片都与这个实体关联起来。Google 的知识图谱项目中
最早的应用方式就是在搜索引擎返回结果里面提供“知识卡片”。传统的搜索引擎返回界面中,通常是查询词所匹
配的文档列表,如图 4 左面所示。然而在 2012 年 5 月 16 日以后的 Google 的搜索引擎返回结果中,如果查询词匹配
了 Google 的知识图谱中的某个实体,Google 还会以知识卡片的形式返回这个实体的一些属性和其他实体的关系。
例如当我们搜索“姚明”时,Google 会返回如图 4 右边所示的知识卡片,包括姚明的出生时间、地点、身高,以及
他的妻子叶丽;甚至包括相关联的姚明的图片。
图 4.Google 搜索结果中的知识卡片
下面介绍 Google 另外一个利用知识图谱的项目叫“Google Rich Snippets”(Google 富摘要)。搜索引擎在搜
索结果的页面中会为每一篇搜索结果提供一个目标网页的摘要,以便用户判断是否是自己想搜索的页面。通常网页
的摘要是采用“抽取式”方式生成的,即从网页的页面文本中找到和搜索关键词相关的并且比较重要的句子来构成
页面的摘要返回给用户。但是 Google 的富摘要产品中,会抽取在用户 HTML 页面中以结构化形式存在的知识图谱数
据,例如描述实体的属性的数据。目前这方面的标准有包括 RDFa, Microdata 和 Schema.org 等结构化数据标签。假
设用户想在搜索“Thinkpad T450”产品,在 Google 返回的 Walmart(沃尔玛)线上商店的页面摘要(如图 7 所示)
中,摘要中包含了这个产品的打分(Rating 3 星),评论数目(Vote 1 份评论)和商品的价格(616.67 美金)。