知识图谱获取方法与资源探索

需积分: 16 27 下载量 196 浏览量 更新于2024-07-16 收藏 2.18MB PDF 举报
"《知识图谱实战开发案例完全剖析-第5部分》由张子良主讲,主要探讨了知识图谱的获取方法和国内外的知识图谱资源。" 本文主要围绕知识图谱的获取方法展开,包括众包、标准共建以及机器学习三种策略,并简要介绍了国内外的一些重要知识图谱资源。 1. **众包法**: 众包是一种利用互联网社区的力量来收集和组织信息的方法。Freebase是众包模式的一个典型例子,它允许用户创建、修改和查询知识,存储结构化的、机器可读的数据。虽然Freebase已被Google收购并转化为WikiData,但其众包模式对知识图谱的发展产生了深远影响。众包知识获取涉及创建、编辑、维护和下载等环节,用户在这一过程中扮演了积极参与的角色。 2. **标准共建法**: 标准共建法强调通过制定统一的规则,让网站开发者在网页中对实体、属性和关系进行标注。如Google支持的schema.org,这种做法便于搜索引擎爬虫抓取和理解网页中的结构化信息,从而丰富知识图谱的内容。通过这种方式,搜索引擎可以更好地理解和展示搜索结果,提高用户体验。 3. **机器学习法**: 机器学习在知识获取中扮演了重要角色,尤其是Google的KnowledgeVault项目,它利用机器学习技术将大量数据转化为可理解的知识。这种方法预示着未来知识图谱的发展趋势,即通过自动化手段不断挖掘和更新知识。 4. **国内外知识图谱资源**: - 国际层面,Google的知识图谱是广泛使用的资源,它提供了一个庞大的实体网络,连接了互联网上的大量信息。此外,UMLS(统一医学语言系统)是由美国国立医学图书馆创建的,它整合了多种医学术语系统,为跨领域的医学知识提供了统一的语言框架,广泛应用于医疗信息系统的构建和信息检索。 知识图谱的获取是构建和更新知识图谱的关键步骤,通过上述方法,我们可以不断丰富和优化知识图谱,使其在各个领域,如搜索引擎优化、智能问答、推荐系统等方面发挥重要作用。理解并掌握这些获取方法对于知识图谱的实战开发至关重要。