YAGO：基于维基百科和WordNet的大型知识图谱

需积分: 9 117 浏览量更新于2024-07-18 收藏 746KB PDF 举报

"YAGO: A Large Ontology from Wikipedia and WordNet" 是一篇发表在《Web Semantics: Science, Services and Agents on the World Wide Web》期刊上的文章，该研究由 Fabian M. Suchanek、Gjergji Kasneci 和 Gerhard Weikum 三位专家于 2008 年共同完成。该文章的重点在于介绍 YAGO，一个由维基百科（Wikipedia）和WordNet数据构建的大型本体库。本体论（Ontologies）是知识表示的一种形式，YAGO 的目标是提供高覆盖率和精确度的信息抽取。 YAGO 的核心在于其自动化创建过程，它从维基百科的类别系统（category system）和实体条目（infoboxes）中提取知识，并结合WordNet中的分类关系（taxonomic relations）。这个过程涉及到信息抽取技术的应用，旨在从非结构化的网络文本中自动构建结构化的知识图谱。截至当时，YAGO 已经包含了超过170万个实体和1500万条事实，这些数据不仅包括了实体之间的层级关系（如Is-A层次），还涵盖了实体之间的语义关联。具体来说，YAGO 的内容包括： 1. 实体和关系：YAGO 提供了一个丰富的实体集合，每个实体都有相应的描述和属性，同时定义了实体间的关系，如人物的职业、组织的成员关系等。 2. 事实和准确性：1500万条事实反映了维基百科和WordNet中获取的信息，经过了精心筛选和验证，以确保数据的准确性和一致性。 3. 类型检查技术：文章提到了使用类型检查技术来增强本体的完整性，确保在整合数据时遵循语义规则，避免错误的融合。 4. 来源可靠性：维基百科作为开放源，广泛依赖用户贡献，而WordNet则是权威的英语词汇数据库，这为YAGO提供了坚实的基础。 5. 应用场景：YAGO 可以为各种应用提供支持，如搜索引擎优化、问答系统、智能推荐以及自然语言处理等领域，通过提供结构化的知识支持决策和服务提供。 YAGO 是一个重要的知识资源，它的创建展示了如何利用大规模网络数据和现有知识库构建本体，对于推动知识图谱的发展和实际应用具有重要意义。随着大数据和人工智能的不断发展，这类基于自动化的本体生成方法将变得越来越重要。

github_39012302

粉丝: 2
资源: 4

YAGO：基于维基百科和WordNet的大型知识图谱

yago-android

yago:解析和搜索 YAGO 数据

Dataset.zip

YAGO数据库参考文献

比较出名的特定领域的知识图谱

列举一些关于知识图谱的典型例子

推荐30个以上比较好的构建知识图谱github源码

YAGO39K数据集介绍

比较出名的领域知识图谱

在TransC算法中，YAGO39K数据集

最新资源