清华大学朱小燕:知识图谱驱动的信息获取与挑战

5星 · 超过95%的资源 需积分: 19 27 下载量 111 浏览量 更新于2024-07-19 收藏 1.83MB PDF 举报
信息获取与知识图谱是当今信息技术领域的前沿研究,尤其在中国,随着中文知识图谱的构建成为推动中文信息处理和检索能力提升的关键因素。清华大学计算机系的朱小燕教授(zxy-dcs@tsinghua.edu.cn, @朱小燕THU)在2013年10月12日的研讨会上,探讨了这一主题的重要性。 会议内容分为几个关键部分: 1. **信息与知识**:讲座首先讨论了互联网的主要用途,包括获取新闻、链接、搜索引擎服务等。信息服务的目标不仅仅是提供链接,而是通过构建知识图谱来生成答案,例如新闻、微博、图片、视频和百科等内容的整合。著名的例子如百度的Baidu Box和Google的知识图谱展示了知识在网络服务中的实际应用。 2. **知识的定义**:知识被定义为实体、规则以及语义网络、框架等形式的组合。抽象信息和编码信息之间的差异强调了知识图谱的必要性,因为它们能够帮助机器理解并直接交流,而传统方法在这方面存在局限。 3. **知识的作用**:知识图谱的作用在于支持信息的计算、理解和评价,它是实现信息可衡量和知识可计算目标的重要手段。 4. **挑战与目标**: - 科学视角下,目标是使信息可量化并能通过算法进行处理,而知识则需要被结构化以便于计算机理解和使用。 - 从应用角度来看,知识图谱的构建涉及从原始材料出发,不断扩展和更新数据,融合不同数据库,并确保知识的准确性和可靠性。 5. **知识图谱构建与应用**: - 构建知识库的方法包括从原始数据源提取信息,整合并持续更新,以及合并不同的数据源。 - 应用知识图谱时,其目的是为了生成答案、辅助决策和提升信息服务的质量,如通过搜索结果的相关性和准确性来提供更智能的答案。 朱小燕教授的研讨会深入剖析了信息获取与知识图谱的理论基础、实践挑战与解决方案,对于推动我国中文知识图谱的发展和相关技术的进步起到了重要的指导作用。这不仅对学术界提出了新的研究课题,也为企业和行业提供了实用的技术参考。