自动化构建大规模中文知识图谱系统

5星 · 超过95%的资源 需积分: 50 66 下载量 168 浏览量 更新于2024-09-09 3 收藏 2.18MB PDF 举报
"自动化构建的中文知识图谱系统是一篇探讨如何高效自动化构建中文知识图谱的学术论文,由鄂世嘉、林培裕和向阳发表于2016年的《计算机应用》期刊。该研究旨在解决当前中文知识图谱构建过程中存在的准确率低、耗时长以及依赖大量人力的问题。" 这篇论文提出了一种端到端的解决方案,该方案基于中文百科数据,可以自动化地构建完整的中文知识图谱,并开发了用户友好的知识图谱系统。首先,利用自定义的网络爬虫抓取百科数据的词条属性和相关文本信息,存储为带扩展属性的三元组形式。然后,后端系统利用图数据库如Cayley和MongoDB数据库系统,将这些三元组数据导入并转换为大规模的知识图谱。 在这一自动化构建过程中,前端用户可以享受到丰富的知识图谱应用服务。论文通过与其他知名知识图谱系统(如YAGO、HowNet和中文概念词典)的对比,显示了所提方案在构建时间上的显著减少,并且在实体和关系数量上至少有50%的规模优势。 关键词涵盖了知识图谱、网络爬虫、三元组文件、知识库和图数据库等领域,表明该研究集中于技术实现和效率提升,对于中文知识图谱的自动构建具有重要的理论和实践价值。中图分类号将其归类为TP311.5,文献标志码A表示这是一项原创性的科学研究。 这篇论文深入探讨了自动化构建中文知识图谱的技术细节,包括数据获取、存储和处理等方面,为构建大规模、高准确度的中文知识图谱提供了一个有效的方法。同时,它也为后续的研究和开发工作提供了参考,有助于推动中文知识图谱领域的发展。