小米知识图谱构建与应用实践与挑战

需积分: 50 26 下载量 20 浏览量 更新于2024-07-15 2 收藏 2.95MB PDF 举报
《CNCC2019-王斌-小米知识图谱的构建与应用》是一篇由小米AI实验室的王斌在2019年10月17日分享的报告,详细探讨了小米公司在构建和应用知识图谱方面的经验和挑战。小米作为一家多元化的产品和服务提供商,其复杂的产品线和业务场景为知识图谱的应用提供了广阔的舞台,同时也带来了构建和整合大量信息的挑战。 报告首先介绍了小米知识图谱的构建过程,包括实体发现、知识抽取、知识补全、知识更新和知识融合等关键步骤。构建过程采用自下而上的方式,从多个百科数据源出发,但面临的问题包括缺乏完整一致的本体知识以及大规模百科图谱对齐的难题。为解决这些问题,作者提到了cnSchema作为基础,通过半自动的方式进行概念和上下位关系的抽取,并通过人工干预提高结果质量。此外,报告还探讨了两种对齐方法:基于EM算法的半监督学习和LinkageFactorGraphMode在跨语言链接中的应用。 在垂直领域知识图谱的构建方面,报告强调了本体定义的重要性,即从顶层定义知识框架,然后进行实体发现、实体对齐、知识择优、更新和抽取。这种方法确保了垂直领域的专业知识得以准确地整合进图谱中。 知识图谱在小米的广泛应用中起到了关键作用,例如提升了小爱同学的问答准确率,支持了小米商城、小米有品等产品的全局搜索,以及智能客服的服务。图谱的规模也相当庞大,截至2019年第三季度,SPO数量已超过百亿,且高质量的关系数量呈现季度翻倍的增长趋势。 小米图谱的特点包括其以百科图谱为核心,连接各个垂直领域的图谱,形成一个庞大的知识网络。这不仅增强了机器的认知能力,还在推理、理解和解释问题上展现出优于深度学习的优势。通过构建和应用知识图谱,小米不仅提高了内部运营效率,也优化了用户体验。 这篇报告深入剖析了小米知识图谱的构建策略、面临的挑战以及实际应用效果,为其他企业在构建和运用知识图谱时提供了有价值的经验参考。