小米知识图谱:探索文本与知识融合的表示学习实践

版权申诉
0 下载量 125 浏览量 更新于2024-07-05 收藏 3.33MB PDF 举报
"《1-6小米在知识表示学习方向的探索与实践》是一篇在2021年DataFunSummit在线峰会上发布的论文,由小米的算法工程师吕荣荣主讲。论文主要探讨了小米公司在知识表示学习领域的探索和实践,特别是在处理知识图谱技术上的创新与应用。 首先,论文介绍了小米知识图谱的发展历程,从2017年开始,团队逐步建立和完善,通过开放知识积累、百科类图谱构建以及行业图谱落地,服务了10多个业务场景,实现了知识量超过百亿的规模。知识图谱的核心是为小爱同学等产品提供智能支持,通过分词、词法分析、语法解析等步骤处理用户查询,包括实体查询、实体属性查询、实体识别和实体链接等,同时实现了实体属性的统一管理和相关性排序。 文章着重讨论了融合文本和知识图谱的知识表示学习方法。传统的知识图谱仅依赖于三元结构信息,数据稀疏是一个挑战。为此,小米采取了融合策略,一方面利用知识库内的实体和关系描述信息,增强对实体之间语义关系的理解;另一方面,引入互联网文本等外部信息源,通过实体的文本描述来发掘更多语义关联,解决zero-shot问题,即在缺乏特定训练样本的情况下仍能做出准确推断。 这种融合方法的优势在于,通过文本描述,可以提升实体间关系的精确性和区分度,使得知识图谱在处理复杂查询时更为有效。例如,将实体的属性-属性值或关系-实体提及组合成文本描述,强调type、义项描述和摘要等关键信息,从而实现更全面的知识表达。 小米的知识图谱研究不仅关注图谱本身的构建,还注重如何结合文本信息优化知识表示,以适应不断增长的业务需求和智能助手的复杂应用场景。未来,小米将继续探索知识表示学习的新方法,为AI技术的进一步发展贡献力量。"