语义图驱动的深度主题建模提升性能
需积分: 5 190 浏览量
更新于2024-08-26
1
收藏 128KB PDF 举报
本文探讨了"语义图的概率主题建模"(Probabilistic Topic Modelling with Semantic Graphs),一种创新的研究论文发表于2016年1月的会议。该工作由五位作者,包括Joemon M. Jose、Long Chen、Haitao Yu、Fajie Yuan 和 Huaizhi Zhang 从University of Glasgow的School of Computing Science共同完成。他们提出了一种名为TMSG(带有语义图的主题模型)的方法,旨在将传统的主题模型与DBpedia这样的知识库紧密结合。
在TMSG中,核心思想是通过文档实体链接技术,如DBpedia Spotlight,从文本中识别并消除歧义实体。这样做可以捕捉到文档中的实体及其在文档集中的本地和全局上下文知识。这些实体被转化为语义图的形式,图中的节点代表实体,边则反映它们之间的关系。利用这种语义图,TMSG能够有效地传播和整合实体之间的关联性,进而影响主题的文档分布。
相比于现有的技术,如作者-主题模型(ATM)和带偏向传播的主题模型(TMBP),TMSG展现出显著的优势。实验结果在两个实际数据集上验证了这一方法的有效性,显示出TMSG在主题建模任务中的高效性和准确性。研究还提供了一个在线平台(<https://www.researchgate.net/publication/308503236>),用户可以查看讨论、统计和作者的简介,以便进一步了解和评价这项工作。
这篇论文的创新之处在于将概率主题模型与语义知识图谱相结合,不仅提升了主题建模的精度,还展示了如何利用外部知识资源来增强文本分析的深度。通过这种方法,TMSG在处理大规模文本数据时,能够更好地理解和解析复杂的信息结构,为未来的文本挖掘和自然语言处理应用开辟了新的可能性。
2013-07-26 上传
112 浏览量
2021-02-25 上传
2021-02-23 上传
2021-04-01 上传
2021-02-25 上传
2021-02-25 上传
2021-04-10 上传
点击了解资源详情
weixin_38697274
- 粉丝: 17
- 资源: 904
最新资源
- Java集合ArrayList实现字符串管理及效果展示
- 实现2D3D相机拾取射线的关键技术
- LiveLy-公寓管理门户:创新体验与技术实现
- 易语言打造的快捷禁止程序运行小工具
- Microgateway核心:实现配置和插件的主端口转发
- 掌握Java基本操作:增删查改入门代码详解
- Apache Tomcat 7.0.109 Windows版下载指南
- Qt实现文件系统浏览器界面设计与功能开发
- ReactJS新手实验:搭建与运行教程
- 探索生成艺术:几个月创意Processing实验
- Django框架下Cisco IOx平台实战开发案例源码解析
- 在Linux环境下配置Java版VTK开发环境
- 29街网上城市公司网站系统v1.0:企业建站全面解决方案
- WordPress CMB2插件的Suggest字段类型使用教程
- TCP协议实现的Java桌面聊天客户端应用
- ANR-WatchDog: 检测Android应用无响应并报告异常