基本思想将技术主题映射到二维空间多颜色的地形图。将该方法嵌入到文本挖
掘与可视化软件 中供用户使用。
;技术主题图可视化过程
现有文献涉及技术主题图可视化方法的研究以布局算法为主如自组织映射、
多维标度、力导模型、!()* 等很少涉及技术主题词的选择与可视化图形渲染
技术的介绍。用户使用技术主题图可视化相关软件工具时大多将其看待为技术
黑盒只关注结果忽略其原理。本文介绍技术主题图可视化整体技术实现方案重
点描述技术主题图可视化渲染方法。其基本过程如下。
() 主题词识别
对 文献 数 据 集 进行 分词 处 理 构 建语 法 规则 词 典 采用 术 语识 别算 法 1!
建立候选主题词集合计算文献与主题词之间的隶属关系矩阵假设
个文档 个主题词之间的隶属关系矩阵如式()所示。
() 主题词关系强度计算
基于文献与主题词之间的隶属关系矩阵计算主题词之间的关系强度矩阵计
算方法可以采用同现数量、倒排文档频率 .!、信息熵、互信息等。 个
主题词之间的关系强度矩阵如式()所示。
<$-<$-
<$-<$- 9999 999
9 9999
9 9 9 9
=>
<$-<$-
<$-<$-<$-<$-