CSSCI 数据导入 Bibexcel 实现共现矩阵的方法及实证研究
姜春林 陈玉光
(大连理工大学 21 世纪发展研究中心 辽宁 大连 116024)
摘 要:本文以针对 Web of Knowledge 开发的文献信息共现分析的应用软件——Bibexcel 为研究对象,结
合 CSSCI 数据库数据格式特点,解决了 Bibexcel 不能处理中文文献的瓶颈问题,实现了知识单元共现关系
矩阵。并以 CSSCI 数据库中 1998—2008 年“信息可视化”引文数据为例,数据经过预处理后,由 Bibexcel
构建其知识单元共现矩阵,利用 Ucinet、Netdraw 软件,实现了作者共现、关键词共现、引文共现的可视
化分析。本研究扩展了 Bibexcel 的应用范围功能,为 CSSCI 数据的可视化研究提供了一种新的手段。
关键词: Bibexcel、CSSCI、共现矩阵、知识图谱、可视化
Transform CSSCI Data to Bibexcel data to Actualize Co-occurrence Matrix and A Case Study
JIANG Chun-lin, CHEN Yu-guang
(Center of the 21st Century Development and Research, Dalian University of Technology, Dalian 116024)
Abstract:This paper researchs on Bibexcel that developed for the co-occurrence analysis of literature information
that come from Web of Knowledge, and combined with the characteristics of data formats in the CSSCI database,
to resolve the bottleneck of co-occurrence of Chinese literature information which Bibexcel can not handle by
itself. We actualized the co-occurrence matrix of knowledge unit relations. CSSCI database in 1998-2008
"Information Visualization" Citation data as an example, after data preprocessing, the knowledge unit co-
occurrence matrix built by Bibexcel , then we use Ucinet, Netdraw softwares , to actualizes the authors
cooperative network analysis 、 keywords cooccurrence analysis and cocitation analysis. This study extends the
scope of application of Bibexcel, and provides a new means of visualization for CSSCI data.
Keywords:Bibexcel、CSSCI、Co-occurrence matrix、Knowledge map、visualization
1. 引 言
科技文献数据量的快速增长给我们的研究工作带来了极大便利,同时,文献数量的增
长,也给文献的管理与分析利用带来了诸多的不便
[
1] 。如何快速、准确地得到所需要的资
源,并理解这些大量文献所表达的内容变得越来越困难。共现分析如共作者分析、共词分
析、共引分析、共被引分析等以邻近联系法则和知识结构及映射为方法论基础,来发现研
究对象之间的亲疏关系,挖掘隐含的或潜在的有用的知识,并揭示研究所代表的学科或主
体的结构变化。基于共现分析的信息可视化技术能形象化地表达文献信息蕴含的内容,方
便科研人员和情报人员挖掘文献集中所隐含的知识。
国外关于文献信息共现关系分析的应用软件已经比较成熟,如美国费城的德雷塞尔大
学信息科学与技术学院的陈超美开发的基于 JAVA 平台的 Citespace
[2][
3] 系列应用软件;印
第安纳州大学开发的大型网络分析、建模、和可视化的工具包 Network Workbench Tool;
大型社会网络分析软件 Pajek;瑞典科学家佩尔松(persson)开发的科学计量学研究软件
Bibexcel
[
4] ;美国斯坦福大学开发的社会科学统计软件包 SPSS 等等。其中这些软件有一
个共性,即主要是针对 Web of Science 数据进行开发的。而对于从中文社会科学引文索引
(CSSCI)数据库下载的中文文献数据,它们还不能直接进行处理。由于这些软件无法对
CSSCI 文献数据中的知识单元进行共现计算,从而也就很难对其进一步的知识可视化分析。
相对于处理英文文献信息共现分析软件的开发,处理中文数据库数据的软件相对匮乏,
其中有不少学者做了一些研究,并开发出了一些通用软件。其中周春雷、王伟军等人用
Delphi 6 编制了处理中国期刊网题录数据的软件,该软件功能主要是将数据导入 Excel,仅
评论0