现在在跟导师在做和文本挖掘及可视化相关的项目,因为一个偶然的机会(随缘)接触到了CiteSpace这款软件。我们主要研究的文本内容是科技文献,所以这款软件特别合适。
CiteSpace是陈超美教授使用Java语言开发的一款信息可视化软件。它着眼于分析科学分析中蕴含的潜在知识,并在科学计量学,数据和信息可视化中有着重要的用途。
我在学习这款软件的时候,选用的是李杰老师的《CiteSpace:科技文本挖掘及可视化》一书。该书图文并茂,对各种操作给出了具体的方法,对于软件常见的问题也给出了细致的解答。
1.CiteSpace可以处理的数据库:Web of Science, Scopus, ADS, arXiv, CNKI, CSSCI, Derwent, NSF
在CNKI中采集中文数据需要注意,把导出数据的格式设置为Refworks(或Endnote)。
导出的txt文件应该统一命名为“download_***”,以便于软件进行识别。
2.创建一个新项目的推荐方法:在你的项目文件夹下面新建“data”和“project”两个文件夹。在CiteSpace新建项目目录中把数据路径设置为“data”的路径,将项目路径设置为“project”的路径。你也可以按照你的喜好去设置,这样设置只不过是为了自己查看的方便。若要分析的是中文数据,注意勾选“Preferences→Chineses Encoding for CNKI or CSSCI”。
3.刚下载的文献数据是不能够立即进行分析的,需要使用CiteSpace中的数据转换功能。以从CNKI上下载的文献数据为例,新建“input”和“output”文件夹,把数据放入“input”文件夹中,利用软件中“Data→Import/Export”功能,点击CNKI选项,把输入路径设为“input”的路径,把输出路径设为“output”的路径。然后点击“Format Conversion”即可转换。
我们注意到转换完之后的文件夹中把原本的一个文件,转换成了多个。
4.研究目的与节点类型的设置:
目的:研究前沿+知识基础;节点类型:Cited Reference
目的:研究热点+研究趋势+知识结构;节点类型:Keyword/Term
目的:科学领域结构;节点类型:Category(或其他需要的)