国内图书馆大数据研究的知识图谱分析
摘要:文章以2012?KI数据库中收录的主题为大数据的相关文献为研究对象,借助信息可视化软件CiteSpace和VOSviewer软件绘制出科学知识图谱,通过对作者及其机??合著网络视图的解读,分析了该领域的代表作者、研究力量分布的相互关系,又通过对知识图谱的研读,探析了该领域的研究热点及研究主题。
中图分类号:G250文献标识码:A文章编号:1003-1588(2017)05-0124-03
关键词:大数据;知识图谱;可视化分析;CiteSpace;VOSviewer
“大数据”不仅是海量的、类型多样的结构化数据(如图片、声音、视频、地理位置信息等)、非结构化数据、半结构化数据的集合,它更是一种技术和理念,宗旨就是从海量、多样性的数据资源中,进行深层次的挖掘,快速获得有价值的信息,以创造巨大的经济、社会及科研价值[1]。
1 数据来源和研究方法
近年来,大数据的研究与应用已经引起IT界、政府及科研部门等相关行业的广泛关注,国内图书馆界也掀起了大数据的研究热潮,涌现出一大批相关研究成果和文献。KI)为数据源,以主题为检索项,以大数据(BigData)为检索词,不限刊发时间,检索专辑名称为图书情报与数字图书馆,共检索出原始文献2,069篇(检索日期2016年9月10日),通过手工筛选,剔除89篇非学术性论文及关联性不大的文章,共搜集到从2012?D2016年刊发的有效文献1,980篇。因此,笔者选取了2012?D2016年这5年间的文献数据做大数据领域的知识图谱进行分析。由于VOSviewer在聚类技术、图谱绘制等方面有独特优势,因此,笔者综合运用了CiteSpace和VOSviewer来绘制相应的科学知识图谱,综合运用二者的优势,对近几年国内图书馆大数据研究领域的作者、机构、热点主题及前沿领域进行探究,准确地挖掘该研究主题的本质。
2 数据分析
文献发表时间分布
2007?D2016年,国内图书馆大数据研究文献总发文量为1,986篇,其中2007?D2011年的发文量较少,仅有6篇。2007年,随着云计算、物联网、机构仓储、语义网络等相关领域的快速发展,大规模数据的挖掘、整合、存储成为学术界研究的热点,为后来大数据主题的相关研究孕育了基础。笔者通过分析文献发现,国内图书馆关于大数据的确切概念研究的第一篇文献发表于2012年,同时,2012年随着大数据的技术优势及价值被广泛认知,大数据迅速成为各学科领域研究的重点和热点。此后,国内图书馆对大数据的研究日益活跃起来,自2013年以后,大数据进入快速发展阶段,相关研究文献量呈现急剧增长的态势,这充分表明了大数据已经成为国内图书馆研究的又一热点。
文献代表作者及其机构综合分析
综合考虑发文量和突现值的代表作者。在CiteSpace界面中,时间设置为2012?D2016年,分段时间为1年,节点类型为作者,采用CiteSpace提供的突现词检测(Burst Detection)算法,得到发表论文数≥6篇以及突现值排名前10的作者(见表1、图1),并初步确定这些作者为图书馆大数据研究领域的核心作者。
从图1可以看出,组成的3人以上的小团体比较多,但子网间的联系较少,彼此之间的合作关系不是很紧密。在3人
国内图书馆大数据研究的知识图谱分析 来自淘豆网m.daumloan.com转载请标明出处.