中文核心期刊网络资源引文分析

时间:2022-04-09 04:56:55

中文核心期刊网络资源引文分析

1引言

上世纪九十年代至今,硬件终端技术及互联网通讯技术的快速发展和普及为信息生产与流通提供多样化载体与平台,并逐步改变大众的信息搜索、信息获取以及信息交流方networkresources;citationanalysis;openrepository式。本世纪初,布达佩斯、比塞斯达和柏林三个重要宣言及一系列行动纲要和倡议的提出,引发国际学术界对基于互联网的学术交流的讨论。美国科学家吉姆•格雷《第四范式:数据密集型科学发现》中指出,互联网能把所有科学与文献联系在一起,创建一个数据和文献均能够交互操作的世界,以提情报科学第38卷第4期2020年4月高科学的‘信息速率’,促进研究人员的科研生产力【1】。在开放获取运动的深化发展、科技革命快速进步的背景下,基于社交媒体资源的学术研究和学术信息传播活动开始兴起【2】。学术界正将其纳入学术研究和学术传播的重要信息资源和传输渠道【3】。研究表明活跃于社交媒体的研究人员,相较于其他研究人员,阅读更多的学术资料和内容【4】。一项针对美国五所大学科学和社会科学领域研究人员期刊阅读模式的调研发现,各类社交网络和媒体的发展促使研究人员采用更多样的信息搜索方式。此外,1977—2012年,研究人员的论文年阅读量不断攀升,且从2005年起增速加快【5】,一方面源于互联网和终端设备的升级及图书馆数据库订阅资源的丰富;另一方面,博客、邮件和社交媒体等应用和软件为学者获取学术资源提供便捷的途径【6】。基于互联网的学术资源和信息的阅读以及交流行为,为研究人员进行科学研究提供重要信息和文献参考。网络资源指在文本中及参考文献列表中带有统一资源定位符(URL)的网络信息【7】。正式出版物在引用该类资源时,需标明资源链接,读者可直接点击链接获取内容。本研究使用文献计量法与内容分析方法,对图书情报领域十本核心期刊2014—2018年所使用的网络资源进行调研和计量,从纵向与横向探究图书情报领域研究人员对网络资源的使用现状和趋势,以及被使用的网络资源的内容和类别,揭示研究人员对网络资源的认同规律,并提出对未来开放学术资源引用规范的展望。

2数据来源与研究方法

本研究选取图情领域的权威期刊为研究对象,通过分析期刊论文参考文献中网络资源的年度分布和总体占比情况、网络资源分类情况及引用网络资源的论文关键词分布情况,以期探究国内学界对网络资源的利用现状和开发趋势。“中文社会科学引文索引”(CSSCI)是中国三大核心期刊体系之一,遵循文献计量学的基本规律,采取定量和定性手段从全国学术性期刊中精选出学术性强、编辑审核规范的期刊作为来源期刊【8】。本研究将CSSCI(2017—2018年)收录的图情学科期刊按照复合影响因子和综合影响因子排序,选取其中的TOP10期刊作为研究对象。期刊分别为《中国图书馆学报》、《图书情报知识》、《图书情报工作》、《图书与情报》、《国家图书馆学刊》、《大学图书馆学报》、《情报理论与实践》、《情报杂志》、《图书馆论坛》、《情报资料工作》。本研究结合中国知网及十本期刊的官网进行基础数据收集和整理,采集十本期刊近五年(2014-2018年)来共计9450篇论文题录形成数据集,利用Python工具抓取所有论文的参考文献,提取其中带有网络统一资源识别符(URL)的参考文献条目逐个点击链接查看,选取其中可直接打开并可获取资源的条目作为网络资源进行分类整理,并利用Citespace对引用网络资源的论文进行关键词分析。

3研究结果与分析

3.1文献占比与期刊分布。学术期刊引文的时序变化情况是衡量该学科发展的重要指标之一【9】。针对学术期刊的网络资源引用情况进行纵向统计分析,对认知网络资源作为图情领域参考文献的地位和发展趋势具有重要意义。本研究采用全面调查法,对抓取的9450篇选文进行引文分析,筛选出在正文脚注和参考文献列表中引用一条以上(含一条在内)网络资源的期刊论文,结果如图1所示。2014—2018年间,十本样本期刊年发文总量分别为1953篇、1929篇、1889篇、1867篇和1812篇,论文总数呈现下降趋势,这一现象符合学术领域精简期刊体量,提高论文质量的发展态势。样本期刊中在正文脚注和参考文献列表中引用一条以上(含引用一条在内)网络资源的论文数从976篇逐步上升到1196篇,占刊载论文总量的比例从49.97%稳步增长至66%,在2016—2017年,增长量达到10.05%。图12014-2018年引用网络资源论文占比趋势图针对引用网络资源的5291篇论文进行引文分析,统计其网络资源引用量和参考文献引用总量得出图2结果。由图2可知,2014-2018年期间,学术期刊的网络资源引用量呈波动上升态势,占年参考文献总量的比重维持在20%以上,网络资源在学术论文参考文献中占据一席之地。网络资源逐步赢得学术期刊作者的认可,成为学术论文参考文献的重要来源。本研究对十本期刊样本分别进行网络资源引文统计分析,探究各样本之间使引用网络资源的差异,统计结果如表1所示。从期刊分布角度看,十本期刊引用网络资源的论文比例均超过刊载论文总量的40%,其中八本期刊超过50%,表明图书情报领域学术期刊在一定程度上认可网络资源的可信性和权威性;虽然每本期刊中引用网络资源的论文占比均保持在较高水平,但各个期刊平均每篇论文使用网络资源的数量却存在着一定差异,十本期刊中仅《图书与情报》平均每篇论文使用网络资源超过十条,八本期刊超过五条,而《情报资料工作》虽然引用网络资源的论文占比较高,但平均每篇论文使用的网络资源数量仅为2.61条;十本期刊中共有三本期刊平均每篇论文网络资源占参考文献比例超过30%,七本超过20%,《情报理论与实践》为十本期刊中最低值,仅为14.96%。3.2网络资源的类别分布。为进一步了解被引用的网络资源类型,本研究将收集的网址整理分类,并依次点击查看网站,依据域名、网页内容以及网站功能将网络资源划分为如下(表2)八种类型,并统计每种类型的具体数量及占比情况。网络资源来源渠道多元,从用户和网站资源属性来看,可分为学术型网络资源网站与大众型网络资源网站。学术型网络资源网站包括学术型社区、学术搜索引擎、专业性学科网站、开放仓储和学术博客与论坛,网站资源以学术信息及科研人员信息为主,其用户以高校和研究机构的学生、老师和科研工作者为主。大众型网络资源网站对用户年龄、职业、学科等属性不限,网站内容和形式多样,学术资源仅是其中一个部分。本研究将这类网站分为协同编辑型平台、多媒体资源共享型平台和其他类别平台。分类中将学术型社区与学术博客与论坛进行了区分,原因在于学术型社区主要的学术资源为学者自行上传的未发表、已发表、会议、海报等论文资源,也包括服务于科学研究的问卷、提问、图书推荐、寻求学术合作等信息。学术博客和论坛更强调平台的社交属性,用户通过非正式出版和发表的博客、短评和提问进行知识交流。此外该类网站也提供学术会议、境内外交流学习、学习经验等各阶段和层次研究人员或在校师生关心的内容和资讯。两类网站在网站内容、属性及服务对象上存在一定差异,因而将其进行划分。开放仓储主要包括机构仓储和主题仓储。机构仓储中包含高校图书馆的知识库以及各类机构知识库。其余类型网站和典型平台均如表2所示,不再进行赘述。由表2可知,学术型网络资源占据来源渠道的主流,其中开放仓储成为学者获取网络资源的首选渠道,专业学术网站和学术博客论坛在学者获得网络资源时具有重要作用。多媒体资源共享型平台作为大众型网络资源网站,以其社交性和多元化的特征影响学者的学术资源搜集行为。学术型社区、学术搜索引擎及协同编辑型网站的可用性和可信性有待提高,在学者获取网络资源时使用频率较低。各期刊不同类型网络资源使用比例如图3所示,图书情报领域研究人员倾向于使用开放仓储、专业性学科网站、学术博客与论坛以及多媒体资源共享型平台的资源,四类平台资源在各期刊网络资源引文中的占比超过80%,个别期刊如《图书情报知识》达到94.6%。协同编辑型平台、学术搜索引擎、学术型社区及其他类型网站资源则使用较少。图3各期刊不同类型网络资源使用占比情况从统计数据来看,图书情报领域科研人员倾向于使用开放仓储中的网络资源,十本期刊中,六本期刊的开放仓储资源使用占比最高。试究其原因,主要有二。首先,开放仓储作为开放获取运动的重要组成部分,研究人员可即时免费下载和使用仓储中的网络资源。且近年来,高校开始自建和推广仓储,一定程度上促进了仓储数量、资源与影响力发展。其次,收录在开放仓储中的资源多已正式出版,此类资源具有较高的权威性和学术性。大众型网络资源网站中多媒体资源共享型网站引用量较高,表明学术期刊在一定程度上肯定了大众化社交媒体平台网络资源的有效性和权威性。学术型网络资源网站中学术社区和学术搜索引擎使用量较低,此类网站主要作为资源搜索与获取工具,便于研究人员了解如名称、作者、出版商等基本信息,并进入其他网站获取资源的具体内容。协同编辑型平台与其他类别平台使用量最低,从具体引用内容来看,使用该两类资源的研究具有一定特殊性,或与行业条例相关,或与特定互联网产品相关。3.3网络资源高引用量样本论文关键词分布。文献资料由不同功能和性质的自然语言词汇通过科学组织构成一个整体。从文献正文中抽出的能够反映文献核心内容、表达文献主题概念的词汇为关键词(或主题词)。特定时期内某一学术领域中大量文献的关键词合集,可以在一定程度上反映该领域学术研究的特征与趋势【11】。Citespace软件通过一定算法和可视化功能呈现一组文献的关键词频次及关键词聚类情况。本研究选取参考文献中网络资源占比过半的期刊论文作为网络资源高引用量样本进行关键词分析,探究引用网络资源的论文的主题类型。3.3.1高频关键词将参考文献中网络资源占比过半的共计889篇期刊论文作为citespace提取关键词的样本选文。运行citespace时将阈值设置为top50,并以一年为一个时间切片,得到样本选文的关键词频次和中心性,关键词共有228个,大多数关键词中心性小于0.01,表3所示中心性和频次排名Top20的关键词。由表3可知:①大数据高居关键词中心性和词频序列表榜首,开放数据、数据管理、政府数据等居于关键词中心性和词频排序前列,说明五年来高频使用网络资源的论文作者重点关注数据的获取、存储、管理和分析。②美国和英国作为地域和国别标签出现的频率较高,其中美国出现频次仅次于大数据,说明五年来我国学者利用国外、境外网络资源进行国外图书情报概况调研,网络资源的出现和利用降低了国内学者获取国外图书情报信息的时间成本和经济成本。③样本选文依旧围绕图书馆这一核心主题展开,以图书馆为载体、以新媒体为渠道的移动图书馆、数字图书馆等主题研究是引用网络资源的分支领域。3.3.2主题分布与变迁依托citespace导出2014-2018年样本选文的关键词时区图(图4)。“#数字”表示运行LLR算法提取的关键词聚类词,共五个聚类,分别是公共图书馆、数据科学、高校图书馆、大数据、政府数据。各聚类间存在交叉,编号越小表示该聚类的关联性越高。图中每一个节点表示一个关键词,节点间共现关系用连线表示,节点的大小表示关键词频次和中心性的高低。图5中聚类词和节点较大的关键词分布在大数据、开放数据、公共图书馆、高校图书馆、政府数据、移动图书馆等领域,这一现象与关键词序列表中呈现的结果基本吻合。由关键词共现时区图可知,国内高频引用网络资源的期刊论文的主题随着时间推移产生变化。2014—2015年样本选文的研究主题相对集中,聚焦在图书馆及相关实践活动,大数据成为样本选文的着眼点。从2016年开始,高频使用网络资源的论文作者逐渐把视野聚焦数据的获取、存储、管理和分析,开放数据、科研数据、数据素养、小数据、政府数据等热点相继出现。图书馆学与情报学研究内容包含图书与档案的类目编码,图书馆与档案馆服务,图书馆与档案馆管理,图书馆与档案馆的空间结构,比较图书馆学与比较档案学等。从网络资源高引用量的样本选文的关键词频次及中心性统计和关键词共现时区图来看,主要涉及图书馆服务和比较图书馆学两大领域,可将具体的论文主题归纳为以下三个方面:(1)数据资源利用研究计算机与互联网技术的普及和推广促使图书馆建设迈入数字化进程,云时代的到来将图书馆学研究引入新境地,数据的获取、存储、管理和分析成为图书情报领域关注的焦点。“大数据”作为需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产【12】,与图书情报研究自然结合。围绕“大数据”和“开放数据”的聚类囊括开放获取、数据管理、数据科学、数据素养、政府数据开放、数据服务等主题。网络资源扩宽学者视野,成为学者研究数据资源发展的重要参考文献来源。(2)国(境)内外图情比较研究图情比较研究是图情学科中的重要分支,打破图情学科时空限制,将不同国别、不同文史背景、不同社会环境下的图情学科作为研究对象,运用比较研究手法探究各研究主体间的异同,从国际视域一览各国各地图情事业现状,为本国本地图情事业发展提出推动性建议【13】。随着网络资源的推广,学者收集国(境)外图情研究信息的成本下降,获取信息资源的范围扩大。美国等国图书馆发展历史悠久,图情研究的基础理论和学科体系完善,为国内图书馆学科建设提供理论和实践层面的可借鉴因素。样本选文就美国图书馆、美国图书馆协会、美国公共图书馆、纽约公共图书馆等主题研讨美国图书情报领域现状和发展趋势。(3)图书馆学基础研究图书馆研究是图情研究中的基础方向,样本选文依旧基于该主题展开。高校(大学)图书馆,公共图书馆及学术图书馆是图书馆的下设分类,各种细分图书馆之间也存在交叉。高校图书馆,公共图书馆及学术图书馆的机构数据库收集大量相关文献资料及信息资源,并以网络资源的形式呈现,方便学者研讨各分支图书馆的服务与管理模式。围绕图书馆研究主题,高频引用网络资源的样本选文密切关注数字图书馆、移动图书馆、智慧图书馆等依托新媒体技术和开放数字资源的新型图书馆形式,并就这些图书馆的创新服务进行探究。在探究过程中,论文作者引用开放仓储及专业性图情学科网站的网络资源完善研究内容。

4结论与展望

从本研究的调研结果来看,近五年来,网络资源逐步被图书情报领域研究人员认同与使用,成为科学研究重要的学术参考文献。图书情报领域研究人员对网络资源的来源选择有一定偏向性,倾向于使用学术型网络资源网站,尤其是开放仓储内的学术资源。但研究人员也较多参考了多媒体资源共享型平台的信息资源。此外,文献主题与是否引用网络资源存在一定相关性,网络资源为实现产学结合、了解理论与技术前沿动向、进行国际比较研究提供丰富理论与实践指导。以上结论一定意义上体现了图书情报领域研究人员对网络资源权威性、可靠性和真实性的认同。研究中也反映出当前网络资源使用中存在的问题。首先,网络资源虽数量和内容丰富,但分散于各类型平台,平台资源变化不定,增加了研究人员或读者资源收集和资源复证的成本与难度。行业协会或相关单位可尝试搭建学科内网络资源的集成网站,促进内部网络资源的交流与共享。其次,某些条件下,现有电子文献的载体类型及其标识如[EB/OL],已无法有效区分网络资源的类型,模糊标引不利于引文类型的识别以及科学引用规范的发展,亟需进一步细化科学文献引文标识类型,促进学术规范的发展。本研究仍具有一定的局限性,仅抽CSSCI目录中图书情报领域的十本期刊,选文数量有限,仅能从一定程度上反映图书情报领域研究人员对网络资源的使用情况。未来研究可扩大学科范围和统计年份数量,以期更全面地展现研究人员对网络资源的使用现状与认知规律。

作者:姚瑞卿 王嘉昀 许洁 单位:武汉大学