科学知识图谱效能评估可视化分析

时间:2022-06-02 05:27:21

科学知识图谱效能评估可视化分析

系统效能是系统的实际行为表现与系统目标的匹配程度,其度量和评估往往牵涉系统科学、管理科学和行为科学等多个领域[1]。目前,国内效能评估研究成果多集中在武器装备[2]、火控雷达[3]、电子对抗[4]等领域,研究内容包括评估指标体系及模型构建、评估方法及模拟仿真。但是,这些研究主要是效能评估领域某一知识点的微观聚焦,缺乏对该领域研究现状整体格局的宏观可视化分析。科学知识图谱(MappingKnowledgeDomains)是用于显示科学知识发展进程和结构关系的图形,既是具有时间序列化的知识谱系,又是可视化的知识图形;可对知识或研究群体所构成的复杂网络进行聚类分析和共引分析,将海量数据以图形、图像等可视化集中表现形式,挖掘数据之间的潜在关联,实现数据可视化信息处理,以协助人们做出科学合理的决策[5-6]。科学知识图谱分析技术在大数据时代背景下发展迅速[7],目前被广泛应用于管理科学[8]、安全科学[9-10]、科技管理[11]等领域。笔者基于华裔学者陈超美开发的科学知识图谱可视化软件CiteSpaceV[12],以中国知网CNKI上的核心期刊为数据源,检索效能评估领域近20年所载论文,分析研究成果产出时序、研究力量分布、作者合作、机构合作、关键词及其文献共引、突变词分析;通过科学知识图谱的可视化分析呈现效能评估研究领域的知识结构、规律和分布情况,实现科学知识从微观聚焦到宏观可视化分析的突破,进而对效能评估领域研究动态的总体把握。

1效能评估研究成果可视化分析

1.1数据来源及方法。以“主题=效能评估”在中国知网(CNKI)上检索最近20年(1998年~2017年)的文献,共得到3089条数据;根据布拉德福定律可知,少数核心期刊集中了该研究领域的大量重要文献,于是在高级检索中将期刊来源类别选择为核心期刊和EI源期刊,检索条件:精确,经过筛选去除不相关的声明、通知、公告等,可得该领域的有效文献1248篇。将检索结果导出为Refworks文本文件,导入CiteSpaceV中进行格式转换,“TimeSlicing”选择1998年-2017年,“YearsPerSlice”设置1年为一个时间分区,“TOPNPerSlice”选择阈值50,即每个时区选择高频出现的前50个节点,采用网络裁剪运算策略(pruningslicednetwork),绘制作者、机构合作网络知识图谱,有效地完成效能评估领域科学研究进行可视化分析。1.2论文产出时间图谱。论文产出是衡量研究领域已有知识的累积量以及成熟程度的重要指标,笔者将效能评估研究近20年的核心期刊论文进行时间图谱分析如图1所示:效能评估领域研究论文产出曲线基本符合科学文献的指数增长规律———普赖斯逻辑增长曲线。1998年-2000年,国内效能评估研究还处于初级阶段,论文年平均不超过10篇,是普赖斯曲线缓慢增长的初级阶段;2001年-2003年,国内效能评估研究论文呈现线性增长趋势,并于2003年首次突破了20篇;2004年-2007年,该领域研究论文呈指数型增长趋势,并于2007年达到了峰值105篇,该年研究成果占比总研究成果的8.3豫;2008年-2017年,该领域论文发文量基本稳定在(80~100)之间波动,标志着国内效能评估研究已经成熟。将刊载效能评估领域研究论文的北大核心期刊按其刊载量进行降序排列,前十位分别是《火力与指挥控制》(358篇)、《系统仿真学报》(71篇)、《弹箭与制导学报》(66篇)、《电光与控制》(63篇)、《现代防御技术》(61篇)、《系统工程与电子技术》(55篇)、《计算机仿真》(30篇)、《空军工程大学学报(自然科学版)(27篇)》、《现代雷达》(27篇)、《兵工学报》(23篇)。根据布拉福德定律,该领域最核心区期刊所刊载的文献数量约为总数的1/3,即1248/3=416篇。由此可见,国内效能评估领域已形成集中稳定的核心发文期刊群;其中,《火力与指挥控制》和《系统仿真学报》为效能评估领域的核心区期刊,两种刊物均为北大核心和CSCD核心期刊检索,所发表的文章在一定程度上代表该领域的热点,是该领域后续学者的重要参考期刊源。笔者进一步对核心期刊群进行时序统计分析如图2所示。可见,2007年-2016年是国内效能评估研究的高产年度范围,两类核心区期刊时序变化曲线显著不同。其中,《火力指挥与控制》所刊载的效能评估相关论文从数量上看,走出了普赖斯逻辑曲线的缓慢增长、线性增长、指数型增长和稳定震荡阶段;其年度产出在2007年首次超出25篇后一直保持在该水平以上,且在2016年达到峰值38篇。《系统仿真学报》所刊载的效能评估研究论文首次出现在2004年,年度产出随后缓慢增加,在2008年达到峰值14篇后迅速下降。1.3学科分布。通过对效能评估领域近20年的研究论文分析,提取研究成果的学科分类如表1所示。其中,武器工业学科方向效能评估研究成果最突出(742篇),占总研究成果的58.86豫;其次是航空航天科学工程学科方向(186篇),占总研究成果的14.75豫;电信技术学科方向发文164篇(占比13豫);军事技术学科方向发文量105篇(占比8.33豫);计算机软件与应用技术学科方向发文量为93篇(7.45豫);各学科方向发文量时序变化趋势基本相同,呈现典型的普赖斯逻辑曲线特征。

2效能评估研究合作图谱分析

2.1作者合作图谱。根据普赖斯定律,某一领域的核心作者发文数m应满足:m=0.749*nmax姨(nmax姨表示发文最多作者的文献数),经过统计分析可知m=0.749*31姨=4.17,取整得到5,即在效能评估研究领域发文量大于等于5篇的作者可视为核心作者,近20年共有55人,共计发文403篇,占总文献数的32.75豫,未达到普赖斯所认为的核心作者发文总数占全部发文量的50%,说明国内效能评估领域还没有形成真正意义上的核心作者群。笔者采用CitespaceV对效能评估研究领域的作者合作关系进行分析如图3所示,字号越大说明该作者发文量越多,红色圆圈表示作者间的合作研究成果较多。可见,近20年来该领域共包含252个作者、252对合作关系、作者合作网络密度为0.008;说明作者之间的合作关系网络整体较为松散,即效能评估领域没有形成联系紧密的合作网络。但是,以来自同一院校师生之间2人~5人之间的局部合作网络较多,如空军工程大学的徐浩军、华玉光、刘凌、孙金标、郭辉等5人组成的最大子网络,通过发挥团队集体优势,承载效能评估知识的延续性,提高在该领域的科研产出效率。通过分析作者合作网络可知,该领域核心作者中的高产者(假定其论文总量大于等于10篇)有张安(31篇)、徐浩军(18篇)、郭三学(14篇)、高晓光(13篇)、罗鹏程(12篇)、王维平(12篇)、武昌(12篇)、周经伦(10篇)。笔者将效能评估领域论文高产者前三甲的研究成果进行了时序统计分析如下页图4所示:这3位学者的发文量时序变化曲线截然不同;西北工业大学的张安近20年几乎每年都有产出效能评估相关论文,其中2008年达到峰值8篇;空军工程大学的徐浩军在该领域的研究从2006年开始,年平均发文量为3篇;武警工程大学的郭三学在效能评估的研究开始于2014年,且年平均发文量为4篇。2.2机构合作图谱。通过分析效能评估研究论文的机构合作网络如图5所示,近20年机构合作网络节点数111,合作关系数57,网络密度为0.0093。网络节点和字号的大小反映机构发文量的多少,红色圆圈表示机构合作研究成果较多。该领域量排名前十的机构包括空军工程大学(239篇)、西北工业大学(107篇)、国防科技大学(90篇)、北京航空航天大学(44篇)、海军航空工程学院(41篇)、海军大连舰艇学院(35篇)、海军工程大学(30篇)、第二炮兵工程学院(27篇)、解放军电子工程学院(27篇)、解放军理工大学(25篇)。节点与节点之间的连线表示机构之间合作次数。由图可见,参与效能评估领域研究的机构之间的合作关系比较疏散,合作关系较为突出的是空军工程大学和西北工业大学。2.3关键词共现图谱。关键词是对所述文章思想和观点的高度概括,笔者通过对近20年效能评估领域1248篇核心文献的分析,提取得到关键词3967个,通过统计分析得到该领域前10个高频关键词及其频次分别为:效能评估(593次),作战效能(170次)、层次分析法(91次)、指标体系(60次)、作战效能评估(52次)、评估(48次)、效能(38次)、评估模型(37次)、仿真(27次)、模型(24次)。笔者将该数据导入CiteSpaceV中进行关键词共现知识图谱如图6所示。其中,图谱共生产节点215个,542条连线,网络密度为0.0236。知识图谱中字体及其圆圈的大小代表该节点的重要程度,字体越大、圆圈越大则表示该关键词出现的次数越多,重要性等级越高,越有可能成为网络的核心节点;连接线上的数字表示共现次数,表示关键词之间的关联程度大小。CiteSpace软件中提供了一个可量化某一节点在连接其他节点中的重要程度的指标———中心度(中介中心性),若某节点的中心度大于等于0.1,说明该节点处于核心位置或对信息的流动起到控制作用。从图谱中可知,关键词中效能评估(1.21)、作战效能(0.37)、层次分析法(0.17)、指标体系(0.11)、评估模型(0.10)等节点在图谱中发挥了重要的枢纽媒介作用。综合关键词频次及其中心度,以上节点可视为共现网络的关键节点,反映了效能评估领域的核心研究主题和方法。2.4效能评估文献共引分析。表2是效能评估研究排名前5位的高被引文献,说明其学术水平较高,有较高的参考价值。高被引文献研究内容涉及武器系统、雷达、导弹、电子对抗等学科,期刊来源均为公认度较高的核心期刊。其中武器系统效能评估在高被引文献中占比67豫,由张克在《宇航学报》上发表于2002年的《关于导弹武器系统作战效能评估问题的探讨》,其总下载量最高、被引次数较高,为各学科效能评估研究奠定了基础,是后续学者的重要参考来源。2.5关键词突变分析。科学知识图谱能够显示知识单元和知识群之间的网络结构、交叉、演化或衍生等诸多复杂关系,新研究主题或研究热点的确立通常可依据词频增长率显著变化或爆发词检测;而CiteSpaceV不仅能够实现对高频节点和聚类的解读,也能通过“突变词语”的突变检测(burstdetection)来实现对学科研究前沿的探测。笔者通过对效能评估研究领域近20年的1248篇文献进行突变词(burstterms)提取分析,其结果如图7所示。1999年-2005年,“作战效能评估”突变强度和频次高居榜首,表明该时间段效能评估研究集中在武器装备和军事领域;2005年-2007年,突变词为“防空导弹”,说明该时间段的研究热点是导弹效能评估;2013年-2017年,“云模型”[13-14]和“评估指标”[15]突变次数显著增加,为效能评估学者青睐的新主题和热点。

以中国知网近20年收录的主题为“效能评估”的核心期刊论文为研究对象,借助CiteSpaceV对其在空间上形成的客观共现现象进行可视化分析,包括研究成果产出时序图谱、学者和机构合作图谱、关键词共引、文献共引、突变词等,从而获取该领域研究的演进情况。研究结果表明:1)科学知识图谱能宏观地勾勒出效能评估的“科学研究地形地貌图”,使得学者们在该领域的研究“既见树木,又见森林”。2)国内效能评估研究从产出、研究主题以及合作情况上都已经趋于成熟,目前已形成集中稳定的核心发文期刊群;但还没有形成真正意义上的核心作者群,作者合作和机构合作关系网络均较为松散。3)关键词和突变词分析能有效地把握该领域研究的主题和热点的演变过程。

作者:夏正洪 万健 朱新平 单位:1.中国民用航空飞行学院空中交通管理学院 2.中国民航科学技术研究院