人工智能应用研究与文献计量学分析

时间:2022-09-14 08:44:47

人工智能应用研究与文献计量学分析

1引言

20世纪八十年代,我国制定了十年科学发展计划,将“智能模拟”作为重要研究方向。受此计划的指引,人工智能也开始尝试进入医学领域。对医学领域中人工智能的应用,许多学者都从各自的专业的角度进行了研究。为了深入了解目前我国人工智能在医学领域应用研究的情况,本文对中国知网上收集的在1981至2018年期间的相关文献的年份分布、作者、作者单位和区域、发文期刋、基金资助情况进行了计量学分析。

2资料和方法

2.1资料

在中国知网数据库中检索,具体步骤如下:进入高级检索界面,先选择一个检索条件,以“主题”为检索项,输入“人工智能”和“医学”二个检索词,选择“精确”匹配,两词之间选择“并含”布尔逻辑运算,最后添加“同义词扩展”,检索截至时间为2018年12月31日。检索结果共有相关文献1118篇。通过对检索出每一篇文献逐个阅读分析,剔除新闻报道113篇,广告11篇,科普类文献45篇,无关文献423篇,相同文献2篇,共得到524篇有效文献。

2.2方法

在收集上述数据的基础上,本文建立电子表格数据库,从发文年份、作者单位、发文区域、发文期刊、合作度、合作率、研究的成熟度、值得关注的作者等多个方面进行统计分析,绘制出多种图表。

3结果与分析

3.1文献年份分布情况的分析

从图1可知,在医学领域应用人工智能的研究始于1981年,到2018年已经历了37年。在这期间,该项研究的文献数量虽有多次小幅波动,但总体呈阶梯式增长的趋势。发展的第一阶段是尝试期,为1981年到2000年。这20年中,平均每年的文献仅有2.45篇。2001-2014年是第二阶段的起步期。在这14年中,年平均文献有19篇。2015-2018年是第三阶段的发展期,年平均文献有52.25篇,是尝试期的21.33倍,是起步期的2.75倍。

3.2发表文献作者的分析

3.2.1高产作者单位有效文献的作者共有1241人次,从中筛选出前九名高产作者。这些高产作者单位来自于中国医学科学院、中医科学院、华中科技大学、中国食品药品检定研究院、兰州大学、复旦大学、上海中医药大学。了解这些研究机构研究的情况,这样有助于读者快速掌握当前国内人工智能在医学领域应用研究的现状。3.2.2合作度和合作率文献篇均作者数为合作度。合作文献占总文献量比例为合作率[1-2]。从合作撰文的各类比例来看,226篇为独自撰文,占总数45.12%;2人合著共计103篇,占总数的18.97%;3人合著共计60篇,占总数的11.05%;其他共计135篇,占总数的24.86%。独著比合著比率小,这说明研究的相关文献以合作撰文为主。合作度在一定程度上反映了研究难度[3],合作率则在一定程度上反映了研究水平[4]。整个合作率和合作度呈阶段性变化,且与前文所述的文献发文变化息息相关。因此,以前述划分的阶段来观察其变化规律。各时期的合作度以及合作率分别为:尝试期是2.47和67.35%,起步期是1.99和43.98%,发展期是2.83和60.29%。整个研究的合作度约为2.37(1241/524),合作率为52.67%(276/524)。故研究的整体合作水平不高。3.2.3研究的成熟度统计文献第一作者的论文数量如表1所示。发表1篇论文的作者有420人,占总人数的91.90%,高出洛特卡定律规定标准的31.18%[5]。这说明,研究人工智能在医学领域中应用的论文主要是来自于只写作1篇论文的作者,即多数学者都是刚刚进入,研究还不太深入。文献作者按其地位的不同分为核心作者和非核心作者两类。依据普莱斯的核心作者计算公式[6]:

3.3发表文献的单位和区域分析

通过对文献第一作者单位统计分析,结果表明高等院校是发文的主体,共有383人,占总数的75.25%。在高等院校中,最主要的是综合类院校,共有163人,占总数的32.02%。这说明来自高等院校的人员是研究的主力,综合类院校是该领域的主要研究力量。例如,中南大学为综合类院校,既有理工类学院又有医学学院。同一学校内高水平多学科的科研团队便利协同合作,取长补短,同时,还可方便获取丰富的理工类和医学类资源。作者为公司企业的有14人,占总数的2.75%。这说明当前研究主要停留在科研上,与生产结合不够紧密,科研成果转化率较低。通过对文献第一作者单位所属区域统计分析,结果表明除西藏、青海、海南、澳门以外,其他省份均开展相关的研究。研究主要分布在华北、华东和中南。华北地区发表文献154篇,占总量的30.43%,是发表文献最多的区域。在此区域中发文最多是京津冀,共有145篇,占总量的28.49%。华东地区发表文献139篇,占总量的27.47%,是发表文献位列第二的区域。在此区域中发文最多是位于长江三角洲的上海、江苏、浙江,共有108篇,占总量的21.22%。中南地区发表文献95篇,占总量的18.77%,是发表文献位列第三的区域。在此区域中发文最多是湖南、湖北、广东,共有72篇,占总量的14.15%。整个研究形成了四个核心研究区域(京津冀、长三角、湘鄂粤、川陕渝)布局。

3.4期刊情况的分析

有效文献中,硕士论文有85篇、博士论文有31篇、期刊论文有375篇、会议论文有30篇、报纸有3篇。根据布拉德福定律,按其刊文量的递减顺序排列可分为核心区、相关区和离散区[8],且每个区的刊文数量基本相等,此时各区的期刊数量呈1:n:n2的关系[9]。现将期刊论文划分为三个区,如表2所示。核心区是载文量2-12篇的期刊,总和为125篇,占有效期刊论文总数的1/3。该区期刊数为27,其中只有2个期刊的载文量为2篇,其余25个期刊的载文量均为大于2篇.相关区是载文量1-2篇的期刊,论文总数125篇,占有效期刊论文总数的1/3。该区期刊数为86,其中有39个期刊的载文量为2篇,其余47个期刊的载文量均为1篇。离散区的期刊数量为125种,刊文量均为1篇。核心区、相关区和离散区的期刊数量比呈27:86:125≈1:3:5,不符合布拉德福定律。这说明人工智能在医学领域应用研究的文献刊物分布未能趋于合理,整体处于无序分散的状态,即研究没有形成核心期刊区。

4结论和展望

1981-2018年期间发表的人工智能在医学领域的应用研究文献,具有以下特点:(1)研究总体上呈现出阶梯式增长趋势,并由此划分为尝试期、起步期、发展期三个发展阶段;(2)从高产作者角度看,关注发文量位于前三的研究机构是中国医学科学院、中医科学院、华中科技大学;(3)高校教师构是主要研究者,约三成来自于综合类院校,但合作团队较小,且团队多为同单位同部门;(4)论文主要是来自于独自撰文,未形成核心研究力量;(5)现已形成四个核心研究区域,即京津冀、长三角、湘鄂粤及川陕渝。

作者:陈书敏 黄智军 施俊容 杨文 王嘉毅 单位:江西医学高等专科学校