大数据技术对学术期刊品牌建设的作用

时间:2022-07-29 02:34:46

大数据技术对学术期刊品牌建设的作用

摘要:大数据时代带来了信息挖掘的范式革命,数据挖掘技术对学术期刊的品牌建设也起到助推作用。大数据技术通过数据资源的共享实现了“让数据发声”,消除不同学科领域之间的壁垒,增强了信息的预测功能,其高系统性、低误差水平以及较强的预测效能为编辑在品牌建设实践中把握学科研究现状、凝练学科研究热点提供了可能。期刊编辑可以借此分析学术论文的产出和分布情况,获取高产作者信息,各类研究结构、基金项目资助等学科发展状况,确定学科领域的研究热点,准确把控学科脉络发展,从而打造优秀的期刊品牌。

关键词:大数据;品牌建设;选题策划;信息挖掘

期刊品牌建设不断受到期刊界和学术界的关注。研究发现,目前我国期刊品牌建设还面临诸多问题,尤其是缺乏准确的品牌整体定位,缺乏个性和特色。期刊的品牌建设不同于其他产品,要具有高学术品位,先进的文化意蕴和与时俱进的创新发展性,这就需要通过选题策划对学科热点问题的深度挖掘、理性透视和动态回归,反映学科的发展态势。优秀的选题策划可以提升读者与刊物的契合度,增强刊物的影响力和生命力。目前,大数据已经渗透到各行各业,云计算、信息数据化等逐渐被受众熟悉和接受,数据挖掘技术的应用也为学术界和期刊界带来了革命性的影响。大数据技术有利于对学科脉络发展和前瞻的把控,可以为当前的学术研究和期刊品牌建设起到助力作用。期刊编辑应该思考如何应用整体化的数据思维、利用关联性的思考方式审视学科的发展。

一、大数据时代信息的范式革命

大数据时代,海量的数据蕴藏有丰富的价值。维克托•迈尔•舍恩伯格在其著作《大数据时代——生活、工作与思维的大变革》中指出,大数据时代的核心任务是数据挖掘、收集、储存和分析。大数据时代有更好的预测能力和说明能力,大数据技术改变了人们认识世界的方法,逐渐成为新的范式呈现在科学研究者面前。大数据成为继实验科学范式、理论科学范式和计算机科学范式之后的第四范式“数据密集型科学范式”。大数据技术对信息的把控和挖掘能力弥补了传统处理方法的缺陷。首先,大数据技术实现了“让数据发声”,通过人为干预条件的加入,对不同的指标进行数据归类,对海量数据进行合理的挖掘,对数据样本进行总体的分析,发现数据之间特殊的牵连性和关联效应,从而得到更加真实有效、甚至可能超出研究者预期的结论,给人们的思维方式带来了巨大的冲击。其次,数据挖掘有较强的系统性。数据资源的共享,能够消除不同学科领域之间的壁垒,实现各个学科领域的互通合作,以动态图谱的方式呈现知识体系。最后,大数据技术能够实现对数据进行实时收集,对非结构化和过程性的数据也能较好把控。这种整体的研究,减少了抽样的误差,得到的结果更加真实可信。利用大数据更能有效计算出未来的走势,增强了信息的预测功能。

二、大数据技术对品牌建设的助力作用

学术期刊的品牌建设,要有与时俱进的创新发展性。信息化时代中,编辑如何能快速了解本学科的过去、现在和将来,学界代表人物,学科的变化历程,重点研究领域,未来的发展趋势?如果长期沉浸于某一个学科领域,有丰厚的知识储备和敏锐的洞察力,那么,可能对这些问题会有独到的见解。在信息量急剧增长的今天,文献浩如烟海,在数据库中输入一个关键词,就有可能得到数以万计的研究报告。即便是在某个领域的权威专家,也达不到百科全书式的知识储备,不可能对该学科所有的专业方向都有精准的把控能力。而大数据研究方法的高系统性、低误差水平以及较强的预测性为编辑在打造学术品牌中把握学科研究现状、凝练学科研究热点提供了可能。通过大数据研究方法,可以分析学术论文的产出和分布情况,获得高产作者、各类研究结构、基金资助项目等综合信息,确定学科领域的研究节点和活跃点。另外,还可以通过文献知识流动的方向的探索,了解该学科的前沿领域经历了哪些发展阶段;通过社会网络分析方法,获得作者与合作机构的信息,动态展示学科知识结构和知识演变过程,科研合作网络以及发展走向。(一)数据挖掘:信息的精准提取与过滤。面对庞大的数据信息,编辑需借助可靠的研究方法,快速、精准地从中过滤、提取有利的数据。因而,数据来源与检索策略的选择显得尤为重要。首先,要根据知识单元的属性及用途呈现方式,选择不同的数据库。数据库的数据收录方式各有特点,例如中国知网(CNKI)囊括了丰富的期刊和文献资源,数据的完整性和连续性有不可比拟的优势;中国社会科学引文索引(CSSCI)遴选学术影响力较大的期刊作为数据来源,权威性更强。可兼选CNKI、CSSCI等数据收录库,以确保各知识单元的完整和准确性。其次,在检索策略方面,应选择业界公认的权威杂志为母刊,剔除会议通知、稿约、栏目介绍等相关性较低的类目信息,综合全部来源文献及被引文献,其中来源文献可用于共被引分析,对知识关联性、前沿问题等进行可视化呈现;被引文献数据集用于反映作者和机构被引频次,可视化呈现核心作者和核心机构的基本情况。信息提取的常用的方法有词频与共现分析法、引文共(被)引分析法、多元统计法和社会网络分析等。①词频与共现分析。词频和共现分析隶属于内容分析法的范畴。词频分析是通过对某一学科领域核心关键词的频次统计数值揭示该领域研究的主题分布、热点和发展走向。共现分析主要是对关键词进行分析,也包括对文章主题和摘要的分析,常用的是共词分析法。该方法直接统计文献中关键词出现的频次,通过聚类分析构建关键词贡献矩阵,获得联系紧密的关键词,从而厘清学科的研究热点。②引文共(被)引分析。研究者撰写学术论文会对以往研究进行参考和引用,引与被引之间形成引证关系。共被引(Co-citation),是指两篇或两篇以上的文献同时被后来的一篇或多篇论文所引用,则称这两篇或多篇被引文献就具有“共被引”的关系。引文共(被)引分析法,就是通过数理统计方法,比较归纳、抽象概括出引证关系的特征和内在规律的文献计量学分析方法。③多元统计法。通过描述性统计的方法,对获得的数据资料进行初步的整理和归类,继而通过因素分析、聚类分析、多维度尺度分析法进行数据挖掘。④社会网络分析方法。社会网络分析法能够深层挖掘信息之间的联系,可视化呈现知识点之间的关系与结构,是运用较为广泛的知识图谱分析方法。通过社会网络分析不同地域、机构、作者之间的合作情况,揭示学科共同体之间的关系。(二)可视化技术:信息图谱的直观呈现方式。大数据分析方法对海量的文献数据进行标准化处理,通过绘制科学知识图谱(MappingKnowledgeDomains),更加形象地展示学科的热点和主流研究领域的进展情况,了解相关领域的核心作者、高产机构,从而把握学科的发展动态、内在规律和发展趋势。科学知识图谱结合了传统的文献计量学与现代的数据挖掘技术,形成了一种综合分析科学发展脉络的知识发现方法。科学知识图谱将抽象的数据以图像形式直观呈现,分别从微观、宏观层次揭示学科的学术生态。对海量的数据信息进行挖掘、分析并可视化处理在学科研究中显得越发重要,而这是传统研究方法所无法胜任的,需要借助计算机软件技术才得以实现。信息可视化软件将数据进行计算和转化,最终以图像的形式直观呈现,绘制出可视化的信息图谱,通过这些图形或者图像,将专业领域中的隐形现象外显化呈现。目前,国内外众多的计算机、情报学等领域的学者、公司开发出几十种各具特色的信息可视化辅助软件,其中CiteSpace、SATI、VOSviewer和Ucinet为学界广泛使用,值得编辑同仁借鉴。

三、小结

大数据时代,海量的数据蕴藏有丰富的价值,大数据技术对信息的把控和挖掘能力弥补了传统处理方法的缺陷,可以快速、精准地过滤并提取有利数据。期刊编辑可以借助大数据研究方法及技术支持,对核心作者、机构、关键词时区、关键词共现性等方面的图谱呈现,凝练出该学科领域的高频热点关键词,厘清研究的热点领域,从而提高期刊品牌的文化内蕴,增强与时俱进的品牌发展性。CiteSpace、SATI、VOSviewer和Ucinet等信息可视化辅助软件各具特色,可根据不同的数据库和数据处理需要进行选择。通过词频与共现分析法、引文共(被)引分析法、多元统计法和社会网络分析等可视化科学知识图谱呈现方法,揭示科学中潜在的学科结构、追踪科学研究的前沿问题、探测某一时期科学研究热点、剖析科学发展演化历程、研究并分析科研合作网络、评估某科学家的学术地位、构建科学发现的理论体系、辅助决策者制定科学发展方案。

参考文献:

[1]维克托•迈尔•舍恩伯格,背尼思•库克耶.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[2]CheswickN,WestbrookJI.Socialnetworkanalysisofmedicationadvice-seekinginteractionsamongstaffinanAustralianhospital[J].InternationalJournalofMedicalInformatics,2008,79(6):115-125.

[3]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012,(1).

作者:杨雅婕 单位:苏州大学学报编辑部