大数据下科技期刊知识服务成效与发展

时间:2022-11-11 09:48:15

大数据下科技期刊知识服务成效与发展

[摘要]以大数据为代表的信息技术是当前我国科技期刊高质量发展的新机遇,通过技术赋能推动产业变革是科技期刊转型升级和实现知识服务功能的关键。文章从平台搭建、技术手段、知识服务产品三个方面总结大数据背景下科技期刊知识服务的实践与成效,分析科技期刊在科技、社会、人文环境下的发展机遇,探究大数据背景下科技期刊知识服务的发展趋势,并提出发展建议。

[关键词]大数据;科技期刊;知识服务;实践成效;发展趋势

大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,其作为一切信息、资讯、资料的基础,与移动互联网、云计算、人工智能、物联网、VR/AR等技术相结合,使不同学科和领域在整理、获取、储存、传递、分析和共享方面得到了质的飞跃,推动了科技期刊进入信息资源兼具海量性与即时性、功能实现兼具智能性与互动性、服务范畴兼具多样性与开放性的智媒出版阶段[1]。为此,学者们就科技期刊大数据的应用意义[2-4]、应用需求[5]、应用模式[6-7]以及实现路径[8]等方面进行了探讨,认为大数据可以更快地挖掘科研工作者的前沿研究价值,通过更精准的用户画像和广泛的协作物理空间,为科研工作者提供更好的决策支持[9],也指出大数据应用还存在有效数据获取、元数据分析模式建立、平台数据对接、版权数据安全等方面的实施难点[10],但大数据的发展应用无疑有助于推进科技期刊核心资源建设,加速出版流程再造[2,9],从而实现出版业由内容服务向知识服务转型[11],使知识资源的数量和形式更加丰富,处理复杂程度更高,知识服务形式更个性化,知识服务盈利模式更有效[6]。近年来,知识服务已成为科技期刊转型升级的重要内容,也是海量学术资源环境下广大期刊用户的切实需要。因此,文章在分析大数据背景下我国科技期刊知识服务的实践与成效的基础上,探讨以大数据技术为支撑的科技期刊知识服务的发展机遇与未来趋势,并提出发展建议。

一、大数据背景下科技期刊知识服务的实践与成效

我国科技期刊知识服务的发展起步较晚,存在知识服务的理念发展超前于知识服务实践进程的困局[12],但知识服务发展将向“信息—知识—智能”迈进,知识服务只有通过“数据+算法”,才能实现作者、内容、读者三方的高效匹配,这已然成为业界的广泛共识。自2015年国家新闻出版行政主管部门启动全国知识服务模式试点工作以来,国内科技期刊积极整合资源技术,在平台、技术、应用等方面展开部署,并在试点示范、技术支持、科研支撑、标准研制等方面取得了卓有成效的业绩[13]。

(一)平台搭建

1.科技期刊牵头的知识资源服务平台科技期刊牵头的知识资源服务平台根据参与期刊主体数量、规模的不同可分为单刊知识资源服务平台和学科刊群知识资源服务平台。一般而言,单刊知识资源服务平台通常存在知识内容领域单一、规模数据储备量小、更新缓慢以及运营薄弱等问题[14];而学科刊群知识资源服务平台由于数据资源储备更加丰富、建设资金更加充足,能更好地实现个性化、定制化、专业化的深层次知识产品服务。但总体来看,科技期刊牵头的知识资源服务平台出版流程业务数据更丰富,极易融入科研创新环境,能够动态、连续、精准地为科研生产全流程提供知识服务[15]。具体来看,第一,在数据资源上,数据采集是大数据应用的基点。科技期刊牵头的知识资源服务平台除了具有期刊的数字化文献资源数据,还拥有图表、音频、视频、试验数据等相关科研内容数据,以及期刊在长期经营活动中积累的选题数据、用户信息数据、生产流程数据、用户反馈数据等业务数据,为拓展知识服务业态储备了更丰富的底层数据[16]。第二,在平台架构上,平台架构通常包括网站PC端和移动端。其中微信公众平台是大多数单刊知识服务选择的应用平台,也有部分单刊知识服务选择微博、抖音等应用平台,而运营成本投入相对更大的移动客户端App则常见于学科刊群知识服务。第三,在平台功能上,针对大数据应用特点,科技期刊牵头的知识资源服务平台进一步强化了多端协同、用户行为分析与社交功能,从而可实现在内容生产环节上作者、读者、审稿人、编辑的多元主体协同和知识传播环节的精准关联、检索与分发,以及基于用户个性化需求的产品业态拓展。例如,中华医学会杂志社打造的中华医学期刊网,提供中华医学期刊全文数据库、中国临床案例成果数据库、优秀科研成果优先出版平台等多样化的服务。2.数据库牵头的知识资源服务平台数据库牵头的知识资源服务平台可分为两类:一是以中国知网、万方数据、维普资讯为代表的综合性专业文献内容服务商,二是高校、企事业单位、国家公共服务单位所辖的知识资源服务平台,如人大复印报刊资料数据库的“壹学者”学术科研一站式移动服务平台、主管的国家知识资源服务中心。相比科技期刊牵头的知识资源服务平台,数据库牵头的知识资源服务平台在数字资源与技术应用上具有更深厚的积累,面向的用户群体更为多元,知识服务内容也更加丰富。具体来看:第一,在数据资源上,由于更早开展数字化文献信息服务,因此数据库牵头的知识资源服务平台拥有更完备的结构化、碎片化数据以及个人、机构用户的消费业务数据;第二,在平台架构上,数据库牵头的知识资源服务平台更倾向于选择自主研发的网站PC端及移动客户端App;第三,在平台功能上,除了全方位、便捷的知识信息供给,数据库牵头的知识资源服务平台更注重面向机构用户,提供科研创新、科研评价及知识解决方案。例如,中国知网的平台架构包含知网研学平台、大数据研究平台、协同研究平台和在线教学服务平台等内容。

(二)技术手段

1.数据挖掘及仓储技术随着海量科研数据被结构化处理为XML存储形式,人工智能技术在知识服务领域的应用不断深入,学术搜索从模块量化比对进入基于大数据、深度学习的文献科学统计分析阶段,可通过用户行为分析,智能比对预测学术热点趋势,为相关人员推送合适的搜索结果,例如,《西安交通大学学报》采用清华大学AMiner智能期刊服务来监控文献推送成效,构建专家画像和知识图谱[17-18]。在数据仓储方面,云存储技术已成为主要手段。云存储技术通过分布式信息存储系统实现数据信息的大容量整合、更新、共享,极大地提升了数据库的稳定性和利用率,节约了运行成本,为科技期刊开展知识脉络分析、学术统计分析、学术不端监测、用户行为分析、产品优化设计提供了稳定的数据基础,并主要依靠中国知网、万方数据、维普资讯等期刊出版平台以及SciCloud、ScholarOne、北京玛格泰克、北京仁和汇智等技术服务商进行部署[19]和技术实现。2.数据管理技术目前,基于语义出版技术的数据分析与处理已被众多数据库与科技期刊编辑部所采用,语义出版可实现文献数据的结构化处理、建立专业化本体库、开启更多样的应用接口,从而实现数据管理的内容结构化、数据融合化、信息可视化和对象关联化[20]。在应用上,科技期刊牵头的知识资源服务平台更多的是依靠北京玛格泰克、北京仁和汇智等技术服务商来实现结构化XML元数据管理与富媒体网页制作等,如《作物学报》的RichHtml[21]、《自动化学报》知识服务系统所呈现的知识路径、知识拓扑、作者拓扑等功能[22];各大数据库牵头的知识资源服务平台则在文献元数据组织、分析、关联,形成知识服务产品方面做得更为出色[23],如中国知网提供的数据论文、增强论文等论文出版服务[24],以及基于语义分析技术与内容信息指纹技术的科研诚信管理系统等[25]。3.出版流程优化技术在用户体验上,各科技期刊也做了尝试和创新。例如,在产品生产阶段,《中国科技期刊研究》通过ORCID系统验证了科研人员单位、项目、论文、同行评议等学术活动信息,增强了作者和审稿人信息的可靠性,有效规避了署名学术不端行为;《福建农业学报》应用北京仁和汇智的XML在线数字生产云平台可满足文献出版阶段作者、编辑、审稿人三方协同修订以及生产进度的多方同步[26],实现出版流程的智能化、协同化。在产品呈现形式上,各科技期刊也主动应用音频、视频、动画、AR、VR等技术来提供更直观的信息。例如,上海大学期刊社的14本期刊共同搭建的移动出版平台对以上技术进行了集成应用[27];《航空知识》应用VR技术进行信息传播,为用户提供沉浸式的知识体验[28]。在产品反馈上,各科技期刊还利用新媒体和实时通讯技术打造以科技期刊为中心的网站、微信、视频号、今日头条号、抖音、微博、QQ社群、微信社群等社交信息矩阵,提供交互式支持服务,及时满足用户需求。

(三)知识服务产品

国内科技期刊的知识服务产品除了具有知识检索、知识拓扑、知识关联等知识信息服务和热点推送、趋势分析、学术评价、知识本体等知识发现服务,还推出极具个性化的微社交服务和知识解决工具、方案,主要包括以下几类。第一,数字决策分析工具,即以科技期刊长期积累的专业技术文章和由审稿人、读者组成的专业技术人员智库为依托,以直接解决专业技术问题为目的的决策分析工具。例如,北京卓众出版有限公司的《汽车与驾驶维修》OTO应用服务平台“修车帮”,提供维修技能知识资源和专业人员在线问答服务。第二,技能与素养提升服务,即科技期刊发挥知识资源储备和品牌影响力、公信力提供技能素养等教育类的知识服务。例如,《金属加工》的“金粉讲堂”在线课程学习平台、《现代农药》的“农化学院”系列农药品质提升系列培训课程、《中国海洋大学学报(自然科学版)》的写作指导等。第三,学术支持与科研服务,即深入科研创新过程,为从成果孵化到产出过程提供相应的信息对接和问题解决的知识工具与服务。例如,《航空学报》与企业联合,以产学研论坛的形式推动企业与人才的精准匹配[29];《中国舰船研究》提供的项目立项与申报服务[30];人大复印报刊资料数据库“壹学者”学术科研一站式移动服务平台提供课题立项助手、会议服务、著作出版、随手笔记等学术科研工具[31];《浙江大学学报(英文版)》微信公众号提供英文润色服务[32]等。第四,社交与知识分享服务,即充分发挥科技期刊桥梁作用,打破读者、作者、审稿人等不同学者群体间的交流壁垒,满足用户知识分享的需要。例如,人大复印报刊资料数据库“壹学者”学术科研一站式移动服务平台提供实名学者圈、“壹学者”互动社区等社交工具[31]。第五,商业拓展服务,即通过对接其他相关产业,拓展知识服务业态,提供更丰富的知识服务产品。例如,重庆课堂内外杂志社推出游学研学、活动大赛等教学教研方案;《中国果树》提供助农直播微店服务等。

二、大数据背景下科技期刊知识服务的发展机遇与未来趋势

(一)大数据背景下科技期刊知识服务的发展机遇

1.科技环境当前,科技的飞速发展推动出版实践进入智慧出版阶段,出版功能由知识传播向知识服务转变。一方面,“数据”将会成为科技期刊未来竞争的核心资源,科技期刊可通过“数据+算法”为用户高效匹配更具实用性、适用性的服务,解决用户难以获得有价值信息的问题[12]。另一方面,智慧技术的应用和产业融合将成为科技期刊知识服务的核心要义。基于人工智能渗透于选题策划、内容生产、精准营销等方面,各类智能型产品已覆盖知识服务全流程,科技期刊知识服务与其他产业间聚合也不断深入,从数据平台到评价指标、管理工具、教育服务、学术支持都在不断革新[33]。2.社会环境如今,随着5G技术、物联网技术以及智能终端等持续发展,社会正步入智能体时代,呈现对知识的渴求和对技术创新的积极响应,特别是2020年新冠肺炎疫情暴发以来,知识与多种媒体、产品相融合,知识付费经济模式被人们广为接受,人与人、人与物、物与物通过互联网技术连接在一起,实现数据的实时流动与全域分析。知识将以数据的形式直接解决问题,与人们的生活更加密不可分。3.人文环境在大数据环境下,科学数据资源已成为国家和企业实现科技创新的重要资产,成为促进数字经济的重要生产要素,且随着交叉学科的不断发展和移动智能设备的普及,科学研究也越来越依赖系统、高可信度的基础数据分析,社会公众也对获取高质量的科学数据提出更高要求,对科学数据的渠道、频率、表现形式更加敏感[34]。自20世纪90年代起,各国相继加强部署科学数据共享服务,随着开放科学不断深入和开放获取科技期刊数量不断增加,基于大数据的科学数据共享模式和基于问题解决的数据深度分析与应用的知识服务模式成为未来科学数据资源应用的必然。

(二)大数据背景下科技期刊知识服务的未来趋势

1.数据信息容量持续扩增随着大数据技术发展及其在科技期刊出版行业中的应用,科技期刊知识服务的数据信息容量持续扩增,具体体现在:第一,数据来源显著扩充,既包含科技期刊数字出版的文献资料信息,也包含科技期刊纸媒时代的文献信息,还包含科技期刊出版活动相关的一系列物联网信息;第二,数据结构类型多样化,更多更复杂的数据结构类型被处理,如结构化数据、半结构化数据及非结构化数据等,可大大增加原有数据囊括的类型;第三,数据增长速度快,围绕科技期刊数字出版平台的广泛搭载产生的出版活动、科研交流、研究开发数据能够通过多种终端、平台被实时记录、保存和精细划分。2.数据处理能力显著提升随着数据传输、存储、处理技术(算法)的发展以及行业标准的完善,科技期刊知识服务的数据处理能力将显著提升,主要表现在:第一,5G技术广泛应用于数据高速处理,大量的非结构化数据也得以深度应用,进一步扩展知识服务的价值空间;第二,科技期刊出版平台和技术服务商把对象和文件存储技术、离线计算、流式及实时计算、分布式协调服务、集群管理与监控等存储技术与各类数据管理工具应用于数据处理,有效提高数据处理时效;第三,算法发展与出版行业数据的结构特点将进一步获得匹配,有利于在较短时间内充分挖掘和应用数据价值。3.需求匹配更加智能丰富随着交叉学科的不断发展,科技期刊用户对知识服务的诉求更加精准,要求能直接、具体地解决实际问题或给出明确建议[29]。而大数据的精准性、预测性和智能性,既能满足用户这一需求,又能借助人工智能的自我学习与分析能力,精准预判用户需求,抢先提供相应服务,具体体现在:第一,更加精准的数据输出能力,如通过信息数据挖掘和分析技术进行用户画像分析,通过区块链和知识标引技术建立用户细分筛选机制,通过代币发行和分配奖励机制形成去中心化的全链区域传播;第二,更加多样的数据输出方式,如通过群体智能算法提供个性化、定制化的知识解决方案,依靠LBS、VR、AR等技术建立对象化、可视化的立体输出渠道,提升用户体验[31]。4.应用场景更加移动多元学术信息资源数字化的深度发展将使用户更加依赖网络。同时,以云传输为基础、以AI智能为核心的智能体系统正逐步应用于城市建设。未来,通过全域感知、物联网、云计算、人工智能和机器学习等技术的综合应用,数据信息将直接嵌入用户生活的实际场景,以数据分析、知识化处理解决用户在生活中的实际问题。科技期刊知识服务将从与移动通信设备的媒体融合跨越到与其他产业深度融合的新模式、新业态,形成主动预见、预测控制、有效应对的智能化、高效化的精准场景定制化服务产品[35]。

三、大数据背景下科技期刊知识服务的发展建议

(一)重视数据资源分类积累与应用

科技期刊作为传统出版资源提供商,要凭借自身的专业性规避信息资源具有的数据价值密度低、数据可靠性弱的不足,重视数据资源的分类积累与应用,提供更加真实、可靠、有效的信息资源。第一,扩大数据资源体系,多维度丰富基础数据。基于原有数据资源体系,科技期刊知识服务应进一步挖掘和转化科技期刊隐性资源,细分整理显性资源,重新梳理基础数据,将其扩展为内容数据,包括期刊论文以及论文涉及的科研数据、图表、音视频等相关附件,“两微一端”的刊载信息,出版物元数据(ISBN、ISSN等),期刊的装帧设计信息;发行数据包括期刊销售量、销售额、库存、印刷数据等;网络传播数据包括“两微一端”的页面浏览量、独立用户数、访问次数、下载率等;第三方平台的用户行为数据、消费数据、社交数据等。第二,加强数据质量控制,建设高质量基础数据库。科技期刊知识服务应建立以AI及大数据技术为核心的数据处理平台,充分利用智能工具,统一元数据标准和元数据模型,提高多源异构数据的采集、汇聚、融合[36]。第三,优化数据处理流程,构建科学高效的数据管理体系。科技期刊知识服务应逐步构建覆盖数据生态全生命周期的数据治理体系,实现数据收集、清洗、整理、分析的可视化监控,实现分阶段的数据标准化控制与管理。

(二)推进构建知识服务技术创新体系

技术领先决定了科技期刊知识服务在全面竞争生态系统中的主导优势。因此,科技期刊知识服务应积极推进构建全域化知识服务技术创新体系,提高知识的传播速度。第一,各级政府、科协应加强顶层设计,通过资金激励、共建共享等多种机制,鼓励技术企业及数据库、期刊联盟等深化大数据应用技术研发,优化底层基础数据收割、清洗、集成、标引与融汇技术,重点实现数据处理技术(算法)的突破和升级。第二,各科技期刊应积极从期刊集群、大型出版商、数据资源服务商、技术服务商等引入新技术,通过申请财政补贴、共担成本、项目合作等途径,以购买或合作等方式寻求互利共赢的技术研发模式[29]。第三,科技期刊编辑应转变思维,积极参与知识服务产品的优化设计,构建更科学全面的学习样本和训练模型,突出知识服务的差异化、创新性和前瞻性[17]。

(三)推动产品研发与用户需求匹配

准确理解用户需求,提供高效、有效的服务是大数据时代科技期刊知识服务的重点。第一,科技期刊知识服务可通过应用大数据、算法、深度学习、图像识别等人工智能技术,结合计算机软件开发与应用,推进协同化、智能化的出版流程再造,精准预判用户需求,打造个性化、定制化、差异化的推送服务内容和知识解决方案。第二,基于载体和渠道的变化,科技期刊知识服务应适应不同场景,提供新媒体、App、音视频、VR、AR、操作系统、分析报告、教育培训等多样化的精准知识服务产品。第三,顺应科研活动发展规律,科技期刊知识服务应转变知识服务产品开发重点,积极弥补不足,打破内容生产规则,积极解决用户的需求痛点。

作者:陈文静