图书馆的科化科学研究

时间:2022-12-27 11:53:58

图书馆的科化科学研究

本文作者:肖潇吕俊生工作单位:上海大学图书情报档案系

学科服务的特点与发展趋势学科服务是一种需求驱动、面向科研过程的服务。它通常采取知识化组织模式,以用户为中心,面向服务领域或机构,组建灵活的学科单元,将资源采集、加工、重组、开发、利用等工作融于每个学科单元之中,整合传统图书馆职能部门,使信息服务由粗放型管理转向学科化、集约化管理,以方便学科馆员提供更深入、更精细的服务。学科服务具备动态性、协同性、交互性等特点。动态性科学研究过程中,研究人员的需求具有重复性和延续性特点,而且同样的资源、成果可以应用于不同的项目团队。所以,学科服务也相应地具备动态性特点,学科馆员需要灵活地调整策略、调用资源,对服务方式、工具、人员进行重组。协同性学科馆员在为科研人员提供一线服务时,其背后有战略情报人员、技术平台开发人员和资源建设人员合力形成的支撑力量。在学科馆员、科研人员、研究所图书馆信息服务人员及技术人员所组成团队的协同下,才能够更好地实现服务目标,满足科研需求。交互性学科服务的交互性主要表现为三种形式:(1)学科馆员通过与用户的沟通交流,了解用户的需求;(2)用户手中掌握大量重要的学科资源(如研究笔记、实验数据、研究报告和预印本文献等)。因此,他们可以在对自我资源管理的同时参与到学科资源建设中。其所拥有的学科资源同学科馆员的资源通报、资源导航、学科竞争情报等进行融合,可以构建更为丰富、多样和动态更新的学科资源集合;(3)用户与用户的交互。学科馆员嵌入研究团队后,可以协调、沟通不同团队间的关系,为其建立一个交流空间,从而使相近或交叉领域的研究人员能够通过合作共享,来实现自身的研究目标。学科化服务未来的发展趋势是与多部门建立战略伙伴关系,贯穿信息生命周期全过程,嵌入科研流程,提供深层次的知识化服务。在不断深化完善学科化服务方式和内容的过程中,科学数据服务成为非常重要的一部分。因此必须加强对科学数据的重视,认识到开展科学数据服务、提升科学数据组织和挖掘能力对于科学研究以及图书馆竞争力的重要意义[7]。国外很多大学图书馆已经开始了这方面的探索,如康奈尔大学图书馆的DataStaR(DataStagingRepository,分布式数据存储库)项目,研究者在学科馆员协助下完成数据上传、检索、提交,同时支持小型研究团体的数据共享[8]。普渡大学图书馆的D2C2是一个分布式数据保存项目,通过学科馆员联合各专业学科学者,共同研究数据存储库建设,开发元数据搜索和数据监护流程等,最终目标是学科馆员和各个领域的研究者合作进行数据收集[9]。学科馆员参与科学数据服务的优势综合分析科学数据服务和学科数据服务的特点、内涵,可以发现二者在本质上都是嵌入式服务,都具有学科性、协同性、动态性等特征,两种服务不仅在特点上具有一定的共通性,未来发展方向也相契合,具有一致性。可见,学科馆员参与科学数据服务具有较强的可行性和优势,其具体表现为以下几个方面:首先,学科馆员的支撑单位图书馆是文献保障体系的主体,是科研人员获得信息服务和知识服务的重要场所,拥有对重大研究项目提供文献资源、科学数据发现、科学计算与数据处理等服务的支撑能力,以及计算设备共享支撑能力。科学数据服务作为一项知识服务,其数据处理和管理方法实际上来源于信息管理,这正是图书馆学科服务的强项[10]。其次,当前的科学数据资源缺乏一套规范的审核机制,其开放性、不规则性等特点为科学数据服务带来新的挑战。而目前科学数据服务尚未形成成熟的机制模式,基于科学数据服务与学科服务在服务特点上的吻合性,学科服务的工作流程和模式相对比较成熟,因此可以参照学科服务的相关服务模式推进科学数据服务的进行。第三,科学数据服务对服务者有较高的要求,需要专业知识、技术知识、文献情报知识等多方面知识的支持。而学科馆员队伍正是一批既熟悉图书情报工作,又拥有专业背景能够开展特色服务的复合型人才队伍。他们有一定的计算机、外语基础,了解数字化文献资源以及相关的知识结构,能够开展信息资源的搜集、整合、加工、存储、传播和利用工作,并能结合馆藏及对国内外图书情报工作的熟悉,解答科研人员的问题,使得科研人员得到良好的服务。另外,图书馆学科服务队伍在数据服务上还存在以下优势:学科馆员队伍与科研人员之间存在长期稳定的合作关系,熟悉用户的科研行为习惯,具备良好的沟通技巧,并且拥有丰富的用户培训经验。同时,学科馆员在长期的工作实践中积累了大量的经验技术,具有敏锐的洞察力,能够拓展信息资源类型、深化知识服务,能通过数据转换及挖掘,提供深层次的学科服务。在数字化建设中学科馆员也积累了大量的经验,如信息组织方面的标引、分类、管理以及开发元数据框架,数字资源建设方面的资源数字化,互联网海量信息的获取,异构数据整合改造、检索、提取分析和传播服务等,这些宝贵经验将为学科馆员开展科学数据服务提供坚实的基础。由此可见,学科服务队伍是图书馆参与科学数据服务的重要力量[11],当前科研环境下学科馆员参与科学数据服务不仅可行,而且更具优势。

学科馆员参与的科学数据服务内容学科馆员在科学数据服务中参与的服务内容主要包括:科学数据的开发服务、导航检索获取服务、存储服务、管理咨询服务、数据分析服务以及基于数据服务的信息素养教育。科学数据开发服务学科馆员可以主动开发和挖掘自身的科学数据,为科研人员搭建科学数据共享平台。这些科学数据主要出自图书馆馆藏文献,以及对图书馆所属机构的科学数据的收集和组织。例如,加州大学伯克利分校图书馆对其校内几个实验室的数据进行了收集和整理[12]。通过这种方式学科馆员不仅对图书馆的特色信息资源进行深度揭示,提高自身资源的利用率;同时也可以减轻科研人员的工作量,提高科学数据的有序性和有效性[13]。科学数据导航及检索服务文献检索是图书馆的优势所在,学科馆员可以开展数据检索、数据导航等服务,使用户便捷地获取馆外数据,提高原始科研数据的利用率。首先,学科馆员帮助研究者鉴别合适的资源,在图书馆内部或者通过外部资源(比如数据中心)查找数据,帮助用户解决如何从各类资源介质上获取数据等问题,在适当的时候帮助用户选择或者订阅数据资源。其次,通过对科学数据和馆藏资源的集成检索,为二者建立关联,使科研工作者在获得所需的科学数据的同时获得相关的文献资源,为其科研工作提供系统性的服务。另外,图书馆还可以为科学数据添加注释以及来源出处,实现科学文献和科学数据的交叉链接。比如,德国国家科技图书馆(TIB)利用DOI系统,通过分配数据集数字对象唯一标识符,实现文献和科学数据的链接[14]。大英图书馆根据“威尔士方言调查”(SurveyofAnglo-WelshDialects,SAWD)报告所提供数据的音频文件副本,利用图书馆的音频服务系统,提供MP3格式获取服务[15]。科学数据存储服务数据存储是由图书馆存储信息资源的传统和优势决定的。学科馆员在嵌入科研过程时,可利用相关系统、平台、工具,为科研人员实时存储实验、科研中产生的数据。数据存储有利于科研人员的后续研究使用,也可通过再重组再加工,服务于更多的科研活动。图书馆一般通过自建或与校园内其他部门合作建设科研数据管理的硬件环境,当前中科院环境下面对各研究所建立的机构知识库(IR)就是一个很好的范例。美国哈佛—麻省理工数据中心(Harvard-MITDataCenter,HMDC)是两校联合建立的数据仓储,供教师存储、获取数据[16];约翰•霍普金斯大学(JohnHopkins)的谢里登学院(Sheridan)图书馆,建有数字研究和长期保存中心(DigitalResearchandCurationCenter),强调开发智能工具、数据管理软件,尤其重视对大规模的原始科研数据的收集和长期保存[17]。在这些数据存储中,学科馆员都扮演了重要的中间角色。科学数据管理咨询服务一个新的课题或新的研究人员,往往对于科学数据知识库和一些特殊数值型数据库不是十分了解,学科馆员可以及时了解用户的数据需求,帮助用户发现或建议最佳数据知识库,使他们能够及时准确地从科学数据知识库和机构库中获取所需数据。还可以协助用户制定一个易于管理的数据计划,对于项目中间和结束时产生的大量数据及时存取,为用户提供指导。学科馆员在项目、课题开始就参与、引导和支持用户在科研过程中开发科学数据,贯穿整个科研生命周期,帮助科研人员建立群组知识环境,搭建科学数据服务平台。例如,美国国家大气研究中心地球观测实验室(EOL)数据中心围绕数据管理的生命周期为科研人员提供个性化数据管理服务,从数据规划、数据收集、数据加工、数据存档、数据到数据的长期保存等,数据中心工作人员融入科研环境,提供嵌入式服务。具体工作包括调查问卷发放、邮件列表、制订数据管理计划、网页开发与维护、GIS支持、潜在/其他数据资源调查、出版管理、特殊媒体创建和、数据长期归档和管理等[18]。麻省理工大学图书馆提供社会科学数据、地理GIS数据以及生命科学数据的咨询服务。该图书馆学科馆员利用其现有的人际关系网络,通过非正式交流了解研究人员的数据需求,积极参与到科研中,通过与研究人员合作来管理他们的数据[19]。美国国家科学基金NSF从2011年开始要求所有资助项目制订数据管理计划。应此要求,康奈尔大学成立了研究数据管理服务组,成员为高级研究副教务长、图书馆馆长以及学科专家等。该小组嵌入到科研项目中为研究者提供专业数据服务,以推进科研进程。图书馆主要参与以下服务:数据管理规范的制定、元数据服务、数据分析服务、相关工具软件的开发以及数据出版等[20]。科学数据分析服务图书馆现在的服务主要围绕已经出版的文献资源,新科研环境下图书馆应该将服务链条拓展到上游数据处理阶段,并将深层次的知识服务作为未来服务发展的方向[21]。比如进行数据分析,将科研数据与相关科研文献关联等。学科馆员可以协助科研用户进行数据挖掘、数据融合等服务,并可以提供相应的数据分析软件。哈佛大学的“DataverseNetwork”项目包括科研数据出版、共享、参考、抽取和分析等内容,为大学及其他机构提供数据出版系统的全部解决方案,并提供数据分析服务,产生正式的数据引用(datacitation),通过SPSS和STATA分析数据表,并可提供下载[22]。科学数据信息素养教育学科馆员参与的数据信息素养教育包括两部分内容:第一种是基于用户的信息素养教育。让用户了解科研数据管理的目的、意义和要求;熟悉数据管理的一般方法和术语;培养数据管理实践所需的技能;关注与科研数据管理相关的政策法律。具体培训内容包括:(1)如何使用数据;(2)数据表示的科学意义以及数据如何获取和创建;(3)如何获取最原始的或者某一阶段的数据;(4)如何结合领域知识,使用数据工具和模型进行数据处理和应用,解答科学问题和满足社会需求[23]。第二种是学科馆员自身的数据服务培训。计算机技能是数据服务馆员的基础,要求数据馆员会使用硬软件、操作系统,并且可以对数据产品以各种形式进行导入导出[24]。同时,需要对统计概念、相关术语、研究方法以及实践知识有所熟悉,这在建议用户选择和获取数据产品时会有一定的帮助。因此,学科馆员需要培养并加强这些方面的知识和能力。伊利诺伊大学图书馆与信息科学研究生院的DCEP(DataCurationEducationProgram,数据监护教育计划)采取在成熟课程基础上添加新内容的建设方法,辅以针对性强的实习,主要研究数据采集与管理、知识表达、数字资源保存与存档、数据标准、数据政策。课程包括信息组织、信息建模、本体论和元数据理论与实践等[25]。3学科馆员参与的科学数据服务形式科研活动中,从项目的调研、论证、立项,到开展研究,再到最终的结题验收、推广应用,提供全程的、持续的、深入的服务是未来科研活动对文献情报服务的基本要求。将图书馆科学数据服务嵌入用户环境中,可以帮助用户及时发现图书馆的有价值的数据资源和服务。这无疑是将图书馆潜在用户吸引至图书馆的极好方式。学科馆员嵌入科研团队提供科学数据服务最常见的形式有如下三种:过程嵌入对科研过程生成的各种科学数据资源的收集与管理。由于数据的生成是在数字化的科研环境中产生的,通过建立相应的规范、工具、方法,一方面可以通过一些程序在数据生成过程中在后台自动收集这些数据资源,无需人工干预,同时也可以使科研人员在科研过程中对生成的数据资源自觉地进行规范化的提交和存储,例如通过程序提醒科研人员,或者在没有完成提交时无法进行后续的工作。人员嵌入学科馆员帮助科研人员及时解决科研过程中遇到的问题,通过直接参与科研过程,与科研人员的交流和观察帮助科研人员实现隐性知识的显性化。在此过程中,要求各服务部门联合起来进行协同服务。因为仅仅依靠学科馆员自身的力量是不够的,它还需要从技术上获得支持,资源上获得满足,人力上获得补充。这就需要资源提供中心、技术支持中心、人才培养与储备中心等部门的合作。即学科馆员与科研用户以及其他服务部门人员通力合作,推动学科馆员嵌入用户环境,为用户提供更全面、更深入的服务。平台、工具嵌入科学数据服务中的过程嵌入、人员嵌入主要是通过工具、平台的嵌入来实现的。E-science环境下每一项服务的实施都是依托于一定的工具和平台进行的。利用嵌入式桌面工具,可以进行自动或半自动判别。其具体实现手段包括:实时检测用户的应用场景、捕获用户的操作及焦点词串、分析用户操作日志、获取用户资源使用权限、记录用户使用偏好以及对焦点文本中命名实体进行智能识别等。学科馆员可以根据用户的专业背景和课题需要调整资源配置,为其进行个性化数据推送服务,其中包括数据内容及相关工具。同时,对获取的科学数据提供存储、整合、分析等功能,返回的结果可以进行转换、截取、重组、标注等操作,使呈现方式简洁明了,获取的科学数据便于二次利用。另外,利用相关技术平台,选择、加工、导入和组织相关的数据资源,加载相关的处理工具(例如资源链接工具、批注工具、讨论工具、个性化内容组合工具、个人数据管理工具等),与图书馆资源进行链接,有机组织到科研院所以及图书馆的信息平台之中等。充分整合相关数据资源与服务并对其进行分类,按需求确定资源与服务。只有平台、工具嵌入的良好运行,才能有效推进学科馆员参与科学数据的服务过程。

综上,可以看出,嵌入用户环境的科学数据服务是学科化服务未来的重要探索方向。图书馆科学数据管理服务,重点不在于为用户检索或提供了多少科学数据,而在于如何帮助科研用户发现、管理和利用好科学数据资源。学科馆员应该充分发挥自身在信息服务方面的优势,寻求与其他机构、部门的合作,逐步深化服务内容,提升服务层次。通过促进科学数据的全面开放获取,更好地服务于科研人员及科研活动,进而推动科学的发展。在此过程中,学科馆员还应该注意以下问题:(1)不能只是分散地列出自身可尝试的服务内容,需要深入了解科研生命周期和数据生命周期,按照学术交流流程系统地讨论科学数据服务;(2)科学数据作为科研产出的重要内容,其知识产权保护问题一直没有得到解决,且科学数据引用问题也是目前科学数据领域研究的热点之一,大量科学数据被用在科研以及文献中,但是并没有对其引用状况进行标识和应用,导致科学数据的价值没有有效体现出来[26];(3)科学数据服务是一项复杂的任务,虽然很多图书馆开展了一些科学数据服务,并取得了相应进展,但是关于数据服务的研究尚缺乏完善的机制和成熟的模式。因此,需要我们在学科服务的基础上设计新的服务模式,使科学数据服务既能做到动态地收集和评价数据资源,又注重服务与用户的工作流程相融合,实现服务科研这一目标[27]。