科技信息资源平台创建

时间:2022-07-20 08:59:41

科技信息资源平台创建

1科技信息资源共建共享平台研究现状及存在的问题

1.1科技信息资源共建共享平台研究现状

由于国家的政策性扶持及引导,我国科技信息资源平台建设与应用发展迅速,并逐渐渗透到科研活动中。从全国来看,当前绝大部分省份已建设并使用科技信息资源共享平台。江苏、福建、广东三省的数字资源共建共享平台整合的范围不断扩大,已扩展到应用程序与服务等方面,同时,也开始逐步注重人们的个性化信息需求,并通过各种信息资源联合体、互助协作等形式,统一购买电子文献资源,促进了研究所、图书馆的发展。但资源重复建设严重、缺乏统一的规划与协调、数字图书馆标准不一、合作建设少等问题也越发突出,急需一个共建共享平台来解决目前的困境。

1.2科技信息资源共建共享平台建设存在的问题

1.2.1区域发展不同,导致其建设的不均衡经济发达的地区或省份,借助国家政策的支持,利用其底子厚、起步早、发展快、技术手段先进等有利条件,积极开展科技文献平台建设工作。比如国家科技图书文献中心和清华大学等,对全国性的文献平台进行了研究和开发。加之这些平台的后期建设有资金支持,技术装备先进,服务条件好,他们的科技文献平台建设和服务走在全国前列。其他地区的科技信息资源共建共享平台建设无法与其相比,其发展有一定的相对性和局限性,无论是建设情况还是使用情况,都有待提高。

1.2.2共建共享协调机制不完善共享平台建设缺乏统一规划和协调,处于各自为战状态,或者是非常松散的简单合作,仅仅靠一个合作协议和理事会章程等自我约束,没有强制性的义务也没有法理层的权利,导致科技信息资源的收藏分散、重复,难以形成服务的整体优势。

1.2.3平台标准化水平、服务层次有待提高实现科技信息资源共享的前提就是平台标准化。但就目前的现状来说,标准化程度相当低,规范标准不一致,各平台从总体设计框架到具体实现的底层技术手段大相径庭,自建数据库五花八门,不具备和其他平台数据库互联的功能,制约了科技信息资源共享的发展。

2科技信息资源共建共享平台建设的必要性及意义

2.1科技信息资源共建共享平台建设的必要性

2.1.1科技信息资源的高速增长目前每个资源中心的数据库少则几十个,多则几百个。随着整体教育水平的提高、人们对信息资源利用水平的提高,资源中心需要向人们提供更多、更专业的学术资源信息。一些专业的资源商也开始提供一些更细致的学术信息,比如经济类、法律类、标准类、教育类、医药类等资源。越来越多的科技信息资源在检索利用过程中必然带来学术资源利用率低、检索效率低下等问题,这无论对于科技信息资源来讲还是资源中心情报服务来说都是一种效益浪费。受采集资源的专业局限性影响,无论是以上哪一类信息,没有一家资源商能够囊括它所关注的那一类资源的所有学术信息。因此,资源中心为提供完善的信息服务,需要购买多家数据库提供商的资源。而信资源中心向人们展示这些资源的时候,因商家不同,其使用界面和检索方式均不相同,登录认证方式也不一样,所以不得不向人们分别提供这些信息,常见的方式就是在一个或多个页面里列出各个资源的链接和登录信息。人们在复杂繁多的科技资源中徘徊,要找到自己真正需要的资源往往需要熟悉各个不同的科技信息资源的检索方式、文献分类方式、检索结果设置等,要耗费精力时间却往往检索结果不尽如人意。

2.1.2检索期望的日益提高现在的学术研究需要的不再是庞杂的文献的堆砌,而是精确的数据、事实的支持佐证。所以科研工作者在浩瀚的学术海洋里面寻找符合自己需求的文献资源越来越难。各资源中心所提供的科技信息资源之间互相独立,列表显示,需要人们分别登录访问,并在访问这些资源的时候,不得不点开一个个资源链接,登录,输入关键词后进行搜索,由于各资源系统界面不一样,搜索方式不一样,搜索的效率很低。另外,数据量快速膨胀,逐步由找不到内容变成找到的太多太杂,耗费几倍的时间用于查找。因此,人们对数据检索的要求越来越高,希望在最快的时间内以最简单的检索方式找到自己的目标知识。随着学科交叉渗透的不断发展,学科间的联系越来越紧密,简单的检索文献已经不能满足人们的学习与科研要求,人们需要从繁多的学术文献中找到关联,如何利用简单快捷的检索挖掘发现深层次的知识、整合文献内容从而爆发新的知识点才是未来学术发展的热点。

2.1.3图书馆角色的升级与转变全新网络时代的来临使资源中心的服务理念、管理理念及相应的用户体验都发生了全新的变化。在信息与知识日益丰富的今天,这种变化已在迅速影响着图书馆,不断推动图书馆向网络虚拟型图书馆方向发展,逐步实现了无缝的用户体验,允许人们互动参与、以论坛社区为基础的形式来设计程序、开源软件的应用等。

2.2科技信息资源共享平台建设的研究意义

资源中心可以通过各种信息资源联合体、互助协作等形式,统一购买电子文献资源,促进各资源中心的协调发展。但资源重复建设严重、缺乏统一的规划与协调、数字图书馆标准不一、合作建设少等问题也越发突出,急需一个共建共享平台来解决目前的困境。共享平台的建设以CAILS的设计模式和运行机制为基础,构建辐射的共建共享运行机制和模式,全面提升各科技信息资源建设和服务的整体发展质量和辐射带动能力,逐步形成覆盖各学科的科技信息资源保障网络,实现资源的共建共享、互惠互利,实现共同参与、按比例投入、共同建设、共同受益、共同管理的建设目标。科技信息资源共享平台是资源中心在信息时代满足学术需求、体现“让大众公平自由地获取知识信息”这一理念的必由之路。此平台的实现具有一定的理论意义。信息资源共享平台建设有助于提高自然资源的开发利用水平和效率,减少资源浪费和能源消耗,减少对环境的污染和危害等,具有较好的经济效益。资源中心构建科技信息资源共建共享平台可以加快推进节约型社会建设,实现信息资源的合理配置,成为推动社会发展、经济繁荣和科技进步的助推器,具有良好的社会效益。

3科技信息资源共享平台的总体架构设计

科技信息资源共享平台的总体架构可分为门户层、管理层、数据层、硬件层四个部分。各个成员单位的系统相对独立,由共享平台的各个子系统,如统一认证系统、联合编目系统、统一检索系统等组成,并建立了统一的综合服务门户,将每个系统、服务和资源整合起来。各层面说明如下:

3.1硬件层面

包括网络平台、服务器和大容量存储设备等,是共建共享平台的硬件设施,是赖以提供服务的硬件基础。

3.2数据层面

包括馆藏资源(图书、期刊等)、数字资源(数字期刊、数据库等)、各种自建和引进的特色数据库、共建资源库(如联合目录等)、统一认证中心数据库等,是实现共享的内容基础。

3.3服务层面

服务各个层次,是共享体系的组织保证,是共享平台特殊服务层。包括元数据的加工与管理、数字对象的加工与管理、联机编目、用户权限管理和服务评估等,分别服务于数据层、技术层、服务层等,通过有效地组织管理和运行机制保证共享体系的实施。该层通过跨越分在不同地点的所有数字资源,提供分布式数据访问、资源聚合和过滤、数据挖掘等。

3.4应用标准与协议层面

应用标准与协议层是共建共享平台面向用户的统一服务的窗口,是共享平台最重要的一层,为共享平台服务提供了方便的接口。通过信息集成和服务集成,综合门户平台整合了各类文献服务和专业信息服务;通过统一认证,支持成员单位用户的访问控制和个性化定制,从而为各服务节点和用户提供数字资源共享的环境。

4科技信息资源共享平台建设整合内容

4.1规范化建设研究

各资源中心的采购、编目、查询和提供信息服务等必须采取统一的模式进行。这一点几乎不可能实现,只有从不同的信息系统平台中提取标准化的信息数据,建立合作的馆藏资源,统一科技信息资源的合理配置与协调,有选择、有重点地建设科技信息资源,才能为整个共享网络提供信息服务,发挥群体效益。在数字资源整合方面,采取的措施有2种:一种是研究各个资源中心的管理系统、数字资源的底层设计,抽取关键字段,进行标准化处理,由平台开发人员整合各个成员单位的馆藏数据,形成统一馆藏资源,可以实时进行更新数据,但比较费时麻烦,甚至需要各个软件的开发部门的配合才能得以完成。另一种就是利用CALIS整合文献资源的模式,由成员单位定期上传或提交数据,实时整合资源,这样更新速度慢,简单方便,但需要成员单位密切配合,容易实现。在实际操作中,2种方法的结合,达到了较好的预期效果。为了强调数字资源的标准化,馆藏图书目录方面,我们采用第二种方法———CALIS整合文献资源模式,要求成员单位及时提供标准的MARC编目数据,定期上传,建立和完善书目数据库,形成联合目录以实现数据库的转换、交换、兼容和不同系统资源的共享;并由专门人员负责收集整理,实现起来比较容易。对于非标准化的数字资源,针对各种资源的特点,采用同构跨库检索技术基本能实现非标准化数据的检索问题。这一技术的应用将在下面的技术层面进行详解。

4.2技术支撑平台建设研究

通过信息规划、信息采集、信息加工处理、信息管理、信息、信息服务、用户权限、信息传输交换,实现了各种文献资源采集、整合、加工处理、管理、和对外开展文献资源检索服务、原文传递服务的技术支撑平台的建设。同构跨库检索是资源整合系统的新理念与发展趋势。单纯的跨库检索与数字资源整合,不能体现学术文献间的互相联系。在Lib2.0环境下,基于发现与传递服务的一站式同构跨库检索系统,则较好地解决了上述矛盾,给资源整合提供了一种新的发展思路。利用同构跨库检索技术使用先进的数据萃取技术,可以把多种标准、多种格式或非标准自建的数据库,比如常见的中外文数据库,如书生、超星、方正、同方、维普、万方、SpringLink、AIAA、Proquest、Open-Access等,以及资源中心的自建数据库、网络数据库、光盘数据库等在内的分布、异构和多样化的数字信息资源进行整合。同构跨库检索技术无视源数据库使用何种标准、何种格式,只要能够以网页的形式展现给人们,就可以获得技术支持。同时,也支持各种外部系统的沟通协议,支持标准或非标准的数据交换格式,包括ISO2709(例如MARC21、UNIMARC、CMARC等)、NISO?ANSIZ39.85(DublinCore)、XML等;支持标准检索协议规范包括Z39.50、HTTP、Z39.88等。资源门户支持开放的体系结构,遵循信息描述、组织和资源互操作的国际标准,甚至支持以非标准协议进行的整合检索。因此,根据各个资源中心的实际情况,可以对各种独有的自建数据库进行整合,最大限度地发挥拥有的数据库资源,为人们提供更加便捷的服务。

4.3科技信息资源共享平台建设整合研究

将平台各联合体的数据库资源在科技信息资源共建共享平台上实现整合,包括书目数据库、网络数据库、电子出版物和自建特色数据库等,整合为统一的检索平台。

4.3.1平台建设目标要求(1)完成各种信息资源的一站式检索数字资源按照资源类别分:图书、期刊、学位论文、会议论文、视频、报纸、标准等,人们可以在所有这些自然分类中同时进行搜索,也可以选择在某个分类中进行搜索,无论使用哪种搜索方式,能更方便地找到自己所需要的信息资源至关重要。使用跨库检索技术检索资源,被访问资源正文仍然在各个资源库,同构跨库检索同各个资源数据库做了相应接口。人们访问资源正文的时候无需再单独登录,即一站式登录,登录同构跨库检索系统,既是登录了以往的各个数据库。人们只需在检索口输入目标检索词,例如主题、关键词、全文、题名、摘要、作者、文献来源、时间、刊号、刊名等,就可以同时在不同类型文献资源中快速检索目标文献,不会受限于某个数据库的网络链接状况。一站式检索平台使人们的检索更加快捷、高效和全面。(2)实现不同信息资源检索智能跳转为方便人们访问各个数据库,不需要在各个数据库间不断重复输入关键词、不断地打开、关闭数字资源等操作,实现了不同信息资源检索的智能跳转。人们只需要输入一次关键词,点击自己关心的不同资源类型,目标检索词就能够在多类型文献资源中跳转检索,快速定位检索目标,而且提供中文语义化搜索西文功能,智能分析与拆分检索句段。(3)高级检索方式同构跨库检索支持二次检索与高级检索,可以限定检索词出现的位置,如题名、作者、简介、ISBN、ISSN、DOI等;可以限定资源的年代,以实现更精确地检索,为专业的资源中心专家、科研人员提供深层次的学术检索服务。(4)检索结果自动去重融合传统的学术文献的检索是以不同资源商提供的系统为基础的,人们根据各个数据库固有的检索方式与功能检索文献,检索结果可能会有很多重复的结果,由于系统间没有关联,常常需要靠人工的方法去重,这种检索模式割裂了不同类型资源相关学科、主题的学术关联,对人们来说是一种学术浪费,降低了学术研究的互补性与全面性。共享平台把各种资源做了技术性的融合和去重,不是简单的资源罗列,比如同一个资源的元数据,可以把多家资源商提供的元数据互补得到一个更全面的描述,检索出来的结果是自动去重后的结果,大大提高了检索的效率,并能为人们提供全面的学术文献。(5)语义化中文直接检索西文大部分中国人习惯使用中文进行搜索,利用同构跨库检索技术可以让人们使用中文关键词搜索到相应的外文期刊或者外文论文,并能做更进一步的智能优化处理。比如搜索“美国”可以搜索到含有“America”、“USA”、“National”等外文关键词的文献,搜索“高速公路”可以搜索到含有“Highway”、“Freeway”、“Superhighway”、“Motorway”等外文关键词的文献。(6)检索结果优化聚类利用同构跨库检索技术为人们提供精确全面的检索结果优化处理。比如:系统根据文献出版时间、所属学科、相关度、文献检索字段、文献来源等对检索结果提供精确的聚类导航分析,进一步缩小和精确检索结果;系统还可以针对每一种文献资源的属性设置相匹配的检索字段检索,对中文资源系统支持基于中图分类的四级类别的学科分类;人们可以逐步缩小检索的范围以实现更精确地筛选检索,协助用户挖掘信息,从而做出更深入的专题研究。

4.3.2共享平台建设整合方法采用同构跨库检索模式,通过对本地各类镜像数据库、馆藏印刷型资源、远程数据库建立超级统一索引,可以使人们根据检索需要进行检索,进行一站式发现与传递,为人们提供一站式解决方案,简化了从资源发现到获取的检索过程,使人们能够快速找到和获得准确、高质量的信息。同构跨库检索技术的技术原理如图1所示:这样通过数据融合,可以得到一个元数据信息最丰富最全面的页面,包括题名、作者、分类、时间、摘要、参考文献、关键词、主题词等。可以为用户提供统一的界面设置,提供多字段匹配,并且检索结果匹配率高、全面,能合并95%以上的重复文献。能够将前端人们服务和后端各类图书馆的资源管理连成一体,能够为图书馆向新的信息系统架构转型提供可靠的技术支持。资源整合的过程是自动化的,对各种页面类型内容智能识别和抽取结构数据。没有开放接口的数据库能像具有openurl的系统一样互联互通,为同构跨库检索提供了有力的技术支持,实现了资源的统一共享。

4.4知识产权保护技术研究

对于每个成员单位购买的科技信息资源的全文可以直接下载阅读,也可以跳转到原数据库的详细页面。成员单位全文链接提供两种解决方式:一种方式为服务器获取方式,成员单位内安装服务器和相应的全文系统,当人们点击获取正文请求时,直接由全文系统处理返回全文的下载或者阅读页面。另一种方式为客户端控件获取方式,通过文献元数据页面内嵌的一个控件,模拟人们登录原文数据库和搜索原文的过程,返回文献正文的链接地址。这两种方式完成的目标是一样的,区别在于任务是由服务器端来处理还是由客户端来处理。非自己购买的科技信息资源为避免版权问题,可以采用各种文献资源的搜索服务和元数据同构展示,需要全文服务的,利用自动文献传递的方式获得,以避免版权纠纷,保证人们的利益最大化。

5科技信息资源共建共享平台建设的建议

将平台各联合体的数据库资源在科技信息资源共建共享平台上实现整合,发挥各协作馆印刷性文献、电子型文献和网络信息资源的优势,加强交流和合作,按统一的标准加以整合,建立起互惠互利的信息资源共享关系,构建印刷型资源和数字化资源并存的信息资源共建共享体系。通过1年的建设,基本建成覆盖科技信息资源领域的、较完整的、适应科技创新要求的、具有区域特色的科技信息资源保障体系。

5.1建立共享组织体制和工作机制

加强对科技信息资源共建共享的协作机制的建设,建立分布式数字资源加工、集中元数据存储检索服务、分布式全文提供和原文传递的共建共享组织体制和工作机制,成立科技信息资源共建共享协会,共同组织实施。

5.2建立分类科学、配置合理的科技信息资源保障体系

整合全省各种来源、各种媒体、各种类型的科技信息资源,建立与各资源中心发展相适应的、各学科文献资源相对齐全、文献类型覆盖期刊、图书、专利、标准、学位论文、会议论文、检索数据库等的共享的、分布式的大型科技信息数据库群,建立分类科学、配置合理、共建共享、服务于科技的信息资源保障体系。

5.3建立共建共享的科技信息服务技术支撑平台

建立软件技术支撑平台,实现各科技资源成员单位的本地数据标引、加工与全文电子资源制作;完成集中元数据管理、资源整合与统一服务;实现元数据、全文信息的无障碍传递;形成统一的、安全的资源管理、整合和信息服务平台。

5.4建立完善的平台标准规范体系

(1)规范平台的建设标准制定合理的平台总体框架、技术标准规范、平台扩展规范、数据库接口规范等,规范跨平台的数据共享。(2)对平台的信息资源进行规范制定平台元数据标准,以便建立相应的基本元数据规范,包括格式定义、语义定义、开放标记规范、扩展规则等。(3)规范平台的服务标准制定平台的应用服务规范、检索服务规范等,规范平台提供的查新、检索以及科技咨询等服务,提高信息服务水平。

5.5建立资源共建共享协调机制

要实现跨系统、跨区域的科技资源共享,就要成立由政府部门牵头或指定的跨系统、跨区域的协调机构,解决管理体制带来的障碍。这样不仅能解决资金紧张问题,而且可避免资源的重复建设。