大数据库建设方案十篇

时间:2023-06-01 10:42:51

大数据库建设方案

大数据库建设方案篇1

数据库是计算机组织信息的一种重要形式,利用数据库组织信息,有方便检索、数据冗余小等优点。

对于拥有庞大信息的档案管理部门,利用数据库技术来组织管理检索档案信息是一种必然的方式。然而在20世纪90年代以前,档案部门利用数据库技术仅仅是为辅助手工管理档案信息。利用计算机检索速度快,查全率和查准率比较高的特点,对纸质的档案进行快速检索,查询出纸质档案实体在库房中的位置,然后提供给用户。数据库系统仅仅起了一个辅助查找的作用。

20世纪90年代以后,伴随着互联网的迅速发展,数据库技术和Web技术迅速结合在一起,形成了网络数据库。网络数据库的出现,使人们发现了它的许多优势:使用便捷,界面友好,无时空限制,可同时多人取用,不受地理位置和档案馆开放时间限制;网络数据库不需要占用档案馆存贮的空间?熏不需要专门的数据库更新和维护人员;网络数据库制作数据标准、规范、多元,采用先进的信息处理技术,使用用户常见的浏览器,采取多途径多功能检索模块,检索功能强,检索显示与输出结果灵活多样。由于网络数据库的这些特点,所以发展网络数据库已经成为图书馆、情报等信息服务业共同追求的目标,万方、维普的成功充分说明了这一点。

数据库技术和网络技术结合,为信息服务业带来了新的发展方向,也为档案事业的发展带来了契机。如果说以前利用数据库进行检索仅是为辅助计算机管理,那么,今天开发数据库产品将是档案部门服务社会的主要形式。如果说档案馆的库房是档案信息的宝库的话,那么网络技术和数据库技术就是开启这个宝库的金钥匙。在网络时代,通过网络进行档案资料进行目录检索或者进行全文检索将是档案馆对外服务的主要形式,那种坐等用户上门的服务方式必然会被社会抛弃。因此,档案馆必须改变观念,重视网络数据库的开发和建设,加强数据库建设是档案工作能否为社会有效服务的关键问题。

我国档案数据库建设中存在的问题

进入21世纪后,档案工作的信息化建设成为档案工作的主要任务,许多档案馆开始进行数字档案馆建设,有的档案馆自己开发软件,有的档案馆购买软件,努力提高档案管理的现代化水平。但无论采用何种形式,其核心都是把档案转化为计算机数据库中的数据,方便用户检索利用,所以档案信息化的核心问题实际表现为档案数据库的建设问题。但是,许多档案馆由于认识或技术等方面一系列的问题,在档案数据库建设方面存在一系列的问题:

(一)数据库功能不完善

许多档案馆在进行数据库建设时,没有经过充分的论证和准备,大多数档案馆仅仅是买一套档案管理软件或者由自己的工作人员开发一套软件,就进行数据库的建设。这样的结果,必然导致数据库的功能不完善。如数据库引擎的选择,有的单位选择的一些桌面型的数据库产品,如Access或Foxpro等,基于这样的数据库引擎建立的数据库系统,在数据量较小时还可以满足查询需求,但在数据量较大时,则表现为查询速度慢,索引文件易被破坏等问题;另外,有的档案馆的数据库系统采取了集中式或C/S式的系统结构,这样的结构虽能满足馆内工作人员的查询需求,但对于Internet越来越普及的今天,却无法满足用户的异地异构查询,使数据库的功能发挥受到很大的限制;有的单位的数据库在设计时没有考虑到将来的发展,没有数据导入导出功能,更不能支持XML,一旦系统升级,原有的数据将无法使用;有的单位的数据库没有严格的安全保密管理措施,没有严格的权限管理、没有将开放档案和不开放档案分开,而是混合放在一个数据库中。这些有安全隐患的计算机也只能在本单位内部使用,根本无法对外提供服务。

(二)重视软、硬件投入,忽视数据库产品建设

档案馆在进行数据库建设时,普遍存在着重视软硬件网络环境的投入,忽视数据库产品建设的现象。许多档案馆的领导认为,信息化建设就是买计算机、建网络、买软件,一旦数据库的软硬件环境和系统建立起来后,就不再抓后期工作了。其实,数据库建设应该分为两个方面,一是数据库系统建设,二是数据库产品建设。前一项是基础,后一项是目的,建立一套数据库系统,仅仅完成了数据库建设的一半,后一项内容,就是将档案信息录入到档案数据库系统中,形成一个可供人们查询的资源库,才是数据库系统建立的真正目的。如果做不到后者,那么前者的一切开发和投入都是无效的。

(三)片面重视指标、忽视服务效能

档案馆在创建数据库时,普遍存在片面重视指标的现象。表现在:一是盲目建设数据库,不看社会需求,不看服务效能。如某市档案馆在建设计算机数据库时,还是建立案卷级目录,笔者曾问馆长,档案馆已经有了纸质的案卷目录,为什么不做文件级的著录标引,而做重复劳动?馆长回答是为了定级检查时能达到相应的指标。现在档案馆的升级、定级工作已经停止,但许多省市档案馆又提出了目标管理,这种不做合理规划、忽视服务效能、盲目建库的现象仍有存在。二是盲目追求数据量,忽视数据的质量。数据库作用的发挥是以数据的丰富程度为基础的,但在充实数据的同时,对录入到数据库中的每条记录都要认真核对,力求做到准确、完整。但许多档案馆为了达标,临时搞突击,录入员大都是临时工、学生,盲目追求输入的条目数量,不看质量,不重效果。录入的数据质量下降,使得整个数据库的质量下降,无法达到原有的目的。

(四)数据库建设缺乏持久性

数据库以数据的丰富性、可用性为准则,数据越丰富,越能反映最新的变化,其可用性就强。而数据的丰富是需要长期的积累的,不能一蹴而就。在数据库建设中,数据的录入是一个量大而烦琐的工作,必须要有充分的准备,但是有的档案馆因为已有的档案文件太多,要把它们全部输入到计算机难度太大,干脆就放弃数据的录入。有的档案馆因为数据录入的速度慢,已有档案的数据还没有录入数据库,又有新的档案接收进馆,积累的工作量越来越多,而放弃输入。如果因为数据的录入问题而放弃,那么以前的工作都会变得毫无价值。

发展对策

1. 加强培养专业化人才队伍,完善数据库系统的功能

档案数据库建设是一个很复杂的过程,数据库建设的技术层面涉及到数据库管理系统的设计、系统结构的选择、数据接口的选择等一系列工作,信息加工层面涉及到档案管理的各个业务环节,包括档案的著录、标引、档案元数据标准的制定、文件格式的转换等内容。一旦建成,想要对数据库系统进行更换就要付出很大的代价。因此,档案部门在进行数据库建设时,需要多方论证,既考虑到当前的需要,又考虑未来的发展。每个档案馆都应培养一批专业技术人员,这些人员既要懂得计算机、网络、数据库发展的最新技术,又要熟悉档案管理的各个环节,让专业人才参与到数据库的开发建设工作中,这样建立的数据库系统才是功能完善的数据库系统。

2.合理规划,杜绝短期行为

档案数据库建设,是一项长期而持久的工作,作为档案管理部门,在进行数据库建设时,要有规划地形成数据库产品。首先要进行调查研究,要进行用户需求分析、本馆保存的档案状况分析、投入效益分析等;其次在调查研究的基础上,进行合理规划,确定要进行哪些数据库建设,是先建设文件级目录数据库、还是建设全文数据库,前期投入多少人员和时间进行数据的加工和录入,以后投入多少人员进行维护等等。科学选题、合理规划、分清轻重缓急,循序渐进,杜绝短期行为的发生。

3. 建立健全数据库数据质量控制体系,把好数据质量关

数据库只有在达到数据的丰富性、准确性后,才能吸引用户,档案部门在进行数据库建设时,要狠抓质量,把好质量关。现在的档案馆在录入数据时,往往聘请临时工来完成,没有严格把关,使得数据准确率下降,可信度降低,严重影响了数据库产品的质量。因此,在丰富数据的同时,档案部门应建立健全数据库数据质量控制体系,如数据的准确性检查、著录标引数据的核对检查,确定相应的指标,把错误率控制在最低点,以确保数据的质量。

4.开拓档案数据库市场,推动数据库产品商品化进程

借鉴图书、情报部门成功的经验,档案数据库建设要立足于社会,以需求为导向,减少盲目建设,增强市场竞争能力。还要加强数据库产品的促销活动,通过宣传、演示,扩大影响,努力推动档案数据库的商品化进程。商品化不足使得档案馆只有投入,没有收入,造成积极性受挫、建库资金短缺等问题,进而使数据库不能得到很好的维护,使数据库生产周期长、更新慢、数据缺乏新颖性、时效性、降低了对用户的吸引力,造成非良性循环。因此,必须促进档案数据库产品的商品化,开拓档案数据库市场,以数据库养数据库,形成一个良性循环,档案数据库建设才能有持久发展的动力。?笮

参考文献:

浙江省档案数据库建设调查组,档案信息化建设 数据质量是关键,《档案学研究》2002.3

赵梅,论档案信息数据库的开发,《档案管理》,2002.3

大数据库建设方案篇2

关键词:建设单位档案管理网络化

前言

建设单位档案管理系统是建设单位不可缺少的部分,它的内容对于单位的决策者和管理者来说都至关重要,所以档案管理系统应该能够为用户提供充足的信息和快捷的查询手段。但一直以来人们使用传统人工的方式管理文件档案,这种管理方式存在着许多缺点,如:效率低、保密性差,另外时间一长,将产生大量的文件和数据,这对于查找、更新和维护都带来了不少的困难。

随着科学技术的不断提高,计算机科学日渐成熟,其强大的功能已为人们深刻认识,它已进入人类社会的各个领域并发挥着越来越重要的作用。作为计算机应用的一部分,使用计算机对档案信息进行网络化管理,具有手工管理所无法比拟的优点。例如:检索迅速、查找方便、可靠性高、存储量大、保密性好、寿命长、成本低等,还可实现共享查询。这些优点能够极大地提高建设单位档案管理的效率。虽然我国建设单位档案管理起步晚,经验不足,管理水平也不高,但建设建设单位档案馆(室)网络化的条件已经成熟。

一、建设单位档案管理的网络化条件已经具备

1.网络硬件的发展。90年代以来,我国先后筑建起中国互联网、中国教育科研网、中国科技网和中国金桥网并均与国际互联网接轨。就全国建设单位来看,90年已有许多单位开始使用计算机制图,到2000年以后许多单位已普遍使用计算机,并纷纷着手建设局域网。我国通讯技术的迅速发展和计算机网络建设的迅速崛起,为建设单位档案馆(室)网络化建设提供了前所未有的条件。

2.建设单位档案管理自动化建设初见成效。目前已开发出数千个自动化专用软件。许多档案馆(室)均采用比较成熟的计算机管理系统,已基本实现了收集、整理、编目、检索、利用等主要服务功能的自动化管理。自动化建设大大改善了档案馆(室)的服务手段,提高了服务质量和工作效率,促进了各项标准的制定和完善。尤其可喜的是,计算机应用正在改变着档案人员的观念,锻炼和培养出了一批计算机系统开发、维护和应用人才。数据库建设也具备了一定的规模。所有这些为档案馆网络化建设提供了有利条件和强有力的技术保证。

二、建设单位档案馆(室)网络化建设中存在的问题

1.由于历史的原因,建设单位档案馆(室)自动化建设走的是一条各自为政、自给自足的发展道路。各个档案馆(室)根据自己的经济实力和技术条件选择硬件设备,机型五花八门,水平参差不齐。目前研制出的不少档案馆系统应用软件,都没有遵循国际标准,功能单一、标准化水平低,数据不完整,致使大多数档案馆无主题标引,共享性差。而国家至今没有统一的发展规划和标准,各馆的发展存在着很大盲目性。所以标准化水平低。

2.虽然经过多年的努力,建设单位档案馆大都建成了规模大小不等的档案数据库。由于各个档案馆各自为政,在建库过程中,数据库大多自建自用,建成的数据库规模小,标准化程度低,类型单一,而且大多处于低水平重复建设,数据无规范化控制,商业服务水平差。大多数据库仅仅供本单位使用,严重地影响了数据库的利用率。所以数据库建设滞后。

3.在档案馆现代化建设中,人是最关键的因素,网络化的实现和管理都离不开人,各种技术以及软硬件都必须通过档案人员才能发挥作用。档案馆网络化建设,对档案人员提出了更高的要求——不仅要精通传统的档案业务,而且必须掌握自动化网络化技术,成为信息和知识的导航员。目前建设单位档案队伍整体素质仍普遍较低,不适应高速发展的计算机工作环境,馆(室)内严重缺乏既懂计算机技术、通讯技术、网络技术,又精通档案业务的复合型人才,不适应档案网络化建设和建设单位档案事业发展的需要。所以,人员整体素质需要提高。

三、建设单位档案馆(室)网络化建设的构想

1.建立建设单位档案馆网络化协调机构。建议由建设部牵头组织建设单位档案馆网络化协调机构,从行政和技术两个方面统一指导和规划建设单位档案馆自动化网络化建设,制定一系列有实际约束力的规范和标准,特别应该制定出网络化发展各阶段的规划,既有近期又有远期的目标,以对全国建设单位档案馆网络化工作进行实质性领导,统一思想,协调行动,开发高质量的应用软件,集中人力和资金建设大型文献数据库、全文数据库以及多媒体数据库,破除那种传统的自成一统、条块分割、各自为政的局面。

2.加强标准化建设。标准化是自动化网络化的前提。建设单位档案馆网络化协调机构集有关专家,共同酝酿制订档案的有关业务工作、技术方法以及设备等方面的统一原则和规范,并根据国际、国内标准及行业发展趋势,制定出网络化过程中各高校共同遵守的各项标准,如网络通讯及数据库方面的标准、计算机硬件及软件系统的标准等,这样可以在向资源共享过渡时少走弯路,避免人力、物力、财力的浪费。各建设单位在协调组织的领导下,选用统一的高质量应用软件,建立标准化的数据库。

3.开发馆藏资源,加强数据库建设。数据库是档案馆网络建设的重要组成部分,是网络的信息资源。要加强网络建设,必须加强数据库建设。数据库的建设要以国际、国家标准为依据,集中人力、物力、财力建成若干个标准化、通用性好的文件条目数据库、全文数据库、多媒体数据库。同时各馆应扬长避短,充分利用馆藏档案信息资源的优势,建立有自己特色的数据库,改变目前力量分散、低水平重复建设的局面。另一方面要抓紧对小型数据库的规范化、标准化改造,增加数据库容量,提高数据库的上网率。此外还要加强对数据库的维护工作,保证数据质量和完整。当然数据库的建设应与网络建设配套进行。

4.培养网络化人才。档案馆自动化网络化的发展,迫切需要一大批既懂技术又精通档案业务的高层次信息人员,为此要加快培养掌握现代信息技术的高层次信息人员,加强对在职人员的继续教育和培训,更新其知识结构,提高其业务水平,使他们尽快掌握计算机网络及相关技术。还要努力引进或选调计算机专业人才,对他们进行档案业务知识的培训,使之尽快适应档案馆网络化工作。

信息社会把建设单位档案馆推进一个新的发展时期。面向21世纪,面对信息技术的挑战,建设单位档案馆必须真正实现网络化,大力进行网络资源建设,并与互连网接轨,全面实现资源共享,为建设单位及社会提供丰富的信息资源和最优质的服务,使档案馆的服务走向全方位现代化。

参考文献:

大数据库建设方案篇3

关键词:档案管理;企业;数据库;理论

在当前市场经济的不断发展中,企业为了增强其在市场中的竞争能力也在不断的追求着各种变化和管理手段的更新,档案数据管理作为当前计算机技术在管理过程中的不断应用逐步出现了管理模式的加快和进程的变化过程。数据库管理系统(DBMS)本质上就是管理所用的工具和平台,其数据结构、类型、内容范围等关键要素都必须依靠档案基本管理理论提供的营养来进行保障,也是我们平常所说的业务支撑。

一、档案分类理论对档案数据库的建设起着导向作用

从管理学上讲,任何管理活动,抛开其最终目的,其最基本的目的或者基本要求都是要使被管理对象有序化,档案管理的基本目的就是要使档案有序化,包括档案实体管理和信息管理的有序化。将数量庞大、内容形式复杂多样的档案有序化的具体方法很多,但最基本的方法就是分类,即“对档案总体进行分割、划分,将其分为若干层次、大小不同的部分或门类、种类、类别,然后对这些不同的部分、门类、类别等实施分别管理。”“这实质上也是人类社会所有管理活动乃至认识活动的基本方法。”正因为如此,“说得笼统一点,档案管理理论上的所有能称得上‘重大’的分歧和争论,大都围绕着分类方法展开。”①

一般来说,对档案的实体管理基本采用了历史主义的分类方法,大体都按全宗进行排架整理;而档案内容信息的管理则可以同时采用两种方法,一般以逻辑主义分类方法为主。在档案数据库建设中,一般是在来源单位层次上建立实体数据库,实际上是将一个全宗(一般是档案室层次)或全宗群(一般是档案馆层次)作为建库范围,同时利用视图、索引等数据库对象对内容实施逻辑管理,使档案管理理论中的“二元主义”得以在数据库建设中融合。

二、全宗原则及其理论发展对档案数据库建设发挥指导作用

在社会的现代化发展过程中软件管理以成为当前计算机发展的主要因素和发展前提。由于当前软管管理的过程中切法统一性和系统性,使得当前档案管理过程中存在着不同的差异。

首先,全宗原则是档案实体分类的基本方法,是人们经过理论分析和实证研究之后得出的宝贵经验。以全宗为基本单位建设档案数据库,数据库内容反映的是一个现实的实体单位的历史记录,保证了档案数据具有一个坚实可靠的立足点,这是单纯地依靠逻辑分类方法所达不到的。

其次,采用全宗原则指导建设档案数据库,能够最大限度地维护档案的原始记录性。因为全宗作为一个独立组织或个人形成档案的全部,是一个不可分散、不可打乱混淆的有机整体,这样能够最大限度地维护和保持档案的本质特性――原始记录性,这也是档案信息在管理组织上独树一帜、不同于图书、资料、情报等文献的根本原因。档案数据库作为档案信息管理的重要工具和手段,必须服从这一更高的管理目的。良好的数据库设计可以将全宗原则的诸多思想在档案数据库建设中实现,包括全宗内部管理层次、管理联系等。像文书立卷工作中要求的“保持文件之间的历史联系”、科技档案管理中的“成套性原则”等思想都可以通过数据库的设计得以体现。

第三,依据全宗理论进行档案数据库建设,有利于数据库的建设与维护工作。按照这种思路进行档案数据库建设在多数情况下能够保证数据库的建设者、管理者、拥有者、维护者是统一的,数据库建设各方的利益是一致的,有助于保证档案数据库建设的动力、资金以及作用的发挥。

值得注意的是,虽然全宗原则是档案管理的基本原则和方法,但它并不能解决档案管理的所有问题。由于社会实践的不断发展,全宗原则面临不少新的挑战,也因此得到新的发展,这些发展对档案数据库的建设同样产生了具体的影响。

1、全宗内部档案的差异化管理需求要求建立相对独立的档案数据库。

虽然全宗原则强调一个来源单位的档案应当集中保管,但也没有忽视对同一来源档案之间的差异化管理。随着社会实践的发展,同一全宗内档案的种类、载体类型及其管理要求日益多样化、复杂化、专门化,这使得对全宗的集中统一保管难以实施。在档案实体管理范畴,同一全宗内就有可能出现纸张、照片、录音带、录像带、磁盘、光盘、缩微胶片等多种载体,其中相当一部分特殊载体的档案在保管利用上都有特殊要求,因此往往需要将其组织为一个单独的管理体系,设置专门机构,提供专门的库房和设备,虽然可以在编号系统中设置它们与全宗的关系,但在实体管理层面上已经不具有严格的不可分散性。在档案信息管理范畴,由于不同门类档案的管理差异,同一全宗内不同类别的档案也多采取分别管理的措施,比较典型的像人事档案、会计档案等由于具有不同于其他档案的管理要求,采取由人事部门、财务部门单独保管的管理方式。

2、自由来源原则为专门档案的数据库建设提供理论基础。

自由来源原则认为全宗不仅是历史性、客观性的,也可以是逻辑性的,这是对全宗理论的重大发展。像许多行业性、专业性很强的档案就要求打破传统全宗范围的限制,而按照行业或专业系统进行集中统一管理。比如城建档案、项目档案虽然破坏了各项目参与组织全宗的完整性,但却有效地维护了项目档案的完整性。在多数情况下保证后者的完整性具有更为重要的现实意义。这里的工程项目就是一个逻辑意义上的全宗单位,由此可见,全宗理论在其本身的发展过程中存在分合的演化过程,并不完全拘泥于狭义的全宗概念。

三、逻辑主义分类思路适合档案数据库的内容管理

逻辑分类法在档案数据库的内容管理中有着非常普遍的应用。我们知道,档案的实体整理必须按照其形成时的本来面貌去管理,但档案内容信息是极为丰富多彩的,人们对这些内容的需求也是多样化的,但和现实世界中档案实体的排序只能有一种一样,在数据库中我们一般通过有限的基本表来反映档案实体的记录信息。

大数据库建设方案篇4

为了方便档案利用者查阅档案原文,实现馆际档案信息资源的交流与共享,提高档案利用和编研工作的效率,不少综合档案馆和文件利用中心已建立档案内容数据库,并取得很好的应用效果。企业也要重视和开展建立档案内容数据库的工作。

近年,随着新的文书档案整理规则在企业推广应用,很多企业的文书档案管理开始采用文件级管理,因而在企业建立档案目录数据库过程中,增加了文件级文书档案目录数据库的内容。文件级档案目录数据库的建立可方便利用者直接查找到所需要的文件。但是建立文件级档案目录数据库在方便利用者利用档案方面还是有限的,因为文件级档案目录数据库的功能只能解决档案利用中的文件检索问题,不能解决方便档案利用的其他问题,例如,不能解决利用者不到档案室就能够查阅文件原文的问题。

随着企业信息化管理的不断深入,越来越多的企业建立了局域网,推行OA系统,实现无纸化办公,档案利用者可以在自己的办公室里借助档案管理部门在网络上的档案目录,通过计算机十分方便地查找到所需要的档案,改变以往利用者必须到档案室才能查阅档案目录、检索档案费时费事的状况。然而,档案目录上网也只能使档案的检索更方便、更快捷,利用者仍然必须到档案室才能查阅到档案原文,这不能不说仍然是一件遗憾的事。

利用者查找档案目录的最终目的是要通过查找档案目录的途径实现查阅档案原文的目的。如果企业档案管理部门能够想办法通过自身不懈的努力,使档案利用者借助计算机局域网不仅能够查找到所需要的档案目录,而且能够直接查阅到所需要的档案原文,就可以弥补这一缺憾,就可以在方便利用者利用档案方面做得更加彻底、更加完美。这个办法就是要在企业建立档案内容数据库(俗称原文数据库),并让其上网。

建立企业档案内容数据库还可以为实现全文检索创造条件,为档案利用者提供更便捷的档案检索途径;还可以实现最大限度的档案信息资源的交流与共享,在较大范围内充分发挥企业档案信息资源的作用。建立企业档案内容数据库的另一个好处是,在建立企业档案内容数据库的过程中,通过扫描的文件材料经OCR识别后,可以很方便地转换为可编辑的Word文档,这些文档连同其他文字信息和影像信息给档案利用者对档案材料的选取或引用带来极大的方便,能最大限度地满足档案利用者的需求。

如上所述,笔者认为,随着档案信息化建设步伐的快速推进,企业信息化管理工作的深入开展,为了进一步做好企业档案的利用工作,提高企业档案管理水平,企业有必要建立档案内容数据库。

二、建库的方法

企业建立档案内容数据库通常是采用数据导入和原文扫描两种方法。为提高建库效率,在建库时应遵循“能导则导,不能导则扫,先导后扫”的原则。例如,对实行文档一体化管理的企业,以及实现办公自动化、无纸化办公的企业,在建立文件数据库时,应当充分利用企业已有的档案信息资源,将办公系统中的文件内容直接导入到档案管理系统中来,避免重复劳动。即使在必须采用原文扫描的方法才能建库的情况下,也应该充分发挥档案管理软件批量扫描的功能,尽可能采用高速扫描仪进行扫描,因为这样做可以大大提高扫描的质量和工作效率。

在建库的过程中,还应尽量采用先易后难、因陋就简的方法。尽管各个企业千差万别,档案的种类繁多,但纵观企业档案的种类,大致可分为三大部分:文字部分,其主体是企业形成的文件;图形部分,其主体是企业形成的图纸;影像部分,其主体是企业的荣誉档案、音像档案。在一般情况下,企业可按照档案的不同种类,分别建立起文件数据库,图纸数据库和音像数据库,然后再通过档案号或其他媒介与档案目录数据库相连接,共同构建企业档案信息化的网络格局。在建库的顺序方面,应考虑档案内容数据库的利用率和难易程度,例如,对生产型的企业而言,通常可先考虑建立文件数据库,再建立音像数据库,最后建立图纸数据库,因为建立图纸数据库的工作量较大,而且需要能实现光栅―矢量转换的专门图形处理软件。此外,各个企业可根据自身的特点和规模的大小选择建立各自的档案内容数据库,例如,对经营型的企业而言,可以不考虑建立图纸数据库;对小企业而言,可以不考虑单独建立档案内容数据库,而考虑采用挂接的方法,把相关的档案内容直接挂接到档案目录数据库里相应的条目中去。

三、应该做好的几项工作

为了进一步建好企业档案内容数据库,笔者认为还应该注意做好以下几项工作:

1. 做好文件材料入库前的鉴别工作。在建立档案内容数据库之前,最好应对档案进行鉴定,剔除不应归档的内容。同时,与综合档案馆和文件利用中心建立档案内容数据库的情况相类似,企业在建立档案内容数据库的过程中,即使是应当归档的文件材料也绝不可能一次性都进入档案内容数据库。究竟应该让哪些文件材料先入库呢?这就有一个文件材料入库前的鉴别问题。尽管这个问题的重要性不能与档案进馆前和档案销毁前的鉴定工作相提并论,但对建立档案内容数据库而言,这是一个必须首先要解决的问题。

如前所述,企业建立档案内容数据库的主要目的是方便利用者利用档案,但由于企业档案管理的某些特殊性,在考虑文件材料入库时至少要妥善处理好两个关系。首先是要处理好方便利用与建库成本的关系,优先考虑让利用频率较高、保存价值较大的文件材料先入库。例如,以文书档案为例,应让永久保存的文书档案先入库,再考虑长期保存的文书档案的入库问题,短期保存的文书档案再次之;对于保管期限将至、临近失去保存价值的文书档案就可以不考虑入库,以节省建库成本。其次是要处理好方便利用与保密的关系,以维护企业的合法权益。例如,被企业确定为内部事项以及密级的文件材料,或设专柜保管的文件材料,如企业高层会议记录,现行的印模原件,企业的核心技术、专有技术的档案,会计档案等均不宜入库。

2. 做好科学化、规范化的建库工作。建立企业档案内容数据库是一项专业性、技术性很强的工作,建库过程中会遇到很多问题,而这些问题基本上都可以在上级档案部门下发的文件或标准中找到相应的解决办法。实践证明,这些办法都是非常科学的、规范的、有效的,其中包含着前人极其丰富的建库经验,能够帮助企业建立科学的、规范的、实用的档案内容数据库。如果企业各行其是,自搞一套,一定是事倍功半,既浪费人力、物力、财力和时间,也不利于企业档案内容数据库的管理、交流和信息共享。

因此,企业在建立档案内容数据库时,一定要严格遵守上级档案行政管理部门有关建立档案内容数据库的各种规定。例如,《电子文件归档与管理规范(GB/T18894-2002)》规定,文字型电子文件以XTL、RTF、TXT为通用格式,扫描型电子文件以JPEG、TIFF为通用格式,视频和多媒体电子文件以MPEG、AVI为通用格式,音频电子文件以WAV、MP3为通用格式以及有关电子文件稿本代码的规定,电子文件类别代码的规定等等,凡此种种,企业在建立档案内容数据库时都应该严格遵照执行,努力建立起科学的、规范的企业档案内容数据库。

3. 做好档案利用权限的管理工作。大家知道,由于企业档案的特殊性,在档案利用方面,除了依照《档案法》应该向社会开放档案外,其余的档案在一定的时间内都有一定的利用范围。我们所说的“方便档案利用者利用档案”,是有特定含义的,是指在一定的时间内为某一部分人在可利用的某一部分档案尽可能地提供方便;而对另一部分人要利用这部分档案不仅不能提供方便,而且要加以阻止。由于档案目录数据库的主要功能是方便档案利用者“查找档案”,而档案内容数据库的主要功能则是方便档案利用者“查阅档案”,二者的功能有很大的差异,因而在建立企业档案内容数据库时,要十分注意做好档案利用权限的管理工作。

大数据库建设方案篇5

[关键词]档案;数字化;建设;数据库;服务

随着信息技术的高速发展,推广应用使信息产业成为国民经济中最具有增长活力的部门和重要的支柱产业之一,与此同时信息技术的发展与广泛应用使档案数字化建设提上了日程,给档案工作带来了新的契机,信息技术的日新月异也给档案工作带来了新的研究课题,就是“档案数字化建设”。档案工作的数字化建设也是顺应潮流、适应时展的新举措、新要求。档案作为一种原生的信息资源,其重要性正日益凸显出来。面对这种挑战我们档案工作者应积极应对,我们要不断学习科学知识,逐步掌握信息技术为档案工作服务,为社会主义经济建设服务,为社会主义精神文明建设服务。

十五期间,我国将加快数字化档案馆的建设。由此,传统档案馆数字化建设的问题引起了人们的关注,并且有一些档案馆已经开始对此投资建设。我们认为,传统档案馆的数字之路并非一蹴而就,而是一个循序渐进的过程,对这个过程的各个环节进行深入的分析研究是十分必要的。只有在有了清楚认识的基础上,才能规划和解决好档案馆的数字化之路,为今后的数字化档案馆进而是数字档案馆、虚拟档案馆的建设打好基础。近年来,我们集团公司档案部门在数字化建设方面进行了积极的探索,取得了初步成效,在工作中数字化建设也给档案工作带来了极大的方便。

一、档案数字化建设的紧迫性

当今,人们的时间意识越来越强,领导做出重大决策需要迅速、准确;各职能部门工作查考要求快速及时;社会广大公众对档案信息需要量不断增加,迫使档案馆这个信息保管和提供利用的部门必须尽快改变传统的原始管理、检索和提供利用的手段,以现代化、多功能的服务措施,使档案馆馆藏的信息能及时、方便地提供给各方面的需求者。档案数字化,可改善档案管理工作。只有实现档案数字化,才能冲破档案利用的种种局限,使档案管理部门从封闭走向开放,从档案的保管和利用职能向信息采集、管理和服务职能转变,实现档案信息资源的合理配置、科学管理,为社会提供高效、优质的服务。

二、档案数字化建设的内容

1、数字化建设要着眼于提高系统的整体水平。档案数字化建设的着眼点应是整个系统,组成系统的纵向和横向的各个节点都应达到一定水平,并通过网络加以联通,这样才能发挥整体优势,提高系统的综合能力。部分节点甚至一个重要节点的障碍,都可能造成系统的梗阻。当然,要求每个节点的装备水平和应用能力齐头并进是不现实的,不可能“齐步走”。鼓励和支持先进单位提高水平,在一些单位进行较高水平的试点,以取得值推广的经验,对整个系统是有利的,但其基本出发点就是为了提高系统的整体水平,只有少数先进的节点不可能组成先进的系统。

2、推进档案数字化,必须提高档案标准化、规范化水平。目前,档案信息数字化的现状是档案标准化、规范化滞后和应用软件多乱,这些都严重影响了系统整体水平的提高。对这一问题取得共识是档案数字化建设思想上的一次飞跃,它使我们的观察视野从计算机系统扩大到整个档案信息管理。档案信息自动化的内涵包括档案工作的各个方面和各个环节,其中首要的是档案业务要规范,档案标准要建立健全和真正实施。档案标准和规范本身也是一个系统工程,要推进档案数字化建设,必须抓好档案标准化、规范化,掌握好两者相辅相成、互相促进的辩证关系。

3、有重点地抓好数据库建设。开发和建设数据库系统是国家档案信息工程的核心和基础,是工程的主体。数据库的含义是依托先进的信息技术对档案进行科学的管理和方便的使用。建立数据库系统是一项长期的任务,要经过由低到高、由单个到群体的循序渐进过程。经过实践我们认为建设数据库经验中最主要的有:领导重视,统一认识,坚持计算机技术人员同档案业务人员协同配合;面向应用,建立“活库”,以利用频率和使用效率考核数据库的“活性”;突出重点,由单一库向系统库发展等。当前若能把综合数据库的完善提高和各单位档案目标库建立起来,通过网络联接形成开放的分步式数据库群,将使自动化系统效率大大提高一步。

三、档案数字化建设的步骤

1、建立档案数据库。第一步,输入文件级目录。我们需把建馆开始的档案文件级目录输入数据库。在建立数据库的过程中,可边输入边打印,一方面补齐卷内文件目录,另一方面检验输入的正确性,从而确保档案数据库的真实性、完整性和有效性;第二步,采用扫描仪、数码相机等设备,实现原文件信息数字化。从实践看,档案数据库的建立大大提高了工作效率,利用者对公司档案馆的数字化建设十分满意。

2、加强电子文件的收集和积累工作。电子文件是未来馆藏数字档案最主要的来源。以前,各部门只移交纸质档案和纸质文件目录,现在我们要求各部门实行电子文件和纸质文件的归档双轨制,一般将电子文件拷贝两套,异地保存,并随纸质文件一并移交档案信息中心。这样既推进了机关档案室的电子化进程,又节省了建立数据库的工作量。

3、加大档案管理软件推广力度。电子文件是包括电子文件内容、电子文件载体和电子文件显示、修改的电子计算机软硬件平台的组合。由于种种原因,各进馆单位电子文件所依赖的软硬件平台不同,这给集成到档案数据库造成困难。对此,我们要高度重视,采取积极的措施予以解决。印发电子目录数据库结构与交换格式,对案卷级和文件级目录数据库结构的字段名称、类型、长度作出了规定,规范软件和数据格式,确保数据库的准确性和有效性。

大数据库建设方案篇6

一、建设高校档案馆网络化的条件已经成熟

1、通讯技术和计算机网络迅速发展据统计,至1998年底,我国已建成的公用电话网的装机总容量已达到了6134万门,长话线路已发展到35万条;中国校园公用数字网CHINADDN和中国公用分组交换网CHINAPAC已经相继开通,我国目前已有全国性、地方性的专用电话网300多个,网络的规模已排在世界电讯网的第六位,成为应用最广的联网工具。

90年代以来,我国先后筑建起中国互联网(Chinanet)、中国教育科研网(CERnet)、中国科技网(CSTnet)和中国金桥网(ChinaGBnet)并均与国际互联网Internet接轨。就全国高校来看,1994年以来,由于“211工程”和CERnet工程的促进,很多高校纷纷着手建设校园网,至1996年底,已有220所高校建成校园网并连入CERNET,其余800余所高校的校园网自2000年底开始陆续建成。我国通讯技术的迅速发展和计算机网络建设的迅速崛起,为高校档案馆网络化建设提供了前所未有的条件。

2、高校档案馆自动化建设初见成效自动化是高校档案馆走向网络化的必由之路。自八十年代后期以来,高校档案馆自动化建设经过10多年的努力,开发出数百个自动化专用软件。许多档案馆均采用比较成熟的计算机管理系统,已基本实现了收集、整理、编目、检索、利用等主要服务功能的自动化管理。自动化建设大大改善了档案馆的服务手段,提高了服务质量和工作效率,促进了各项标准的制定和完善。尤其可喜的是,计算机应用正在改变着档案人员的观念,锻炼和培养出了一批计算机系统开发、维护和应用人才。数据库建设也具备了一定的规模。所有这些为档案馆网络化建设提供了有利条件和强有力的技术保证。

3、经费紧张状况得到初步缓解经费不足是影响档案馆走向网络化的最大障碍。加大投入取决于学校领导对现代化档案馆地位和作用的认识程度。通过Internet、CERnet网可以看到,网络化的优越性和作用是巨大的,作为学校信息服务中心的档案馆,其地位和作用更加突出,学校领导和有关部门已经初步认识到档案馆网络建设的重要性和紧迫性。领导的重视,预示着经费的加大投入。档案馆自身通过多种创收渠道增加收入,增强了造血功能。近年来,许多高校拨专款给档案馆购置了性能较好的计算机、扫描仪、光盘刻录机、激光打印机等设备,基础设施建设得到了极大改观。

二、高校档案馆网络化建设中存在的问题

1、缺乏统一的网络化协调机构由于受高校管理体制和运行机制的影响,不同的高校隶属不同的行政主管部门,这种分散领导的管理体制,无形中使各高校档案馆形成了条块分割、自成系统、各自为政、自我完善、自我发展的自给自足的局面。虽然许多高校档案馆已意识到资源共享的重要与必要,但缺乏馆际合作的行动。而国家目前尚没有一个统一的组织机构来规划协调档案馆网络化建设和资源共享工作。大多数档案馆仍然是采取封闭式的办馆方式,无论是软硬件的购置,还是数据库的建设,都处于各自为政的低水平重复状态,这不仅造成了人力物力的巨大浪费,也影响了我国档案馆的标准化、自动化和网络化的进程。

2、标准化水平低由于历史的原因,高校档案馆自动化建设走的是一条各自为政、自给自足的发展道路。各个档案馆根据自己的经济实力和技术条件选择硬件设备,机型五花八门,水平参差不齐。目前研制出的不少档案馆系统应用软件,都没有遵循国际标准,功能单

一、标准化水平低,数据不完整,致使大多数档案馆无主题标引,共享性差。而国家至今没有统一的发展规划和标准,各馆的发展存在着很大盲目性。这种状况发展下去,势必给档案网络化建设和资源共享造成隐患。本文来自:了

3、数据库建设滞后经过多年的努力,高校档案馆大都建成规模大小不等的档案数据库。由于各个档案馆各自为政,在建库过程中,各馆均有不同程度的浮躁情绪,急功近利倾向严重。主要表现在建库缺乏整体性,数据库大多自建自用,建成的数据库规模小,标准化程度低,类型单一,而且大多处于低水平重复建设,数据无规范化控制,商业服务水平差。大多数据库仅仅供本单位使用,严重地影响了数据库的利用率。而且目前高校档案馆所建的数据库大多为条目数据库,缺少全文数据库和多媒体数据库,无法满足用户的多种需求。许多高校档案馆虽与Cernet和Internet联网,但只能访问其主页,根本无实质性的资源可共享。

4、经费保障率低目前虽然硬件的质量在不断提高而价格在不断下跌,但档案馆网络化的实现仍然需要投入大量的资金。目前高校档案馆的经费投入较少,用于档案馆网络化建设的经费非常有限,无法购置好的硬软件,建立高起点的档案馆网络,更谈不上对设备的及时更新。目前经费仍是影响高校档案馆网络化发展的最大障碍。

5、人员整体素质低弱在档案馆现代化建设中,人是最关键的因素,网络化的实现和管理都离不开人,各种技术以及软硬件都必须通过档案人员才能发挥作用。档案馆网络化建设,对档案人员提出了更高的要求--不仅要精通传统的档案业务,而且必须掌握自动化网络化技术,成为信息和知识的导航员。目前高校档案队伍整体素质仍普遍较低,不适应高速发展的计算机工作环境,馆内严重缺乏既懂计算机技术、通讯技术、网络技术,又精通档案业务的复合型人才,不适应档案网络化建设和高校档案事业发展的需要。

三、高校档案馆网络化建设的构想本文来自:

1、建立高校档案馆网络化协调机构。建议由教育部牵头组织高校档案馆网络化协调机构,从行政和技术两个方面统一指导和规划高校档案馆自动化网络化建设,制定一系列有实际约束力的规范和标准,特别应该制定出网络化发展各阶段的规划,既有近期又有远期的目标,以对全国高校档案馆网络化工作进行实质性领导,统一思想,协调行动,开发高质量的应用软件,集中人力和资金建设大型文献数据库、全文数据库以及多媒体数据库,破除那种传统的自成一统、条块分割、各自为政的局面,打破片面追求“大而全”、“小而全”的思想观念,真正实现高校档案信息资源共享。

2、加强标准化建设标准化是自动化网络化的前提。高校档案馆网络化协调机构集有关专家,共同酝酿制订档案的有关业务工作、技术方法以及设备等方面的统一原则和规范,并根据国际、国内标准及行业发展趋势,制定出网络化过程中各高校共同遵守的各项标准,如网络通讯及数据库方面的标准、计算机硬件及软件系统的标准、网络传输的标准、机读格式、著录规则的标准、文献标引的标准等,这样可以在向资源共享过渡时少走弯路,避免人力、物力、财力的浪费。各高校在协调组织的领导下,选用统一的高质量应用软件,建立标准化的数据库。本文来自:

3、开发馆藏资源,加强数据库建设数据库是档案馆网络建设的重要组成部分,是网络的信息资源。要加强网络建设,必须加强数据库建设。数据库的建设要以国际、国家标准为依据,集中人力、物力、财力建成若干个标准化、通用性好的文件条目数据库、全文数据库、多媒体数据库。同时各馆应扬长避短,充分利用馆藏档案信息资源的优势,建立有自己特色的数据库,改变目前力量分散、低水平重复建设的局面。另一方面要抓紧对小型数据库的规范化、标准化改造,增加数据库容量,提高数据库的上网率。此外还要加强对数据库的维护工作,保证数据质量和完整。当然数据库的建设应与网络建设配套进行。

大数据库建设方案篇7

一、建立档案编研选材数据库的必要性

(一)档案编研工作实际的需要。目前,各级档案馆在进行编研选题的时候,普遍存在主观随意性较大的问题,其中一个重要原因就是没有充分了解馆藏内容,致使编研选题与馆藏内容相脱离,因而编出的编研材料价值不大、参考性不强、实用性不高。在馆藏数量巨大而且逐年上升的形势下,建立编研选材数据库,可以帮助我们深入了解馆藏档案内容,更加科学合理地确定编研选题,真实准确、齐全完整、系统丰富地选择材料进行编辑加工等工作。

(二)开展网络档案编研的前提。网络环境下,我们可以将编研选材数据库在网上,为编者提供材料线索。部分网络编辑系统还可提供“虚拟编辑室”,使得不同地域的编研人员共同完成同一个编研材料,这样,异地联合编研就可成为现实。同时,浏览者通过上网浏览得到所需的线索,也可以提高到档案馆进行实地查档的查档率。

(三)档案工作新形势的要求。建立编研选材数据库,为开发档案编研管理软件提供了数据支持,是档案编研工作向现代化、信息化、网络化迈进的基础。

二、建立档案编研选材数据库的形式

(一)档案文件目录数据库。就是把有研究参考价值、编研价值以及用于办展的档案的目录,按照一定的专题录入数据库,类似于我们常用的档案专题文件级目录数据库,比如我们档案馆的婚姻档案、房基地批示档案、招工档案等专题目录数据库。

(二)档案内容简介数据库。就是在目录数据库的基础上,增加档案内容简介字段,把一份文件中有价值的信息,利用主题词、关键词或内容概要等形式全部反映出来。这样不但可以检索到所需文件的题名,还可以对文件的内容进行全面的了解。

(三)档案原文检索数据库。在数据库中设置档案原文字段,档案原文的录入可分为嵌入式和链接式两种,嵌入式是直接在数据库中输入档案原文;链接式则是利用已建好的档案原文数据库,把档案原文链接到数据库中。这样当检索到所需文件后,不但可以查看档案内容概要,还可以直接打开档案原文,有用的内容可以直接下载、编辑加工利用,这样,编研工作效率就会大大提高。

从以上编研选材数据库的三种形式不难看出,建立文件目录数据库虽然简单,工作量也较少,但所含信息量也较少。比如北京市平谷区档案馆的文件级目录数据库中,一些早期形成的文件题名不很规范,不能准确全面地概括文件内容,检索利用时有些内容重要的档案就可能被遗漏。而档案全文数据库信息量大,如果没有已建好的全文检索数据库,建立这种全文数据库十分困难。随着文档一体化进程的加快,大量电子文件形成,为全文数据库的建立提供了便利。比如,目前我馆的文件目录数据库中已有条目近120万条,而且还会逐年增加,从实际出发,我觉得可以分阶段进行,首先建立文件目录数据库,然后逐渐扩充,添加内容,逐步形成档案内容简介数据库,乃至最终形成档案原文检索数据库。

三、建立档案编研选材数据库的步骤和方法

(一)对数据库的功能需求的调研。编研选材数据库一般容量较大,因此要具有较快的检索速度和较高的查全率、查准率,这样才能真正提高编研效率。将来开展网络编研是编研工作的趋势,不同的档案馆之间,档案馆、室之间,档案馆与社会有关部门之间都可以进行广泛的联合编研,因此编研选材数据库要适合在网络环境下使用,要具备较高的检索性能,便于实现数据库资源的信息共享。

(二)准备数据库材料。编研选材数据库的数据来源主要是馆藏档案和资料,现行文件中心的现行文件资料,档案室保存的档案信息,其他档案馆保存的资料,通过网络、公开出版物等途径获得的资料信息等。比如,目前我们已收集了档案馆的90多万条目录的综合数据库,基层档案室报送的30多万条的电子目录,为建立选材数据库做好了准备。

(三)数据库选型。数据库的类型有很多,比如Access、Datebase、SQL server等,一般应选择功能齐全、通用性强、兼容性能好的数据库。比如根据我馆的实际,可采用Access数据库格式,一是编研人员使用操作比较熟练,二是区档案馆、各单位档案室已建立的数据库也是这种格式,我们可以直接在原数据库上进行操作。

(四)数据库的设计。主要是设计字段和设置字段类型。根据实际需要可以设置档号、类别、文件题名、内容简介、时间、保管单位、档案原文等字段,其中要注意以下几点:

1、类别的设置是关键。可以按专题设置类别,如可以设置历史、地理、人文、自然、政治、经济、科技、教育、文化、综合类等专题。专题的设置要以实用为主,如果专题分得太多,就不容易辨别区分,不容易归类;如果专题分得太少,检索使用起来就不方便。因此,设计专题要做好广泛的调研并通过实践修改完善,也可以参考县志、百科全书的类目设置。由于类别字段较多,可以用代字或代号表示,并编制字段设计说明。

2、内容简介字段要设计成文本型。它是对文件内容进行准确、简要的概括,内容较单一的文件可以用主题词、关键词进行标注,内容较多的文件,可以编写摘要。标注内容简介是建立数据库的难点,工作量巨大不说,单就一份文件的内容来看,有的可能涉及政治、经济、文化、教育、体育等各个方面的重要信息,综合性文件可能还包含着历史、地理、自然等社会各个方面的信息,标注起来非常复杂。这就要求编研人员具备较高的判断、分析、研究能力,从一份文件材料中查找有利用价值信息,同时还要具备较好的总结、提炼、文字加工功底,全面细致准确地标注档案内容。

3、档案原文字段要设计成超级链接型。由于嵌入式档案原文所占空间较大,影响检索速度。档案的载体、类型又有文本、照片、声像等多种形式,因此,应采用超级链接方式链接档案原文。

(五)窗体界面的设计。设计窗体界面表文件,是为了方便输入文件内容简介和档案原文等字段的内容,主要设计类别、文件题名、内容简介、时间、档案原文等字段。

(六)数据库的实施。从实际情况来看,数据库的建立可以分步实施。

第一步是从原目录数据库中挑选出可用的条目,建立选材目录数据库。具体方法:可以在原数据库中设置“是否存留”和“类型”两个新的字段,然后就需要从头至尾浏览数据库,从中找出可用的条目,并在是否存留字段中标注“1”,同时在类型字段中标注应属于哪个类型,比如政治、经济、文化等类或用代号表示。数据库录入完成后,为方便使用,可以用检索工具,检索出所有“是否存留”字段中是“1”的条目,另建新库保存,也就是新建一个有用的数据库。

大数据库建设方案篇8

【摘 要 题】信息化与网络化建设

【关 键 词】数字图书馆/档案资料/全文检索

数字图书馆应用系统建设的目的就在于为用户提供数字化的信息内容服务。因而,科学的组织数字化的信息资源,进行信息资源建设,建立各类专题的全文及多媒体数据库,在网络环境下提供统一的信息内容服务是图书与档案资料数字化建设的核心。

浙江省水利河口研究院作为浙江省唯一的一家省级水利科研机构,主要从事河口与海岸规划、整治、开发和相关基础理论研究;水资源水环境、水土保持、农田水利、岩土工程、自动化信息等科学研究及技术服务;文献检索查新和科技情报服务等。我院在水利水电领域收集与积累了大量的科技文献资料、档案与图书,为全院及省水利系统各单位的领导、科技人员提供相关的信息咨询服务,并取得了一定的成绩。

近年来,随着网络技术的快速发展,我院各业务科室工作效率大大提高,传统的图书馆信息服务手段难以适应网络环境下快速、高效的文献资源获取的需要。另外,自从2001年电子政务建设的开展,国家水利部要求各省水利系统积极进行水利系统数据、文献与档案资料等信息资源的共享。我院作为浙江省水利系统检索查新工作站,如何将院内大量的科技文献、档案与图书等资料进行数字化管理与服务,在网络环境下进行信息资源高度共享就成为建设的重点,数字图书馆建设势在必行。

1 数字图书馆建设探索

1.1 方案规划

数字图书馆建设应以数据库建设为核心,以信息资源共享与网络信息服务为目的,在功能上涵盖信息采集、信息管理、信息服务整个过程。将不同途径、载体、数据类型的信息资源(馆藏文献、网络资源)按统一的格式、标准进行分类、标引建成数据库,通过全文检索、信息的动态、个性化信息服务将数据库中的信息出来。为实现这一目标,建成的数字图书馆应用系统平台应具备以下功能:(1)对纸介质的文献资料进行数字化加工与管理,并具备通用格式的文档转换及批量数据分类标引功能;(2)网上资源的快速智能化采集与获取;(3)对我院特色数字资源科学的开发与管理:科技文献、水利水电规程规范、科技档案以及部分电子书籍等进行内容管理,并提供强大的信息与全文检索功能,全文检索方式灵活,能够满足不同层次读者的需要;(4)数字图书馆应用系统与图书馆自动化管理系统无缝结合,能够进行信息的相互调用;(5)能够对院内一些重大活动的照片与视频、领导照片、史料图片等多媒体信息进行有效的关联管理,并提供强大的查询服务;(6)异构资源进行统一的WEB在线查询。

1.2 论证与选型

方案确定后,接下去的就是进行应用系统的开发与实施阶段。我们和项目开发人员进行了充分的交流与讨论:对于这个应用系统的开发时间至少需要1年以上,需要大量的人力投入。这显然是不太可能,况且社会上有相关成熟的软件产品,我们最终决定选购成熟的软件产品。

经过深入的了解和综合分析、考察与论证,我们认为:天宇公司的CGRS系统在图、文、声、像多媒体关联管理与检索方面具有很大的优势与实用性;跨库检索与数据库关联检索功能强大;CGRS能够和图书自动化系统无缝连接,并有成功案例:天宇公司在数字图书馆领域拥有很多成功的案例,如中共中央党校数字图书馆、中国人民大学图书馆近百家图书馆;服务好,用户满意度很高。为此,我们选择了杭州天宇资讯开发公司的CGRS数字图书馆应用系统。

1.3 系统实施

1.3.1 数字资源库建设

系统平台搭建完成后,我们开始着手建设一些具有本院特色的全文及多媒体数字资源库。根据广大科研人员及各级领导对数字资源的需求程度,我们初步拟定如下建设内容:(1)水利水电资料数据库。数据库主要内容涵盖水利领域及本院的会议资料、实验报告、项目报告及通过其他途径收集的水利领域的各类技术资料等。(2)档案数据库。主要是我院内部一些使用率高的科研档案资料。(3)图文声像多媒体数据库。收集分散在我院各个部门的工程图纸、领导照片、重大活动照片与视频等,建立图文声像多媒体数据库。(4)规程规范全文数据库。收集水利水电领域的一些规程与规范,制作成国际通用的PDF格式,创建水利水电规程规范数据库。(5)互联网信息内容库。通过天宇公司提供的互联网信息采集系统,每天自动从互联网上实时收集有关水利水电领域的动态信息内容,丰富水利水电互联网信息数据库的内容。经过一个多月的紧张工作,使得以上五类全文及多媒体数据库信息内容初具规模。

1.3.2 信息资源在线统一查询

信息资源在WEB方式下统一查询是数字图书馆建设的重要组成部分。优质的信息服务意味着为广大科研人员与领导节约时间,快出成果,多出好成果。在全文及多媒体数据库建设初步完成后,我们将数据库内容到院内部办公信息网上,进行适当的宣传,让全院科研人员及各级领导了解并使用全文及多媒体数据库。全院用户通过统一的WEB方式,对建成的全文及多媒体数据库进行多种方式的全文检索。

2 实施成效

在图书馆信息中心全体人员的共同努力下,2002年底,我院数字图书馆建设工程初步完成,建成了一批初具规模的全文及多媒体数据库,在局域网络环境下提供统一的信息查询服务,实施效果十分显著:

(1)图书与档案资料的利用率大大提高。以前因为查询手段复杂,效率低,导致图书与档案资料利用率低下。现在只需通过WEB统一查询平台,一个关键词输入进去,很快找到需要的图书档案或资料,这大大提高了图书与档案资料的利用效率。

(2)档案资料查全率高。CGRS系统具备了跨库检索与关联检索功能,实现了智能化检索,大大方便了科研人员及各级领导使用。用户可以同时在多个数据库进行全文查询,查询结果能很快在WEB界面上显示,档案资料的查全率与查询效率有了飞跃性的提高。

(3)资料查询方便快捷。原来查找资料与图书需要到资料室来检索,现在足不出户,在网上就能轻易获取想要的档案资料。

(4)使得图书馆的信息服务水平大幅度提升,满足了全院广大科研人员与各级院领导对档案资料快速获取的需要。

(5)促进了全院各项工作的有效开展,提高了广大科研人员的工作效率。

(6)有效的实现了我院水利水电档案资料在全省水利水电系统内信息资源的高度共享。

3 下一步建设规划

大数据库建设方案篇9

1搭建平台,为推动档案工作科学发展奠定基础

近几年,我校档案信息化建设引起了学校领导的高度重视,档案建设步伐明显加快,取得了明显的成绩,得到了社会各界认可,主要体现在以下几方面:(1)领导重视,责任落实到位。按照云南省档案局及云南省教育厅的工作要求,我馆召开专题会议,制定档案管理工作的各项措施,责任落实到各科室,将各部门、各学院归档管理纳入到年终绩效考核中,建立奖惩激励机制,为我馆以后的档案信息化建设奠定了基础。

(2)建立档案信息平台。目前档案数据库中已经有10余万条档案目录,经过筛选之后开通了部分文件目录的查询权限,并且建立了档案室局域网,实现局域网内资源共享。我室在省内也是较早计算机管理档案的单位,我校经常安排档案工作人员到省内部分高校和地州档案馆参观学习和经验交流。

(3)加大资金投入力度,软硬件设施逐渐加强。近几年来,学校对档案馆投入的经费逐步增多,档案馆目前有计算机3余台,服务器1台,扫描仪1台。自2006年,档案馆与计算机专业公司合作开发了综合档案管理系统,对全校的专兼职档案人员集中培训,并与学校的OA系统实现无缝对接,提高了档案信息著录、档案查询、数据统计的效率,加大了电子文件归档力度,并将原来的不同格式数据库文件导入的新开发的数据库系统中,丰富了数据库信息。

(4)加强人才队伍建设。2000年专职档案人员只有1人,没有兼职档案人员,随着档案信息化建设的要求越来越高,对档案管理人员的素质要求也越来越高,目前我室有专职档案工作人员3人,副研究馆员有1人,档案专业和计算机专业人员均占较高比例,专业知识结构合理。每个部门都配备兼职档案人员,目前有兼职档案管理人员有70多人。

2查找问题,明确努力方向

(1)档案利用服务手段滞后。我校建校早,馆内资源全面,涉及到多个档案门类。现今是一个信息时代,在此背景下我校也顺应时代的潮流,使用网络文档一体化管理系统,实现了网络归档,档案查询更加便捷。但似乎更注重的是收藏而非利用,其服务工作的作用并没有被充分的发挥出。另外,档案(如学籍档案)的利用率是很高的,所以导致提供档案利用服务的需求量也十分大,因工作效率低,在档案馆时常会出现排队查阅档案的情况,上述现象的产生是基于以下三方面的原因:①没有完善好档案信息资源基础建设,档案馆内虽藏储着巨大的资源,但因没做好前期的档案管理,如数据著录有缺失,导致档案归档管理没能够良好的和利用服务进行,进而使服务质量难以得到保证。②利用服务的手段缺乏多样性,现今大部分的档案馆只是将馆藏原件提供给档案利用者阅览,很少采用为利用者提供更多样化的服务,如:文献汇编、网上远程文件查询等。③没有较强的档案服务意识,相关的工作人员只是进行查询借阅,并不会思考这过程中出现的问题借,那就更别提什么解决措施了,主动服务意识较为缺乏。

(2)专题档案数据库建设急需完善。自成立档案室起就开始对馆藏资源实现计算机目录管理,2006年启用综合档案管理系统,实现了文档一体化,但是随着档案信息的丰富,人们的要求也在不断提高,更注重档案的个性化和精品化,为了满足人们对档案信息的需求,需要建立各种门类的专题数据库。例如学生出国需要英文成绩单,这就需要建立成绩翻译专题数据库;教师每年都要进行职称评定和人事任免,需要建立职称专题档案数据库和人事档案专题数据库等。但是,在前期的档案数据库建设还有不尽如人意之处,如:①专题档案数据库建设目的不明确。其主要的目的是便于利用,对馆藏资源进行深层次的开发,借此来更好的满足用户的需求,但是实际上的建设过程中却出现了较多的负面状况,如过于重视数量指标、忽视数据的质量以及服务效能等。②没有明确好专题档案数据库的利用需求。选题是其建立的核心,而选题又依赖于对档案用户需求的深入分析。档案用户需求分析的缺失必然会为档案专题数据库之后的利用埋下隐患。而目前的档案系统在未建设档案专题数据库前,在几乎很少去分析用户需求,进而无法保证数据库利用率。③没有统一好专题数据库的建设标准。现阶段建设专题数据库的最大难题就是怎样将其标准化以及规范化。从现今而言,还未对数据库建设的标引体系、数据文件结构、软件开发技术等方面制定相应的标准规范,这势必会给档案数据库之后的一系列工作(如档案数据交换等)造成严重的影响。

3档案信息化建设的思考

(1)改变档案管理理念。档案事业随着档案信息化得到了巨大的机遇以及挑着,为了能够更好的适应时代的发展,加强建设档案信息化是必然的,只有这样才能够有效的提高档案信息的服务水平。想要做到档案信息化,第一步需改变管理理念,树立更重的新意识,如效益、服务以及信息意识,借此来提升档案工作水平。①建立完善的档案管理制度。在此方面须遵循下列要求:a.规章制度要科学合理且紧贴单位实际以及档案管理要求。b.制度要简明实用,具有较强的可操作性,便于发挥出制度的规范以及指导作用。c.在始终保持严格的执行制度。档案部门有着双重身份,它同时肩负档案规章制度的制定者以及执行者两种身份。在落实规章制度的时候,一定要做到奖罚分明,将制度的权威性给充分的体现出来。②加强对档案工作宣传力度。a.每年都要定期对学校各归档部门兼职档案人员进行培训,保证档案归档的完整性。b.将档案工作和校史展览工作良好的结合在一起,将校史展览作为引子,进一步的提升师生员工的档案意识,带动档案资源的建设,实现史志和档案工作的联动,较好的发挥出校史展览在育人方面的作用,使档案工作能够进一步的走进学校中心的工作,为学校中心的工作提供更好的服务。

(2)档案管理手段和服务要创新。在我校的“十二五”规划中,学校在信息化建设中明确提出“推进数字化档案馆建设,提高档案管理、利用的科学化水平”,档建设案信息化的主要目的就是实现应用信息技术、档案信息资源共享,借此来进一步的提升档案利用服务水平。当前档案馆通过提高档案管理水平和计算机技术,可以用更快捷的方式为我校师生提供服务,一改之前被动服务,利用拥有的档案信息优势,挖掘档案数据,积极主动地为学校的改革和发展尽一份力量。①完善专题档案数据库,实现档案信息资源的整合。开展档案信息资源整合和专题数据库的研究应用工作,建立高等学校档案专题数据库平台,以档案馆藏档案目录数据库中不同全宗、不同类别、不同校区的重要的、利用价值高的档案信息资源(如研究生论文、学籍档案、职称职务、精品课程档案、照片档案、实物档案、人物档案、重点建设工程项目档案等)为主要来源,经过广泛收集、数据分析、加工整合、筛选整理,进行信息的二次开发,之后再将整合后的信息交换至专题档案数据库中,借此来填补通用档案管理系统缺失部分,可以提供给利用者另外一种的视觉感受,不但更好的满足了利用需求,还进一步的优化了利用模式,实现了真正意义上的信息资源共享。②建立多层次、全方位的档案利用新模式。a.建立健全内部借阅管理系统,档案管理系统是高效的档案利用服务的基础,不无论用户是到档案馆查询利用档案还是在网络提交利用申请,用户都都必须到计算机上提交查询申请,档案工作人员在按照用户所提供的申请,相应的提供服务工作,在借阅工作完成之后,档案管理系统会自动把利用者的身份信息以及档案工作人员查询利用信息添加到数据库系统中,这对于档案馆后期的利用登记和统计工作是十分有利的。b.增强网络编研,现代信息技术对于新时期的档案编研工作而言是十分有利的,因此在进行此方面的工作时,一定要对其进行充分的利用。现今人们的要求随着信息化在不断的提高,需求也呈现多样化,因此需要档案馆的信息资源进行开发以及深度的挖掘,借此来使得档案信息能够提供增值服务,如高校档案编研工作能够通过整理以及优化组合分散的档案信息,将其进一步的编辑成系统化的档案史料,使得其能够更好的为学校的科研、教学提供服务,同时还能够在一定程度上为各部门管理提供决策方面的依据。开展档案编研工作是高校开发、优化档案信息资源最有效的方式。开展档案编研工作可以为档案利用者提供主动的、系统的和有针对性的服务,从而提高档案利用工作的效率和档案管理整体水平的提高。

大数据库建设方案篇10

1 电子档案的优越性

1.1 直接减轻了档案管理工作人员的劳动强度,提高了工作时效

在知识经济时代的当下,现代网络系统不但为归档提供了快捷的管理手段,而且提供了信息利用的快速途径,免除了立卷归档、检索查找的困难,减轻了工作人员的劳动强度,提高了归档质量和检索速度,而且将文书档案管理人员从手工直接建档的枯燥乏味的工作中解脱出来。文书档案管理工作实现微机处理后,就可把按“卷”立卷归档,改为按“件”整理归档。由于实现随机管档,就可将过去的集中立卷,改为平时随时整理立卷。这样,集中的工作量,就变为分散的工作量,提高了立卷管理水平,从而达到档案管理工作及时归档的目的,便于检索利用。

1.2 微机管理有利于遗漏文件的补漏增缺

传统的文书立卷方法遇到文件收集不齐或漏交归档时,补漏增缺,就得拆卷重做。改为微机网络管理,文档用微机按“件”整理归档。可随时补漏增缺,使文档不形成存积,这时,只需按一下键盘,修改一下档案目录就万事大吉了。微机管理省时省力,可以给工作人员以充分的时间去提高业务水平

1.3 微机管理更有利于文档的保密

过去查阅档案时是整卷提供利用。利用者只是利用卷中的一份文件,却能够看到整卷档案内容。这是不符合文档管理的保密要求的。微机管理将其改为单份文件提供利用,利用者就无法接触其他无关的文件,从而达到了文件保密的要求。

2 电子档案的开发利用管理离不开数据库的建设

电子档案的开发利用管理。电子档案的独特性决定了电子档案的开发和利用比传统档案更加快捷、方便,更具实用性。系统的目标是将各档案管理单位的数据通过网络连为一体,便于共享数据资源,因此应选用分布式数据库管理系统作为开发平台,同时在档案管理单位所在地建立数据库,本地数据直接上机存取,既节约了经费,又方便了各单位互访数据。

3 当前档案信息数据库建设的关键问题

3.1 明确数据库建设目的

对于档案信息数据库建设,主要用于档案目录、全文、多媒体等实体信息,明确建设档案信息数据库是为了检索、建立档案信息管理系统的需要。

3.2 实现档案目录数据库建设

档案目录数据库的建设是数据库建设的第一个目标。信息化建设的切入点和工作重心,首先是抓好目录数据库的建设。目录数据库可以比较全面地反映档案信息,有助于实现全方位的、动态的、完整的档案信息服务。

在档案目录数据库建立的基础上,可以考虑建立档案目录中心,实现一定范围内档案内容互补和档案信息资源整合,更大限度地发挥档案效益。

4 档案信息数据库建设步骤

4.1 档案信息的收集

档案信息的主要来源是传统档案的数字化和电子文件。除此之外,档案机构和管理部门也是数值数据和事实数据的重要来源。在建立相应的数据库时,必须确定档案信息的收集范围和来源,按要求进行全面地收集。

档案信息主要来源于两个方面:一是对各种以传统载体形式存在的档案信息进行数字化处理后形成的数字副本,二是直接通过计算机生成和处理的、并由档案机构进行收信归档的电子文件。

4.2 档案信息前期处理

这是一项基础工作,为数据库提供经过加工处理的数据。主要是将档案的内容特征和形式特征著录、标引出来。著录标引必须达到规范化、标准化的要求。这是建立数据库的必要过程,也是保证检索质量的前提条件。

4.2.1 档案信息数字化

数字化是指把一切信息都变成只用O和1这两个数字组成的、用不连续的数位表示的二进制代码。档案信息数字化是指为了使纸质档案、音像档案等以传统载体形式承载的档案信息能够通过计算机进行管理的提供利用,而利用高速扫描技术、数据压缩技术等信息处理手段,将其进行转换处理,形成数字信息,并以数字代码方式存储起来。这些数字信息可以通过计算机进行操作处理,通过网络进行传输。纸质档案、音像档案等各种载体的档案都可以以文本文件格式、图像文件格式,音频文件格式或视频文件格式转换成数字信息。

4.2.2 电子文件的收集归档

随着计算机技术与办公自动化技术的结合,诞生了一个新生儿一电子文件。电子文件一经产生其信息就是以数字代码形式表达。所以在功能上电子文件等同于经过数字化处理的文件。由此,直接在计算机中生成和处理的电子文件是重要的档案信息来源。

4.3 数据录入

将档案信息前处理的结果转化成机读数据。录入过程需要较严格的校对审核。如审查字段的数据形式是否正确;字段长度与确定的结构长度是否符合;各种标识符号是否有误等。这其中可能包括对不同格式的数据进行转换。