数字化档案论文十篇

时间:2023-03-25 10:13:48

数字化档案论文

数字化档案论文篇1

(一)需提升网络技术蕴含量从城建档案的工作程序以及技术角度来看,现在的城建档案工作以及管理标准并没有考虑到网络技术的特点以及未来发展,再加上现在很多归档城建工程的图纸以及数据资料是通过光盘、U盘以及磁盘进行分类、管理,这就导致了现阶段的城建档案的分类规范、档案整理办法以及管理标准满足不了城建档案日益发展的需求。而且我国现仍旧缺乏完善、可靠的城建档案安全保障体系,所以网络技术安全程度有待加强。

(二)需加强城建档案工作的规范化程度以及标准化程度城建档案管理标准化以及规范化是档案工作的数字化、高科技化的基础。但是从实际情况来看,我国普遍存在各地的档案业务能力以及发展程度不均衡,系统软件缺乏移植性能,档案著录没有相容性,案卷质量、水平较低等问题。再加上现在仍旧没有一个统一的城建档案自动化管理的标准,同时已有的自动化管理规范只适用与个别城市建设档案馆,不能满足所有城市建设档案馆的需求,所以该自动化管理规范得不到推广以及应用,这也就导致了城建档案数字化的推广以及应用工作受阻。

(三)需提升相关工作者的素质水平要想实现、加强城建档案数字化程度,“人”的力量是必不可少的,所以城建档案管理人员不仅要能掌握先进技术,可熟练应用专业知识,同时还能够掌握一定的计算机技术。但是从实际情况来看,大部分城建档案机构的档案人员并没有专业的计算机技术知识,同时也没有能熟练应用计算机知识的人才,更没有不仅能够建档,同时也可以对信息进行处理的高级复合型人才。虽然部分城建档案机构引进了现代化的机械、设备,但是由于没有可以熟练应用设备的人才,导致设备的作用得不到发挥,进而导致城建档案数字化发展受阻。

二、优化提升城建档案资料数字化应用的办法

(一)提升城建档案信息资料数字化工作的标准性提升城建档案信息资料数字化工作的完善程度,首先应当促使城建档案信息资料数字化工作更为标准化。也就是说,城建档案信息资料数字化工作规范化、标准化是构建数字化城建档案信息资料的基本前提,是落实好城建档案信息资料数字化应用的必要前提,在这角度来看,城建档案需具备统一、完善、规范以及具有可实施性的操作文件以及标准处理措施,需落实好城建档案信息资料数字化的规范化、标准化工作。我国当前的城建档案信息资料数字化规范标准一般可以分为两部分,也就是数字化档案管理以及信息化标准规范。其中数字化档案管理包含需建立档案接收标准,与相应的档案管理以及具体落实细则等;信息化标准包含加强城建档案信息资料采集、整理,对城建档案信息资料进行网站式的管理,数字化建档需要的格式标准,与给予城建档案信息资料更为全面的安全保障等等。只有在现有的城建档案信息资料数字化规范标准基础上,不断地基于实际对规范标准进行不断的完善,城建档案信息资料数字化才能够得以实现,才可以保证数字化应用的接收、管理与信息资料资源共享顺利完成。

(二)提升城建档案信息资料数字化建设应用队伍的综合水平城建档案信息资料数字化建设应用会涉及到很多的专业、实际问题以及理论知识,所以只有不断提升档案从业人员的理论专业知识水平以及实践能力,建立起一支专门进行城建档案信息资料数字化建设应用的队伍,城建档案信息资料数字化才能得以实现。对档案从业人员进行专业的教育培训,同时根据城建档案信息资料数字化应用的实际情况,帮助档案从业人员不断积累经验,以加强城建档案工作者的档案信息资料数字化实际应用能力以及专业知识水平。另外城市建设机构还需要不断引进专业的人才,引进高校对口的专业毕业生,为城建档案信息资料数字化管理注入新的血液,内外结合快速提升整个建设应用队伍的综合素质水平。

(三)优化城建档案信息资料数字化技术的办法城建档案信息资料数字化工作由于涉及各种高新技术,而且也没有案例、经验可以依靠,所以必须通过实践积累经验,不断完善管理系统以对数字化城建档案信息资料技术进行不断的优化。这点的实现需要城建档案的相关工作人员提升城建档案信息资料分析以及技术应用等的实践应用以及相关知识理论探析,以不断提升数字化城建档案信息资料的技术水平。优化提升数字化城建档案信息资料工作的技术水平实质上是对城建档案进行数字集成化管理控制,主要是通过对档案资料转变的所有流程进行全过程监控,以促进各个技术之间更为协调。通过集成多种计算机技术,比如说计算机网络安全技术、数据交换技术、通讯技术以及网络技术等的,对分散在不同区域以及载体的档案资料进行集成化管理,使得不同计算机技术的作用均可以在档案资料的数字化应用中综合发挥出来。

三、结语

数字化档案论文篇2

【摘要题】数字信息化

【英文摘要】Thearticlethinksthatininformationera,double-setsarchivesmanagementhasnecessityandrationalitytoexist.However,itisconditional.Onlyimportantarchivesneeddouble-setssystemmanagement.Double-setssystemmanagementforallarchivesisnotonlyunnecessarybutalsoharmful.

【关键词】数字化/档案/双套制

digitization/archive/double-setssystem

【正文】

中图分类号:G272文献标识码:A文章编号:1001-5264(2003)06-0006-02

一、档案双套制问题产生的背景及研究现状

关于档案双套制问题,并不是现在才提出的什么新问题,其实早在20世纪80年代末期档案学界就开始对此进行了讨论。但是,我们现在所说的档案双套制问题,与早期所说的档案双套制问题是不完全相同的。那时,计算机的应用尚不普及,电子文档很少,人们所说的档案双套制,还主要是指对同一纸质档案的双套归档保存。而90年代以来,随着现代办公自动化(OA)的兴起、发展、普及,缩微技术的应用,以及当前在建设数字档案馆过程中对现有馆藏纸质档案的数字化,便产生了大量电子档案、胶质缩微品档案,这就出现了同一内容而两种不同载体的档案文件是否都要同时保存的问题,这就是近年来档案学界又在讨论的档案双套制管理问题。可见,当前,研究档案的双套制问题与过去研究档案的双套制问题所面临的环境和条件已大不相同。

为了了解近年来对档案双套制管理问题研究的新情况、新进展,笔者检索了清华CNKI全文期刊数据库。笔者按篇名输入检索词“双套制”,查到从1994年至2003年10月,有关档案双套制问题方面的文章仅为5篇(详见参考文献),因此,可以认为,从1994年至今,档案学界对档案双套制问题的研究不够活跃,成果很少。但这并不等于说档案双套制问题不重要,不值得研究,恰恰相反,在信息化时代,特别是在当前大力倡导建设数字化档案馆的时候,档案双套制问题的研究更有其必要性和特殊的意义。

在早期的研究中,主张纸质档案双套保存,主要是基于档案的安全和利用的方便这两个基本目的,但这种内容和载体完全相同的档案双套保存,是一种重复保存。少量特别重要档案可以这样做,但如果大部分档案的归档保存也实行双套制,势必增加大量的人、财、物的投入,不符合我国的基本国情,弊大于利,不值得提倡。因此,在档案只有单一载体的时代,对于档案是否双套保存问题,比较容易决断。但在当今档案载体出现了多元化的时代,同一内容但不同载体的两种档案由于其作用、特点不尽相同,实行双套制,已不属于重复保存,在这样的背景下,进一步讨论档案的双套制问题显得尤为必要和迫切。

二、档案双套制有其存在的必要性和合理性

在讨论有无必要实行档案双套制之前,除了要明确双套制的涵义外,还要进一步界定所讨论的双套制的数量限度问题。因为在实现办公自动化和档案现代化管理的过程中,不管我们主观上是否愿意实行档案双套制,其实在机关办公室、档案室和同级档案馆中,都必然会客观存在或多或少的档案既有纸质载体又有其它非纸质载体的情况,就这部分档案而言,虽然也是双套保存,但这种情况并不是我们所要讨论的档案双套制。我们所说的双套制是指在普遍意义上和大规模层面上需不需要搞档案双套制,如果离开了“度”和数量的限制,讨论双套制问题便会失去意义。

双套制有没有存在的必要性和合理性,关键要看两种档案是否完全相同,能否相互取代。如果两套档案从内容到载体形式都完全相同,双套制则是完全重复保存制,显然是无此必要的,但如果两套档案只要在某方面存在差异,那双套制就不算重复保存制,该不该实行双套制就要做具体分析了。无论是电子档案纸质化还是纸质档案电子化后形成的两套档案,虽然两者在内容方面完全相同,但其载体形式和功能、效力却有较大差异。主要表现在以下几方面:

以磁盘或光盘等作为介质的电子档案,虽有体积小、信息量大、检索迅捷的优势,但其局限性也很明显,如不能有效防止数据在传输过程中泄露;电子档案中的文字无个人字迹特征、无书写墨迹的新旧之别、无文件形成过程中的稿本特征,一旦被篡改,无法识别;电子档案没有“原稿”概念,没有确定的法律地位;所支撑硬件系统和应用软件系统各不相同,对软硬件依赖大;寿命短,其影像记录的稳定期限不长。纸质档案虽有真实性、可靠性、法律地位确定的优势,但有信息容量小、占据空间大、管理检索不便的弱点。缩微品档案也有局限性,它的设备成本高,缩微胶片保管条件非常严格,一般档案部门难以达到其所要求的温湿度标准,从实际应用情况看,大多数缩微设备利用率普遍不高,操作技术较复杂,人员配备相对多,其存贮密度、信息容量、检索速度等远远比不上光盘。

而双套制正好融合了纸质档案和电子档案的优势,既可发挥高效存取检索功能,又可保障档案的凭证价值作用实现。可见,双套制有其存在的必要性和合理性,对此不能简单否定,在电子档案的局限未得到根本克服之前,在电子档案的法律地位未得到完全确认之前,应该实行双套制,至少对重要档案、珍贵档案应该实行双套制。双套制的存在,意味着今后档案馆馆藏中电子档案与纸质档案将长期共存,这将成为未来档案馆馆藏结构的一大特点。

三、档案双套制面临的问题与对策

鉴于上述原因,当前我们要讨论的不是该不该实行档案双套制的问题,从所查到的全部文章来看,都一致主张实行双套制,只是研究的侧重点不一样。现在要解决的问题是怎样实行档案双套制的问题,这恰恰是目前研究得很少的问题。

两套档案的来源,主要包括两个方面:一是随着当前办公自动化的应用和普及所产生的大量电子文件和与之相伴的纸质文件,按归档要求,需一并进入档案室并移交给档案馆;二是随着数字档案馆的建设,现有档案馆藏纸质档案也将逐渐实行数字化,也会随之产生大量电子档案。此外,对某一机关而言,也不是机关的全部档案都存在两套的情况,而只有发文部分才会既有纸质文件又有电子文件,收文却只有纸质文件,电子文件存放在对方发文机关。不过,当全国所有机关间的办公都实现了网络化后,文件的传输和阅读都在计算机上进行时,就没有这种区别了。但是,由于人们长期形成的阅读纸质文件的习惯,想必人们还会将机上文件下载转化为纸质文件阅读,这样也将出现电子文件和纸质文件并存的局面。

如果对实行档案双套制没有什么异议的话,那么实行档案双套制面临的最大难题,则是在多大程度上实行档案双套制,或者说哪些档案该实行双套制。虽然笔者主张实行档案双套制,但却反对将所有档案不加选择地统统实行双套制,这不仅是不必要的,而且也是有害的。

目前要明确而具体地划定实行双套制的档案范围是极其困难的,本文无力完成这一重任,这需要我国档案学界对此做深入的调研,特别是国家档案局要尽快出台有关方面的法规和规章。目前我们可以首先制定实行双套制的原则。笔者认为,至少应包括这几方面:我国档案部门在人力、物力和财力方面具有承受力,有利于档案的安全保管和方便利用,所选档案要有典型性和代表性。

根据以上原则,作为一种过渡性措施,笔者认为,双套制档案范围基本上可以以我国目前各类档案的归档范围及其保管期限表为依据。因为我国现行的档案归档范围及其保管期限表是经过长期的调研和实践而制定出来的,具有相当的科学性和可操作行,特别是保管期限表已考虑了档案的重要程度和保存价值,这正是确定双套制档案范围的重要依据,完全可以参照执行,不必另搞一套。

机关档案是档案馆档案的主要来源,机关档案双套归档保存的范围,就决定了档案馆双套档案的范围,因此应严格把关。机关档案部门作为双套保存的档案范围,应当限定在具有永久保存价值的档案部分,保管期限为长期的档案不必搞双套制。此外,在机关档案部门,两套不同载体档案如何统一保管且便于检索也很值得研究,要把电子档案和纸质档案做有机的对应,建立相互准确可靠的标识关系。

档案馆如何实行档案双套制呢?笔者认为,档案馆除了接收机关档案部门移交的符合要求的双套档案外,另一方面就是原有馆藏档案如何实行双套制问题。目前我国各类档案馆馆藏档案基本上都是纸质档案,鉴于数字档案馆的发展是大势所趋,因此今后现有馆藏纸质档案将会逐步实施数字化,但由于我国现有馆藏纸质档案数量巨大,有的大型综合档案馆馆藏量多达几十万甚至百万卷册以上,加之不少档案又是历史上形成的,若全部数字化,工作量实在太大,成本实在太高,实在无此必要。对档案馆现存的纸质档案应维持现状,不必做过多的折腾,只需对其中具有永久保存价值的档案和部分年代久远需抢救的珍贵档案实施数字化,并实行双套制保存。总之,现有档案馆既成的纸质档案不是双套制的重点。

【参考文献】

[1]彭坚.关于档案“双套制”管理问题的探讨[J].档案学研究,2002,(1).

[2]方莹芬.试论电子文件归档的双套制[J].浙江档案,2000,(11).

[3]潘蓉.对档案“双套制”管理的思考[J].档案天地,2003,(4).

数字化档案论文篇3

2000年12月,国家档案局、中央档案馆印发的《全国档案事业发展“十五”计划》,把“加快档案信息化建设”、“加快现有档案的数字化进程”列入其中,同月国家档案局在中国档案管理现代化建设研讨会上宣布:十五期间,我国将加快数字化档案馆的建设。由此,传统档案馆数字化建设的问题引起了人们的关注,并且有一些档案馆已经开始对此投资建设。我们认为,传统档案馆的数字之路并非一蹴而就,而是一个循序渐进的过程,对这个过程的各个环节进行深入的分析研究是十分必要的,只有在有了清楚认识的基础上,才能规划和解决好档案馆的数字化之路,为今后的数字化档案馆进而是数字档案馆、虚拟档案馆的建设打好基础。近年来,我们临海市档案部门在数字化建设方面进行了积极的探索,取得了初步成效,在工作中数字化建设也给档案工作带来了极大的方便。

首先我们充分认识到档案数字化建设的紧迫性

1、档案数字化,可改善档案管理工作。只有实现档案数字化,才能冲破档案利用的种种局限,使档案管理部门从封闭走向开放,从档案的保管和利用职能向信息采集、管理和服务职能转变,实现档案信息资源的合理配置、科学管理,为社会提供高效、优质的服务。

2、形势发展的需求

21世纪是信息化的时代,临海市政府把数字临海建设摆在了十分突出的位置,无疑是十分及时和正确的。数字档案馆是数字临海的重要组成部分,其一,档案馆就是市委、市政府保管和提供利用档案信息的职能部门。它馆藏有数十万卷档案资料,数百万件档案文件,是本地区最丰富、最有实用价值的信息资源库,这样一大批浩如烟海,珍贵的档案信息资源不能很好地为各级领导和广大公众利用,充分实现信息共享,数字临海就不是真正意义上的数字临海。所以,要建设数字临海,首先要建设数字档案馆。其二,档案载体的更新换代迫切要求档案馆数字化。档案由原始的甲骨、竹笺、贝叶、丝帛到纸质,发展了几千年,记录下了中华文明和世界文明史。近年来,档案载体逐渐并迅速地被磁盘、磁带、光盘所取代或更替,电子档案的出现给档案馆提出了一个亟待解决的课题,那就是电子档案的收集、保管、保护和利用手段,而解决这个问题的途径只有一个,那就是档案馆的数字化。目前,档案馆的档案保管、利用与形势的发展要求不相应,仍然停留在纸质档案的管理及较原始的检索利用水平上,使得绝大部分电子档案无法采集、收集和提供利用,甚至绝大部分电子档案已经被清洗、丢失。这是一个极其重大的损失和无可挽回的错误。

3、社会强烈需求

当今,人们的时间意识越来越强,领导做出重大决策需要迅速、准确;各职能部门工作查考要求快速及时;社会广大公众对档案信息需要量不断增加,如婚姻档案,有一些农村,尤其是僻远山区的利用者要查阅婚姻档案十分清便,来回要好几天,他们迫切要求信息共享。还有一些外商投资者,他们想了解临海的整体情况,才敢于投资,那么要了解临海的详细内容恰恰只有市档案馆才是最全、最新、最直接、最方便的一个场所,特别是我们建立临海市现行文件查阅中心之后,对各界人士及外商投资查阅信息更为方便,这都迫使档案馆这个信息保管和提供利用的部门必须尽快改变传统的原始管理、检索和提供利用的手段,以现代化、多功能的服务措施,使档案馆馆藏的信息能及时、方便地提供给各方面的需求者

二、档案数字化建设的内容

1、推进档案数字化,必须提高档案标准化、规范化水平

目前,档案信息数字化的现状是档案标准化、规范化滞后和应用软件多乱,这些都严重影响了系统整体水平的提高。笔者认为对这一问题取得共识是档案数字化建设思想上的一次飞跃,它使我们的观察视野从计算机系统扩大到整个档案信息管理。档案信息自动化的内涵包括档案工作的各个方面和各个环节,其中首要的是档案业务要规范,档案标准要建立健全和真正实施。档案标准和规范本身也是一个系统工程,要推进档案数字化建设,必须抓好档案标准化、规范化,掌握好两者相辅相成、互相促进的辩证关系。

2、数字化建设要着眼于提高系统的整体水平

档案数字化建设的着眼点应是整个系统,组成系统的纵向和横向的各个节点都应达到一定水平,并通过网络加以联通,这样才能发挥整体优势,提高系统的综合能力。部分节点甚至一个重要节点的障碍,都可能造成系统的梗阻。当然,要求每个节点的装备水平和应用能力齐头并进是不现实的,不可能“齐步走”。鼓励和支持先进单位提高水平,在一些单位进行较高水平的试点,以取得值推广的经验,对整个系统是有利的,但其基本出发点就是为了提高系统的整体水平,只有少数先进的节点不可能组成先进的系统。

3、有重点地抓好数据库建设

目前,我们临海档案数字化系统从总体上看仍处于由文件处理向数字管理系统的过渡阶段,完成这一步的关键在于数据库建设。开发和建设数据库系统是国家档案信息工程的核心和基础,是工程的主体。数据库的含义是依托先进的信息技术对档案进行科学的管理和方便的使用。建立数据库系统是一项长期的任务,要经过由低到高、由单个到群体的循序渐进过程。经过实践我们认为建设数据库经验中最主要的有:领导重视,统一认识,坚持计算机技术人员同档案业务人员协同配合;面向应用,建立“活库”,以利用频率和使用效率考核数据库的“活性”;突出重点,由单一库向系统库发展等。当前若能把综合数据库的完善提高和各单位档案目标库建立起来,通过网络联接形成开放的分步式数据库群,将使自动化系统效率大大提高一步。

三、档案数字化建设的步骤

1、建立档案数据库。第一步,输入文件级目录。从1997年开始,我们把馆藏档案的文件级目录输入数据库。截止2005年5月,已输入文件级目录30万多条、案卷级目录1万多条,我们准备再用1-2年将全部完成。在建立数据库的过程中,可边输入边打印,一方面补齐卷内文件目录,另一方面检验输入的正确性,从而确保档案数据库的真实性、完整性和有效性。第二步,采用扫描仪、数码相机等设备,实现原文件信息数字化。临海市档案馆婚姻档案、知青档案、山林土地档案利用十分频繁,尤其知青档案已十分破烂,只有实行数字化,才能确保原件的永久保存。从实践看,档案数据库的建立大大提高了工作效率。如出具无婚姻记录证明,我馆由于实行了数字化管理,虽然保存着1962—2001年10多万条婚姻档案,利用者可以随到随办。而靠手工管理的市办事大厅保存着2001年—2004年不多的婚姻档案,则需5个工作日。利用者对我馆的数字化建设十分满意。

2、建立了档案局(馆)网站。并与市政务网、公众网联网实施资源共享。在互联网上向政府和社会提供档案信息查阅,政策法规查询、举办网上展览,展示本地两个文明建设的成果;建立网上现行文件查阅中心提供全文查询,逐步实现政务公开,营造有利于当地市经济建设和社会发展的良好环境。3、加强电子文件的收集和积累工作。电子文件是未来馆藏数字档案最主要的来源。以前,进馆单位只移交纸质档案和纸质文件目录,现在我们要求进馆单位实行电子文件和纸质文件的归档双轨制,一般将电子文件拷贝两套,异地保存,并随纸质文件一并移交档案馆。这样既推进了机关档案室的电子化进程,又节省了档案馆建立数据库的工作量。

4、加大档案管理软件推广力度。电子文件是包括电子文件内容、电子文件载体和电子文件显示、修改的电子计算机软硬件平台的组合。由于种种原因,各进馆单位电子文件所依赖的软硬件平台不同,这给集成到档案数据库造成困难。对此,我们要高度重视,采取积极的措施予以解决。印发电子目录数据库结构与交换格式,对案卷级和文件级目录数据库结构的字段名称、类型、长度作出了规定,规范软件和数据格式,确保数据库的准确性和有效性。

截止2005年5月,临海市市镇两级机关和企事业单位已有20多家使用了PDE档案综合信息管理系统或其它综合信息管理系统。今后,我们准备加大档案信息管理系统的推广力度,对新达标升级的单位要求全部安装,对已达到各类标准的单位要求在1-2年内全部安装。另外依托市政府OA网上办公系统,做到文档一体化,及时迁移电子文件。随着系统设备更新、扩充,在不同系统之间交接电子文件,及时对归档电子文件进行迁移操作,确保电子文件的有效性。

档案数字化建设是一项长期而又复杂的任务,不可能一步到位。工作中我们力求分步实施,突出重点,讲求实效,持续发展。

参考资料

1、国际档案理事会主席王刚同志在《第十四届国际档案大会开幕式上的致词》,《中国档案报》2000年第547期

数字化档案论文篇4

关键词:照片档案;数字化;扫描;分辨率

一、照片档案数字化的重要性

照片档案数字化是保存照片档案的必然要求。在照片档案数字化之前,照片档案都是通过传统的光学照片来进行保存的,这些传统的照片档案时间一长就会出现褪色、失真等诸多问题,大大影响了档案保存的质量。为了能够让照片档案得到更好的保存,就必须要对其进行数字化扫描。

二、扫描分辨率选择的注意事项

1.要选择最合适的分辨率

所谓的分辨率指的是单位长度内图像所包含的点数或像素,通常情况下可以用每英寸点数来表示,也就是dpi。如果一个图像包含点数越多,就说明它能够保存的图像信息越复杂细腻,同时也需要耗用更大的空间来进行储存。如果点数少的话,存储面积会减少,但是相应的图像也会变得比较粗糙。扫描人员在确定扫描分辨率的时候要进行合理的选择,如果分辨率不够导致照片扫描后相当模糊,那么就起不到档案保存的效果,但是也并不是图像越清晰就越好,还必须考虑到存储空间的问题。另外,分辨率的选择还要考虑到打印设备的选择,如果打印分辨率低于扫描的分辨率,那么是无法得到更好的打印效果的。所以在选择分辨率的时候要综合考虑各种情况,选择最适合的分辨率来进行扫描。

2.要选择符合规定的分辨率

由于国家档案局在档案行业相关标准中已经对纸质档案的数字化扫描分辨率进行了一系列的规定,所以在进行扫描的时候就要参考国家的相关规定,明确地按照规定的要求来进行扫描。

3.注意扫描设备等的选择

由于照片档案的扫描最重要的一点就是要保持真实地反映原始照片的情况,所以在扫描的过程中对于扫描设备的选择也是十分重要的,扫描设备要能够做到扫描照片的真实情况,在色彩等方面和原始档案照片保持一致。值得注意的是,除了扫描设备以外,显示器和电脑显卡的因素扫描者也要考虑进去,因为有的时候这些设备会影响到色彩的显示,如果显示器不能够准确地显示色彩的话,那么根据显示器上的错误色彩来进行调节,必将南辕北辙,距离原始照片的真实性反而会越来越远。所以说在选择显示器和显卡的时候也要注意一下,要先校正一下,看看它们是否能够将输入的图片真实地显示出来。

三、扫描分辨率选择的方法

1.扫描前选择适当的扫描分辨率

扫描人员在进行扫描之前首先要做的事情就是根据要求来选择合适的分辨率,扫描照片的时候有一定的分辨率计算公式,扫描者可以通过打印照片的物理尺寸大小和打印所需要的分辨率,以及原始照片的尺寸来选择分辨率。分辨率公式可以设定为:扫描分辨率=(打印照片的物理尺寸×打印的分辨率)/(原始档案照片大小×n),其中n的数值由打印机的情况来决定,如果打印机是连续色调输出设备,那么n的数值可以选择为1,但是如果打印机是非连续色调输出设备,这种情况下就要选择n的数值为4了。扫描照片的时候除了按照固定的标准来进行以外,有的时候还可以根据实际工作需要得到的效果来进行选择。例如扫描从一寸到十二寸的一组照片的时候,可以统一一下,以满足最终输出的尺寸作为标准来选择需要的分辨率,即可以统一成满足十二英寸照片的图片文件分辨率为标准。这样的话,扫描一寸照片的话,照片的尺寸大小在2.5cm×3.5cm,这时候可以选择扫描分辨率为2200dpi,而相应的图片文件分辨率为3058×2249pixel,而扫描照片尺寸在12英寸×10英寸的十二英寸照片的时候,可以选择分辨率为240dpi,而得出的图片文件分辨率为3000×2500。这样就能使得不同大小的照片扫描出来的数字化文件的尺寸大小保持一致,可以方便以后进行统一管理。

2.扫描中合理使用扫描仪和相关软件

在使用扫描设备的时候要注意选择最佳的图片扫描区域,尽量选择大面积而且无杂质的区域作为扫描的区域,以求在扫描的时候能够得到更好的扫描效果。对照片档案的数字化扫描要完成得更加完美,还必须要在进行分辨率选择的同时慎重使用扫描软件的各种功能,要利用扫描软件的操作来配合分辨率的选择,这样才能扫描出真正符合要求的照片。在使用扫描软件的时候要注意,有些扫描设备及其软件中配备有一键扫描和智能修复等功能,在扫描的过程中不要胡乱地使用类似的功能,而要配合自己所选择的扫描分辨率来合理运用,因为如果选择了这些自动功能的话,往往反而使得效果达不到预期的要求。尤其是对于色彩翻新、去除杂点、背光补偿等功能,由于档案照片要保持原始照片的真实性,所以扫描者在选择这些项目的时候要特别注意,不能因为胡乱的选择而破坏了原始照片的真实面貌。

3.扫描后调节最终效果

在扫描完成之后,扫描者要根据照片档案的实际情况来进行最终的调节,在进行这一步的时候尤其要注意细心谨慎,要注意观察是不是已经将照片上的各种细节都扫描下来了,尤其在影响影像层次、细部存留参数这两个方面要进行相应的调整,尽可能地使得原始档案照片的真实面貌被保留下来。对照片档案来说,保持照片的真实面貌是最重要的,所以要尽可能地保持这一点。扫描者在扫描之后要观察一下照片的长宽比例等,看看是不是和原始档案照片一致,有的时候甚至还可以保留住照片的外延边界,这样的话就更加能够确保照片的真实面貌得到保留。扫描者要注意切不可对存档用的档案照片进行改变颜色、移位遮挡等处理。

四、结论

照片档案数字化扫描看似简单,但是如果要真正做好的话并不容易,扫描者要仔细选择扫描分辨率,并不断积累扫描经验,以求能够更好地扫描照片,为档案管理作出自己的贡献。

作者:潘小寨 单位:深圳市文档服务中心

参考文献

[1]卞咸杰.照片档案数字化扫描分辨率的选择与确定[J].档案管理,2011(,4):44-46.

数字化档案论文篇5

(一)有利于提高学籍档案管理工作效率

将学生学籍档案数字化对于提高学籍档案管理工作的效率和减少劳动成本都有着十分重要的作用。学生的学籍档案中有着丰富的信息,里面包含有学生在学校期间的思想、学习、生活等方面的具有参考价值的资料,同时还包含有学生在学校的教训和管理活动所形成的具有参考、利用价值的资料,而且其所记录的时间跨度相当的长,信息量是否的庞大。同时,随着现在高等教育的逐渐普及,在高校中接受教育的人数也在不断的增加,面对如此庞大的信息数量,学籍档案管理工作的效率已经越来越受到重视。进行学籍档案数字化管理,不仅仅能够减少学籍档案管理工作人员的工作量,同时还能够减少他们出错的几率,从而大大的提高工作效率。

(二)有利于完整学籍档案信息

学籍档案中需要记录许多的信息,然而现在的学籍档案管理基本上是将这些信息分开来存放的,通常都是以院系、专业、班级为单位来装订成册的,有的学校还会将学生的学籍发生变动时的信息在与这些信息分开来进行存放,学生所得到的各种奖惩、任职情况、党员信息、综合评价也有可能在其他卷宗里面。总之就是将学生的各种学籍信息来进行分开的存放,而不是统一存放管理的。这种信息的分割管理,很容易让想要了解信息的人无法获得全面的信息。但是如果将这些信息进行数字化存放到统一的数据库中,虽然学生的信息是由不同的部门的人分别进行录入的,但是在数据库中的存储却能够让这些信息统一的呈现出来,从而让学生的学籍信息更加的完整。

(三)实现资源共享,方便管理

学籍档案信息数字化是各个高校学籍档案管理工作的一个重要的发展方向。将学籍档案管理数字化建设纳入到学校档案管理信息化建设中,可以有效的实现资源共享,利用学籍档案的管理,同时还能够对学校的管理环境进行优化,使得学籍档案管理工作真正的为学生、学校,乃至整个社会服务。

二、当前高校学籍档案数字化建设存在的问题

(一)数字化程度不足

高校虽然将学籍档案管理数字化建设当中工作中的重点,但是当前仍然存在着数字化程度远远不够,现行使用的数据库与网络技术还没有跟上时代的发展步伐。长期以来,学籍档案管理工作都是依赖人工完成的,而并非是使用现代化的信息技术手段来进行,手工操作面对如此巨大的信息量,其工作量之巨大不言而喻。同时使用人工进行管理还存在着许多的不可控因素,使得学籍档案管理工作很多地方都不规范,不规范的管理工作大大的降低了学籍档案管理工作的效率。而现在一些已经采用了先进的网络硬件设备的高校却有存在着“重硬轻软”的现象。这些高校只注重了硬件设备的建设,忽略了各种应用软件的开发,学校还没有意识到要在网络硬件平台上搭建一个更加合理的信息化软件环境,使得先进的硬件系统得不到充分的利用。

(二)当前的学籍档案管理系统无法满足学籍工作的要求

有很多高校为了能够改善本校的学籍档案管理工作,或自己开发或者和其他公司合作进行开发了一些教务管理系统,这些软件的开发对学籍档案管理的数字化起到了一定的推动作用,并积累了一些经验。但是在这些软件中还存在着不少的问题。例如适应性不强,每个高校的具体情况各部相同,而这些软件都是结合每个高校的自身当前的情况所开发的,因此就不具备很强的适应性。功能不够完善,有很多的软件都不能很好的涵盖学籍档案管理工作的各个环节。

(三)学籍档案管理工作人员的计算机水平不够高

现有的学籍档案管理工作人员基本都只是对自己的业务知识很熟悉,却对各种计算机技术不怎么了解。几乎所有的高校都存在着这个问题。现在的高校都急需既精通学籍档案管理业务又熟练掌握计算机技术的复合型人才。之所以现在很多学籍档案管理系统或者软件存在着缺陷,在很大程度上是因为软件开发人系统的却又不高所造成的。

三、高校加强学籍档案数字化的措施

(一)引进功能较为齐全的学籍档案管理系统或者晚上现有系统功能

高校应该根据自身实际情况,建立起一个完善的网络学籍档案管理系统,可以跟系(部)、处室、班级相连,进行数据共享。为此学校可以根据自身情况,对现有的软件系统功能进行完善,使之能够完全的适应学校学籍档案管理的要求。或者学校去引进符合学校现状的先进学籍档案管理系统,以此来积累经验推进学校学籍档案数字化的进程

(二)加强学籍档案管理软件开发人员与学籍档案管理工作人员之间的沟通

为了能够真正的开发出符合学校自身情况的学籍档案管理软件,开发人员必须要深入到学籍档案管理工作的第一线,以此来对学籍档案管理工作有一个更加直观的了解。同时还必须要与学校学籍档案管理工作人员进行深入的沟通,对他们的需求有一个详细的了解,并对国家高教部学籍信息化管理的工作要求进行认真的学习,在此基础才能着手开发学籍档案管理软件,同时在开发的过程中要随时与学籍档案管理工作人员进行沟通,以便于做到有错误及时的改正。

数字化档案论文篇6

1.数字化档案管理有利于提高事业单位经济效益。事业档案过去传统粗放式的档案管理过分依赖增加办公人员和费用,使事业单位的费用开支大幅提升。通过采用数字化档案管理,将传统纸质档案变为电子档案,缩小了档案占地空间,节约保管成本,在档案调取和查询上也十分便利,有利于提升事业档案的综合经济效益。

2-数字化档案管理是提升事业单位办公效率的必要手段。采用数字化档案管理,能够使档案数据快速、准确归档,随用随提,快捷、高效,是提升事业单位档案管理效率的必要手段。

3-在数字化档案管理模式下,档案数据的利用率明显提升。众所周知,传统纸质档案大多保存在档案室或档案馆,用户查阅与调取时很不方便。档案采用数字化管理后,用户能够、快捷、方便地查询到自己所需的档案信息,极大地提升了档案的利用率。

二、推进事业单位档案数字化管理的具体措施

(一)大力促进事业档案文书处理过程与归档数字化,提高档案管理效率

在档案管理中,文书处理是最基础性工作,文书处理效果直接关系着档案的质量和水平。在现代信息技术不断普及,事业单位每天处理的档案量不断增多形势下,档案管理者应该将每天收到的档案信息利用计算机进行归档处理,按照批办流程在事业单位内部网内传阅,设置具体的传阅、催办时间。当传阅的待处理文件未按设定的时间进行信息反馈,就应该利用信息技术的优势,及时提醒相关人员及时处理,确保档案管理工作的有效性,防止档案处理延误,档案堆积量不断增大的现象出现;同时,通过这种网络数字化的处理方式,大大缩短了信息传递和反馈的时间,不仅能减轻档案管理人员工作负担,还能极大提升档案管理效率。

(二)构建事业单位档案数字化管理体系

从长远的角度来看,事业单位档案数字化管理是今后的必然趋势,同时也是一项较为复杂的系统工程。在这个过程中,数字化管理体系的整体构建、硬件设备采购、软件系统开发与升级、档案录人、资料备份、档案查阅等都是该系统必备要素。对事业单位而言,其每天工作量大,档案资料较多,数字化管理系统应该采用双服务器的备份方案,确保档案管理安全;此外,要细化档案管理工作,将数字化档案管理细化为操作系统管理、系统维护管理、档案密级管理、性质种类管理等,不断提升档案管理效率。

(三)将数字化档案管理融于单位办公自动化系统中,从而整合数字信息资源,提高事业单位管理的综合效率

在当前事业单位运作中,自动化办公系统已运用得十分广泛,显现出了自动化办公系统的巨大优势。在这种背景下建设成功档案数字化管理系统后如何将该系统与办公自动化系统有效整合在一起,发挥出整体优势成为事业单位档案数字化管理必须要面对的考验。对此,笔者认为应该对办公自动化系统进行软件升级,两个系统间需要开发相互兼容性端口。例如在办公自动化系统中增加档案查询功能,同时档案管理系统要开放查询权限,确保两系统有效整合,实现各系统的无缝链接,提高事业单位管理系统的综合效率。

(四)确保档案数字化系统得到可靠的信息支持

维护好档案数字化管理系统,确保其能安全、高效运行,辅以可靠的信息支撑十分重要。具体来讲应强化以下工作:

1.确保档案数字化管理系统拥有良好的系统升级能力。系统拥有良好升级能力是不断丰富、完善系统功能的必备条件,只有这样,数字化管理系统才能不断与时俱进,发挥强大的管理功效。

数字化档案论文篇7

借助于图书管理系统,图书征订、新书登记以及图书编目等功能都可以有效实现,系统规范图书进库工作;预借、借书以及还书工作则属于流通作业,这样三种作业的工作量就可以得到根本减少。信息查询模块,则可以保证在各种条件下,都可以有效的查询和统计馆藏书;系统维护可以合理运用本系统,并且快捷迅速的解决随时出现的问题,条形码扫描也是系统所支持的,在实际使用的过程中,扫描枪在扫描图书ISBN图书编码时,从因特网上就可以将图书相关信息给下载过来,如书名、简介以及出版社等等,这样就可以最大程度的降低录入人员的工作量。

二、电子文件的归档与接收

电子档案的主要来源就是纸质档案,借助于传统的方法来收集、处理和鉴定文件,采用一系列的技术手段,促使库存档案的数字化得到实现,产生的电子文件符合相关要求。库存档案数字化之后,和传统的纸质文件相比,电子原件可以作为纸质元件的副本使用,因为依然可以有效的编辑和修改形成后的电子文件,同时,在网络上传和复制文档的过程中,人为因素发挥了较大的作用,那么就无法确定它的真实有效以及原始性。因此,在电子文件形成的过程中,就需要形成一份电子文件,将电子文件的静态和动态数据信息给涵盖过来,保证电子文件拥有齐全的信息,查询和辨别起来较为方便,这样才可以有效增强档案原始性,在较大程度上提升电子文件的利用程度,同时,电子文件的数据信息方面,也需要对人为干预进行减少,因此,就需要对系统自动提取产生足够的重视,档案管理人员如果发现了问题,可以向归档人发回。

三、电子档案的存储与备份

电子档案因为过分依赖计算机,那么就不够稳定,主要原因是计算机的硬件和软件产品不够稳定,随时都可能有意外情况出现,那么就需要科学存储和备份电子档案。要严格依据技术的发展要求来选择归档各种文件的存储形式,如文本文件、图像文件、音频视频文件等,可以选择不同的方式来存储电子原件,如数据库存储、光盘存储等,在选择的时候,需要充分兼顾用户的实际需要。因为计算机的稳定性无法保证,那么在档案管理中,还有十分重要的一份工作就是电子档案备份和恢复,这样才可以保证档案管理系统的安全和稳定。需要合理有效的备份网络备份、系统备份和数据库备份,同时,第三方介质也需要注意存储,比如可以将专用电脑以及专用的存储装置给应用进来,并且不接外网,这样档案管理系统的安全性和稳定性方可以得到保证,如果有意外情况出现,借助于备份信息,系统就可以得到有效恢复。

四、电子档案的检索和利用

我们需要注意的是,档案管理工作就是更好的服务于使用者,最终目的就是可以更加方便的检索和利用电子档案;在共享档案管理系统数据时,档案使用者在对需要的资料进行查找时,可以更加快捷和准确,将信息化的优势给充分体现出来。和传统的档案管理模式相比,电子档案对于档案的存在形式是一项根本性的革新,同时,对于档案的利用和查找方式也造成了很大的改变,可以更好的服务于档案利用者。同时,电子档案的维护性管理也需要引起人们的重视。在管理维护方面,主要利用用户权限来限制;维护下管理包括很多方面的内容,在数据库管理中,主要是进行一些日常的维护;查询浏览电子原件内各种动态数据信息等等。

五、结语

数字化档案论文篇8

以档案用户需求为原则,为档案用户服务,是档案馆工作的根本宗旨。为此,档案馆数字化资源建设应做到:

(一)以满足用户需求为原则

要认真了解、研究档案用户的需要、兴趣和接受能力,以便有针对性、有目的地考虑选题和进行选题策划,满足用户在学习、工作、研究和精神生活等方面的利用需要。档案用户是复杂的社会群体,有年龄、职业和地域等方面的区别。年龄、职业、地域相同的用户,因思想文化素质不同,又分为不同的层次。这些档案用户的工作需要、学术兴趣是各不相同的,设计选题、进行选题策划时,要根据具体的档案用户的实际情况,研究、决定所选档案的内容、层次级别、载体形态、文献类型、数字化成品的类型等。

现代档案馆馆藏建设与传统档案馆馆藏建设的最大区别在于:传统是“从头做起”,是从浩瀚的档案中撷取符合本馆需要的档案,经加工编写给予档案用户参考利用;现代是“从尾做起”,掉过来操作,“整合”是其要义。换一种说法:前者是以计划为特征;后者则是以市场需求和吸引利用者为特征,*注意力经济吸引档案用户。

(二)注重发挥档案的特殊功能

与其他网站不同,档案网站不仅要传播档案信息,还要积累档案信息。各个民族、各个时代的档案信息载入网络后,便能成为人类共同的精神财富,可以超越时代、民族、地域的界限,长期流传,造福后代,这是档案的特殊功能。档案数字化的选题,要注意发挥档案的这种特殊功能,多安排一些具有重大文化、学术价值和长远生命力的选题,即使这类档案在经济建设上暂时绩效不明显,也要从社会文化建设的长远需要出发,在财力允许的条件下尽量保证。数字档案馆能及时、准确、系统提供科技知识,它比一般数据库系统提供的检索服务方式更方便自然,也就更贴近用户。例如,数字档案馆的网上专题展览可以使档案馆这类“爱国主义教育基地”在网上活跃起来。

(三)品牌原则

档案馆的品牌原则更多地体现在重要档案主题的专藏上。重要特色档案代表档案馆的馆藏质量和工作成就,反映档案馆的馆藏宗旨和风格特色,对于提高档案馆的声誉和地位具有重要意义。因此,设计重点档案的数字化选题是选题策划工作的首要任务。对于小馆而言,应把力量集中在强势项目上,实施优势定位,依据档案馆优势资源,全力形成自身的优势形象。一个好的品牌,除了固定用户接受、认可外,经过长时间的推广和延续,更易在市场上形成好的口碑,更能吸引广大用户,提高点击率,达到事半功倍的效果。

(四)个性化、系列化原则

个性化就是选题的独创性和开拓性。独创性是指在数字化档案的内容、形式、编撰体例等方面的创新。开拓性指开发新的选题领域或者在原有的选题领域中拾遗补阙。每一个选题都应该有新的构思,形成鲜明的个性特色,避免和已经成型的网站重复雷同。一个档案馆的数字化选题策划也应该有自己的个性,有自己的编辑思路、数字化文献的风格,不能一味模仿别人。系列化也是选题工作的重要要求。由许多单个选题构成的选题计划应该向系列化的方向发展,使原来零散的选题逐步配套,构成一个统一的整体。

(五)市场原则

在社会主义市场经济条件下,市场的竞争机制、供求规律、价值规律不以人们意志为转移地起作用,档案文献数字化工作与网站建设必然受到市场的制约。因此,选题要充分重视市场作用。设计选题要考虑市场需要和档案信息的供需情况,没有市场需要,一般不宜采用,如果采用,就要使选题有比同类信息更高的质量和鲜明的特色,并要预先策划推销的策略和手段。所谓市场原则,就是让网站建设驶入个性化服务的轨道。对于网络,不仅要把它当作一种新媒体来看,要时刻周密考虑市场的需求,在每一个环节上谨小慎微,从小处着眼,从质量着眼。市场是复杂的,利用需求也是千差万别的,不考虑数字化产品的利用定位,不对市场信息做具体的分析,盲目的追求市场潮流进行数字化,就可能被市场所“误导”,导致产品背离利用者的需求。我们在认识与实践中不能陷入一个误区:把市场潮流等同于利用者需求,因而盲目随大流,忽视了利用者的真正需求。

(六)稳定、可行性原则

选题策划要有相对的稳定性和可行性。列入数字化计划的选题要力争能够成功并上网,否则就会造成工作的被动局面和人力、物力的浪费。为了达到上述目的、需要注意两个方面的问题:一是研究分析完成数字化工作应该具备的主观条件,如网站编辑力量、数字化与元数据力量、数字化工作及上传的设备条件和启动及后续资金等,都是完成策划方案应该具备的条件;二是充分估计客观情况可能发生的变化,如利用者兴趣转移、市场供求关系发生变化,都会影响计划的稳定性和可行性,在策划时应该对未来情况的变化有充分的思想准备,在策划指标、完成时间等方面注意留有余地,同时保留一部分机动力量,以便根据新的情况提出新的选题,完成新的任务。

任何战略目标的制定,都要考虑它的可行性。就是必须维持最低生存线。如经济学上所说的“短边效应”所言。应以我们最薄弱的环节来制定我们的计划,这就是为什么必须强调对大多数档案馆来说,讲特色比讲规模更重要。

数字化档案论文篇9

1.人力资源档案数字化管理的意义。

人力资源档案数字化管理是企业信息化管理的重要环节,对提高企业管理效率、稳定员工队伍具有非常重要的现实意义。首先,HR档案数字化管理有助于实现现代企业信息化。人力资源档案的数字化管理是企业信息化建设的重要组成部分,员工薪酬、绩效考核等资料能够为企业经营提供重要数据信息,能够有助于企业实现信息化管理,更为科学地经营和管理。其次,数字化管理能相对安全有效地保存档案资料。传统档案资料多为纸制品,长久保持对于储藏室的空气湿度和温度有一定的严格要求,而且还要定期做防虫防腐处理。但数字化管理模式下,HR档案资料可以转换成数字信息,并且可以刻录到先进的移动硬盘或固态硬盘中长久保存,偶尔遭遇火灾或水灾等非人为因素影响,即便原件损坏或遗失,也不会使宝贵的档案资料全盘消失。而且备份资料同时被毁的几率较低,因此数字化管理能够相对安全有效地保存档案资料。再者,人力资源档案数字化管理有利于提高工作效率和管理水平。传统的手工管理模式效率低下,失误率也较高,而档案资料数字化管理能够使档案的存储、查询、借阅建立在快速、高效、稳定的基础上,促进HR档案管理的标准化和规范化。以往企事业单位查询一份人事档案,需要较多的时间翻查资料库,而且要办理相关的借阅和归还手续,但实现数字化管理后,拥有相应权限的管理者或员工,在企业内网或相关资料库上就可进行查阅,降低了申请查阅时间,突破了上班时间的限制,提高工作效率的同时,降低了档案信息损坏、磨损或遗失的概率。最后,人力资源档案数字化管理有助于量化管理,为管理决策提供可靠依据。人力资源档案的信息管理为用人单位用人提供了综合分析和决策的依据。企业绩效考核的相关数据档案可以帮助管理者发掘效率提升空间,为企业提升和任免提供可靠的参考数据。既能对已有人才资源进行综合的定性分析,也能够实现定量筛选,以实现人才合理的利用,达到个体选优,群体的整体优化组合。在保存的大量档案信息中,为企业管理和决策提供了可靠的数据信息,成为企业决策的助手和参谋。

2.人力资源档案数字化管理面临的问题。

当前企事业单位人力资源档案管理数字化主要面临以下难题:首先,档案数量巨大难以快速电子化。当前,我国很多企事业单位已经实现了财务信息化和沟通信息化,但由于大中型企业的员工数量多,年代资料积累丰富,使得数量巨大的人力资源档案难以快速数字化。而中小企业常常受限于网络、通讯设备等成本因素,也很少实现人力资源档案数字化管理。其次,难以保证HR档案资料的安全性。由于所有人力资源档案的查阅都在网上进行,其档案原始资料被外部黑客或经济间谍窃取的机会就会增加。部分企事业单位仍然未意识到网络安全的重要性,其网络系统的采购设备和网络服务供应商都没有严格的限制要求,导致黑客和经济间谍可以较为轻松地潜入公司数字档案资料库窃取情报。而部分企事业单位的员工警惕性也较低,对于账户信息保存不当,原始密码或登录密码设置非常随意,增加了数字档案的管理风险,比如2014年湖南冷水江市工资条泄密事件,直接反映了员工对于信息安全的忽视。

二、信息安全背景下HR档案数字化的实现路径

由于信息安全是影响档案数字化的重要因素之一,因此本文建议实现人力资源管理的实现途径如下:首先,在保证安全第一位的背景下开发人力资源管理系统。管理平台可以通过Web搭建,或者通过内部局域网建立人力资源档案管理系统,重点是与企业财务管理系统等实现类似的权限管理策略,以保证内部信息安全。企业内部信息系统也需建立防火墙,以防御外部攻击。其次,建立人才信息管理数据库。人力资源已经成为现代企业最为重要的无形资产,准确的人才匹配能够极大地提高人力资源的价值,避免造成人才流失和人力成本浪费。因此本文建议在HR档案数字化管理中建立适合企业需求的人才数据库,将档案资料中的人才信息统一纳入数据库中。通过人才数据库,可以预先设定内部招聘和岗位管理的自动统计分析和岗位匹配,以快速确定应聘人员要求和工作要求,并在人才招聘的过程中,以现有的优秀员工样本作为参照样本选取更为合适的应聘者,以实现高效招聘和培训。企业还可以通过网络平台实现网络视频面试,降低异地招聘的成本,扩大招聘半径,以完善企业员工队伍的结构。第三,建立岗位信息管理模块。企业现有的岗位信息不但包括工作内容、工作资质要求等信息,还应当包括岗位轮换等重要信息,特别是在化工等有毒有害企业,岗位轮换提醒设置可以避免人为失误导致的严重的工伤事故。在提高工作效率的同时,可以更为准确地估计岗位的设置和价值相关性,也使岗位设置管理和岗位价值管理更符合现代企业管理理念。第四,建立绩效考核信息管理模块。绩效考核的具体指标和信息不但能够反映出员工的工作状态和效率,还可以反映出整个工作链条上工作效率和合作水平。绩效考核的数据信息也可以成为采购等部分的重要参考信息,特别是一线操作工的坏件率等信息,不但可以反映出员工的熟练程度,也可以在一定时期内反映出原材料的质量合格率等,为企业管理和决策提供重要的参考数据。第五,建立薪酬管理模块。员工的薪酬信息是企业的重要核心机密,有竞争力的薪酬可以稳定员工的效率,提高员工的忠诚度,激发员工的工作积极性,而薪酬信息的统计和分析也可以成为企业人力资源战略甚至企业战略的重要参考数据,数字化管理的薪酬档案能够更为准确地筛选和分析数据,因此人力资源档案数字化管理将为管理者和决策者提供更有价值的数据资料。

三、实现HR档案数字化管理的难点

数字化档案论文篇10

关键词:数字档案 大数据 档案信息化 存储与利用 知识发现

分类号:G271

引用格式:杜晓艳. 档案信息化的大数据问题与解决对策探析[J/OL]. 知识管理论坛, 2017, 2(3): 244-249[引用日期]. http:///p/1/123/.

1 引言

随着信息时代的快速发展,档案的信息化建设是大势所趋。档案信息化是档案管理从传统实体服务转向数字化信息服务模式的转变,通过数字化档案信息资源和网络化档案的管理过程实现对档案信息资源的合理管理和有效利用[1]。在大数据时代潮流下,大数据所具有的海量(Volume)、多样(Variety)、高速(Velocity)、可用与可信(Veracity)即4V特性,已经体现到档案信息化建设中,出现了“档案大数据”的概念[2]及在大数据技术支持下对数字化档案的深度挖掘策略[3]。然而,传统的档案管理系统难以动态扩展,越来越吃力[4],网络化档案的管理过程迫在眉睫。特别是数字化档案信息资源本身日益成为繁重、冗长而效益低下的工作,数字化后的资源仍然存在“信息孤岛”现象而得不到有效利用。传统的管理与技术体系已经逐渐不能满足要求,如何与大数据环境和技术接轨是档案信息化面临的挑战与机遇。

2 档案信息化研究现状

国内关于档案信息化的研究最早开始于20世纪90年代末,档案信息化的研究源于社会信息时代的到来。随着时代进步和研究的不断深入,的数量呈逐年上升趋势,档案信息化逐渐成为档案学术界的研究热点。研究初期,学者们较多地关注档案信息化的相关理论研究,研究范围主要集中在档案信息化的来源,档案信息化与相关概念、相关工作之间的关系,档案信息化建设的相关内容研究,档案信息化过程中存在的问题及对策等方面。史丽萍[5]认为档案馆与社会信息化紧密相关,探讨了档案信息化的形成,并对未来发展趋势进行分析。李治金[6]分析了档案信息化与企业信息化之间的联系,说明信息化对企业档案事业发展的重要性。张锐[7]对档案信息化理论体系建设的有利时机、建设现状与存在问题,及完善档案信息化理论体系建设的策略和措施进行了探讨。丁立新[8]在分析我国档案信息化发展的机遇与困惑基础上,对档案信息化工作模式、应用系统建设及其运行维护的发展方向进行了趋势预测。王美琴[9]则基于我国档案信息化建设基本现状分析,指出档案信息化过程中存在的主要问题,提出加快实施档案信息化的措施。

随着物联网的出现和云计算、大数据等信息技术的兴起,社会信息化水平越来越高,同时人们对档案信息化的要求也逐渐提高。自2011年以来,国内掀起了大数据研究热潮,研究文献数量呈逐年上升趋势,大数据和档案信息化的结合也日渐紧密。我国学者围绕大数据背景,展开了一系列针对档案信息化的研究。张英奎[10]等分析了大数据时代企业档案管理所面临的主要问题,为使档案管理模式更好契合时展,提出了相关策略。刘国华等[11]建议从服务观念、档案信息质量、档案资源云平台构建三个方面融入并强化大数据技术应用。

国内学者同时还关注大数据技术背景下我国高校档案信息化发展与应用问题。陈晨[12]分析了高校图书馆的档案大数据及信息化现状,从软硬件基础设施、管理人员构成及其业务和安保意识、管理制度等方面提出了相应改进对策。目前国内档案信息化研究发展迅速,已经覆盖数字档案管理、档案信息服务、档案数据挖掘等内容。但总体上讲,我国档案信息化研究还处于初步发展阶段,更多地关注信息技术在档案信息化过程中的应用,理论体系尚不完善;对大数据背景下档案信息化所面临的理论基础和技术问题认知尚\,缺乏对档案信息化技术的具体说明,研究范围和领域有待拓展,研究层次有待进一步深化。

3 档案信息化建设面临的大数据问题

当前大数据技术的示范应用主要包括社交媒体数据分析、互联网广告、地理坐标及商务智能[13],主要应用于数据挖掘与决策层面。但从长远看,以上领域会拓展到数据长期保存、信息系统管理等方面。任何新技术的应用都与社会环境密切相关,显示着技术的社会性,并受到各种社会条件的制约和影响[14]。在档案的信息化建设过程中,大数据技术应用在元数据与数字化档案信息资源的存储、可追溯、利用的时效性、知识服务的可用性等方面面临一些问题。

3.1 数字档案资源存储问题

只有对所收藏的数字档案资源进行可信的、长久保存的系统才能称之为数字档案馆系统[15]。档案的特性在于持续记录不断发展的历史过程。因此,数字档案资源的存储是个永久的量增过程,需要不断扩充存储载体来支持这样的增长。此外,任何材质的载体受到自然环境及技术进步的影响,都会逐渐丧失载体的功能,从而影响到所记录的信息。实现永久保存就意味着按照一定的时间周期,对于需要永久保存的档案资源定期进行数据迁移,以便对数据进行载体更新、技术更新、管理更新,使得信息资源能够不断保存下去,这是档案实现可靠长期保存的基本要求。

数字档案的数据由描述档案实体内容的数据与描述数据的数据(元数据)两大部分构成。档案数据一般具有只读特性。因此,数字档案的著录、标引、索引、目录等元数据相对容易进行标准化。但是其实体数据的数据类型、格式、结构等会随着技术革新不断发生变化,其所承载的信息完整性与可靠性受到挑战。对于数据量的规模增加可以通过不断增加相应的软硬件设备来应对,但量的规模到一定程度后有可能导致对数据的控制力下降甚至系统崩溃。大数据环境下,数据迁移是最难应对的考验。尽管可以通过传统关系数据库的三级模式来维持迁移过程软件的独立性,但迁移的数据量会越来越大;迁移数据的数据结构及附载其上的信息含义越来越复杂;迁移的周期随着技术革新节奏的加快,周期越来越短。传统的数据库模式已经不能有效应付迁移的复杂性,特别是现有的系统经过技术或管理革新重组后,数据的类型、结构、约束等都存在转型问题。维护档案的真实性和可靠性面临着巨大挑战。

3.2 数字档案资源的可追溯问题

从纵向角度通过档案能了解其反映出的基本语义、产生的背景、来源及原来制档机关的目的,而且也能够发现不同档案资料存在的相关性,即档案具有可追溯性。虽然档案本身一般是按照一事一案以案卷、全宗等作为关联的单位保存的,但是一因多果或一果多因在现实的社会环境中广泛存在。所以对档案的可追溯性并非局限在案卷内或全宗内,往往需要利用数字档案的特点进行复杂的关联查询与分析利用。而且,随着不同行业、专业领域之间的互相渗透,互相之间的相关性会越来越多,越来越复杂。此外,数字档案全宗及案卷内往往存在文本、图像、视频等异类及同类但异构的数据,用户的追溯需求也会越来越多元化。

由此使得数字档案的可追溯性在不远的将来日益成为一项艰巨的任务。即使数字化的信息系统在理论与实践方面能够在逻辑上实现这样的复杂关联,但是所导致的时间与空间复杂度会使成本巨大。此外,数字档案由于对各层次软硬件环境及原始档案管理制度的依赖,需要大量的元数据来描述,而元数据与档案内容之间虽然存在逻辑关联,但是在物理上常是独立的,这种关联往往随着技术环境的变化表现为一定的脆弱性。传统意义上的量或规模已经不再是衡量复杂性的第一要素,复杂关联与聚集引发的数据复杂性远远超过规模的复杂性效应[16]。可追溯性是数字档案长期保存的可用性基本要求,日益复杂的关联性与高效、可用及可信是矛盾统一体,也是大数据环境下必须面对的问题。

3.3 数字档案利用的时效性问题

在一般性事务查询利用方面,对于以关系模型存储的档案元数据,标准SQL查询的结果与响应时间(时间复杂度)受到数据量与关联数的限制,理论与实践上不可能无限制扩大。如果数据库中包含了图像、大文本、视频等大二进制字段,检索效率更会大打折扣。此外,为了加强对数字化档案的利用,会在原始分类的基础上要求有更多的逻辑分类,以便于进行关联分析。由此,在检索过程中,会造成数据库之间、数据表之间复杂的、大数据量的关联运算。另外,现有的数字档案系统一般均要求支持全文查询,现有技术针对全文查询一般是建立在对相关文件穷举式扫描基础上的,在具体文件不确定的情况下,如果涉及到跨库、跨文件查询,在EB级数据量下,这几乎是不可能实现的。

因此,一般的解决的方法就是纵向不断增加层级及横向采用更广泛的分布系统,但不会解决时间复杂度越来越大、系统熵越来越大的根本问题。

3.4 数字档案知识服务的可用性问题

在对信息资源进行分析或进行知识发现研究时,首先要求信息资源能够按照知识发现主题的需要建立多维度分析模型,建立各种复杂关联。现有的数字化档案体系一般是传统纸制档案的数字化转换。受制于其传统载体及立档单位,其数字化副本在物理与逻辑结构上都存在小集中、大分散的现象。小集中指的是档案的保存逻辑上体现的立档单位一般以全宗榈ノ唬事由以案卷为单位,关联方式一是通过文件物理存储的集中性来体现,另外通过大量的元数据描述在逻辑结构上体现;大分散指的是不同地域、不同机构之间的数字档案资料缺乏关联,形成一定规模的信息孤岛。虽然有利于保证档案案卷的整体性及体现原来制档机构的目的,但是不利于按照一定分类主题形成大规模的数据集市或数据仓库。数据挖掘形成的语义关联或知识图谱可信程度大打折扣。检索查询及查询后基于批处理的分析计算在数据量及非结构化达到一定程度后,很难保证其可用性,更不能保证其高效性。

此外,档案信息化还面临着元数据与数据结构问题。现有的元数据主要存在于关系数据库中,关系结构以行记录为单位,而大数据技术环境下的数据库往往是以列为单位,这样就需要对原有的元数据结构进行重新设计,也就是现有的元数据结构也需要发生相应的变化。大数据技术应用面临着与原有系统冲突的问题。

另一方面,大数据技术应用还存在对关联粒度及层次结构制约的问题。在实际应用中,数字档案之间的逻辑关系相对具有较多的层次结构。除了档案实体文件内部的相关性外,还存在案卷与案卷之间的联系,同一案卷中 “件”与 “件”之间的联系,不同级别的档案管理联系。这些关联具有一定的“立体”特征。但在现有的大数据技术环境下,由于数据结构相对简单,重在对异构、海量数据的“平面”关联分析,因此,如何将数字档案的数据结构重新组织,在不破坏其固有的立体联系情况下,实现高效率的大数据分析将是极大的挑战。

4 档案信息化建设中大数据问题的解决对策

4.1 加强数字档案资源存储

档案数字化是借助计算机网络技术和多媒体技术发展而产生的一种新型档案信息形态,将各种传统载体的馆藏档案资源转化为数字化档案信息,以数字化形式存储、网络化形式传输并利用计算机系统进行管理,进而实现档案信息的快捷利用与共享[17]。数字档案数据在保存中需要按照时间序列或事由进行分类与关联,追求的目标是将存储管理由载体控制转化为软件控制。传统的模式对数据的结构、操作及约束有一定的范式要求,采用转储方式或基于分布式数据库系统的模式。通过中心管理服务器将分布在不同节点数据库中的数据实现逻辑上的统一管理,存储的方法一般是将结构化的关系模型作为元数据信息存储的数据结构,以此来关联实体档案。关系型数据库虽然能够实现比较复杂的关联,但对数据量非常敏感,具有较大的时间与空间复杂度。在档案信息化建设过程中,利用大数据存储技术加强数字档案信息资源存储,如通过GFS(Google Files System)、HDFS(Hadoop Files System)等分布式文件存储系统,能够处理非结构化数据并实现关联,自动建立基本的索引元数据,适合半结构化数字档案信息资源的存储与处理。

4.2 维护档案静态特征及迁移过程的可靠性

原始记录性是档案的本质属性之一,客观上要求其所依赖的软硬件环境、依附的载体及其语义能够维护其所记录信息的原始性、真实性、可靠性等静态特征,同时要求随着信息技术的发展能够实现一致性的数据迁移,从而保证档案信息的可追溯性。

大数据分布式文件存储系统能够将文件或文件夹中的对象直接转化为二进制数据序列,忽视其中的具体格式或结构,对各种形式存在的档案资源在底层实现智能化存储与处理,在更高的层次上再进行利用分析;此外,大数据技术更适应对大文件的处理,如HDFS文件系统,可将要存储的非结构化数据按照统一二进制大小(64M)进行分片、多点备份、并行处理,形成一系列的(key,value)键值对,然后按照键进行归并,对相同键的值进行结果汇总与合并。这也符合档案文件的组织特点(以“件”或“卷”组织成复合文件)。由此能够很地维持档案资源存储与利用过程中的完整性、可靠性,实现档案数据变换、整合及利用的智能化,可以针对档案案卷的组织特性,将其以复合文件或文件类集合的模式进行多种形式的组织,然后按照全宗建立群节点,从而简化数字档案文件存储管理的层次级别。

4.3 维护数字档案的时效性和可用性

大数据技术可以通过弱化关系降低数据模型的复杂性,统一电子文件的物理与逻辑集成(集成指在文档管理范畴内,将电子文件及其内容信息、结构信息、背景信息采用一定标准、规范和编码进行融合[18])。分布式键值对的存储系统能够实现面向列的、可伸缩的数据存储模式,将不同类型、不同结构的海量数据按照列簇存储到同一文件中并实现性能良好的随机访问,使数字档案按照事由进行物理封装成为可能。相应地也可以使内容信息、结构信息、背景信息具有逻辑与物理上的统一标识与封装。此外,存储的结构支持多维特性,能够在结构上实现动态改变,可以在不影响原有数字档案内容及结构的前提下,实现行、列、时间戳的动态扩展,由此可以实现数字档案内容的动态扩展。自动生成索引的机制可将非结构化的数字档案实现半结构化,实现更紧密的结合,进一步维持数字档案在长期保存过程中的完整性。如果能够与现有系统中数字档案的标准元数据进行关联,共同实现对档案内容信息的索引及描述,会极大增强数字档案的可用性。

档案一旦形成后在内容上就不能再修改,大数据技术对数据修改的敏感或不支持并不影响档案的长期保存,反而成了档案长期存储的一种优势。首先是大数据技术所支持的文件系统通过不断增加硬盘数量实现容量的智能化增长,存储采用集群架构的管理与多重备份并基于智能化容错,读写模式采用基于二进制的分块、并行处理、合并的方式,而且所使用的文件系统一般不限制文件大小及格式。因此,在构建数字档案存储系统时,无论从逻辑上还是物理上都能够有效维护档案资源的原始记录性特征。

4.4 实现档案信息的关联性分析及知识发现

数字档案的存储在数据结构上大都具有半结构化特性。一方面由于档案数量与种类的多元导致的海量、异构等非结构化特征;另一方面数字档案一般都有结构化、标准化的元数据描述及电子标引等元素。因此,随着数字档案资源的不断增加,完全Y构化或完全非结构化的资源形态均不多见。将结构化元数据与非结构化的档案实体描述数据按照一定的模式关联成半结构化模式,日渐成为数字档案资源组织的基本模式。大数据技术环境可以提供基于键值对的分布式存储与处理,能够在海量、异构数据中自动寻找出文字间的语义主题,有利于面向领域对本体的主题知识构建。此外,面向列的、可伸缩的半结构化数据库存储模式,如基于HDFS的Habse数据库管理系统,能够在行、列、时间维实现动态扩展,通过行关键字、列簇、列关键字、时间戳形成多维表。一方面能够实现复杂的半结构化与非结构化数据之间的关联,另一方面也有利于形成领域、论域、主题三个知识关联层次。由此,为异源、异构的数字档案进行数据挖掘与知识发现提供了基本的技术支持。

5 结束语

尽管档案信息化工作所面临的大数据问题突出,相关的研究重点主要聚焦在档案所具有的大数据特征及相关的管理与利用宏观策略方面[19],但大数据技术所具有的分布式、云计算、智能化特征,及对海量、异构数据处理所具有的优势与数字档案管理的现实需求具有一定的吻合度。与此同时,对大数据及其相关技术应用于数字档案管理的深层次问题需要进一步理解与把握,例如大数据技术如何为档案存储、迁移及跨部门与平台的知识发现提供支持,以及应用于数字档案管理所需要面对的信息系统重构、信息及数据转换层次划分问题等。大数据技术及其生态环境是信息技术发展的必然趋势,促进着通常的数字档案以及包括数字图书资源等泛化“数字档案”相关管理理论与技术的快速发展[20]。

参考文献:

[1] 王学平. 浅议我国档案数字化建设实践与发展策略[J]. 档案学通讯, 2011(6): 54-57.

[2] 鲁德武. 试述档案大数据的定义、特征及核心内容[J]. 档案, 2014(4): 13-15.

[3] 张文元, 张倩. 大数据技术与档案数据挖掘[J]. 档案管理, 2016(2): 33-35.

[4] WANG X C, DING J Y. On innovation of archive management in big data era[C]//中国科学技术信息研究所. 大数据时代的科技资源共享: COINFO 2013论文集. 北京: 科学出版社, 2013: 66-72.

[5] 史丽萍. 档案信息化形成与发展趋势[J]. 黑龙江档案, 1999(6): 31.

[6] 李治金. 谈档案信息化与企业信息化[J]. 档案与建设, 2003(1): 52-53.

[7] 张锐. 档案信息化理论体系建设的理性思考[J]. 档案学研究, 2008(2): 49-52.

[8] 丁立新. 档案信息化的发展趋势[J]. 档案学研究, 2009(4): 12-14.

[9] 王美琴. 我国档案信息化过程中的主要问题及对策[J]. 档案学研究, 2011(1): 64-66.

[10] 英奎, 王飞, 房彦君. 大数据时代的企业档案信息化建设[J]. 北京工业大学学报(社会科学版), 2014(3): 32-36.

[11] 刘国华, 李泽锋. 档案工作中大数据框架构建及应用思考[J]. 档案管理, 2014(2): 32-34.

[12] 陈晨. 基于大数据的高校图书馆档案信息化建设探究[J]. 兰台世界, 2015(23): 143-144.

[13] 李战怀, 王国仁, 周傲英. 从数据库视角解读大数据的研究进展与趋势[J]. 计算机工程与科学, 2013, 35(10): 1-11.

[14] 常立农. 技术哲学[M]. 长沙: 湖南大学出版社, 2003: 14-15.

[15] 冯惠玲, 刘越男.电子文件管理国家战略[M]. 北京: 中国人民大学出版社, 2011: 350.

[16] 何非, 何克清. 大数据及其科学问题与方法的探讨[J]. 武汉大学学报(理学版), 2014, 60(1): 1-12.

[17] 王美琴. 我国档案信息化过程中的主要问题及对策[J]. 档案学研究, 2011(1): 64-66.

[18] 赵屹. 基于前端控制思想的电子文件形成过程研究[J]. 档案学研究, 2012(3): 16-23.

[19] 石俊峰, 周俐霞, 付双双. 大数据时代数字档案资源管理研究现状与趋势分析[J]. 信息安全与通信保密, 2014(9): 87-89.

[20] 苏新宁. 大数据时代数字图书馆面临的机遇和挑战[J]. 中国图书馆学报, 2015(6): 4-12.

Analysis on Big Data Problems and Technique Supports of Archives Informatization

Du Xiaoyan

Shenzhen University Library, Shenzhen 518060