透析中医药科学数据建设的初步设想

时间:2022-05-16 05:55:00

透析中医药科学数据建设的初步设想

随着科技部基础性工作“医学科学数据共享工程”的开展,中医药科学数据的建设也从单一品种走到了全面发展的阶段,并对整合全领域的资源提出了更高的要求。目前,中医药科学数据中心的建设,无论是在数据资源、建库技术、建库人才方面都有了一定的基础,如何提高数据库建设的整体水平和综合服务能力,有效地管理科学数据,为中医药信息化科学研究提供充分的数据资源保证,是中医药科学数据中心今后应该深入研究的问题,也关系到中医药科学数据中心的可持续发展。笔者从以下几个方面对中医药科学数据中心的建设进行探讨。

1资源体系建设

资源体系的建设首先是资源调查,它是数据库的建库基础,只有在全面掌握数据库资源的基础上,才可能对未来的工作进行规划,对未来建库的技术提出需求。目前,中医药科学数据中心已经完成了中医药科学数据资源手册研制,但中医药科学数据中心受到人力、物力、财力的限制,较少开展真正切合实际的数据资源调查研究,比较随机性较大,往往是找到什么样的资源就做什么数据库,申报项目也比较盲目,这些都给完成项目任务带来了一些困难。如果我们能够很好地开展资源调查研究,至少可以确定今后三五年的建库目标,减少盲目性,也可为人才的培养把握一定的方向。

在资源调查的基础上,要制定数据库的建库规划,规划应包括数据库的建库方法、建设时间及建设的技术准备。根据数据资源的不同属性,分别提出不同的数据库建库方法,哪些数据库要建成关系型的数据库,哪些数据库要建成结构型数据库,哪些数据库是全文型的数据库,哪些数据库是多媒体的,等等。哪些资源目前可建成数据库,哪些还需假以时日等待数据资源的成熟,使之能够很好地把握未来,对未来有所准备。

数据库的建设要采用分步施实的方法。数据库的建设是一个艰苦的过程,在调查资源规划、数据库的基础上,还要有足够的人力、物力、财力以及计算机技术的支持。采用分步实施的方法,充分讨论实施的方案,哪些数据库可在最短的时间内采用最简单的方法就可建成,哪些数据库目前可建,但成果需要长时间的建库积累,哪些数据库目前我们还没有很好的方法,必须先进行计算机技术的探讨。数据库的建设必须追求完美性、实用性、真实性,不论是简单的数据库还是复杂的数据库,要求我们在建库的过程中少走弯路,建成一个使用一个,即使是在建设之初功能不够完善,但是数据库的设计必须合理,具有实用性。

2管理体系建设

中医药科学数据管理体系的建设分为3个方面。首先是项目管理体系的建设。随着中医药科学数据中心的飞速成长,我们的数据库建设已从单一的中医药文献期刊数据库,成为了多类型全方位的数据库群,加强对数据库群项目的科学管理已成为必须研究的问题。应该采用计算机技术对常态数据库的与动态数据库进行管理,动态数据库多为复杂多数据集的关联型数据库,数据库主管人员可以监测到自己所管理的数据库的动态变化,但这种监测不直观也不方便,服务器直接操作也影响数据库的安全性,管理者与决策者无法监测数据中心的全部数据库进展程度。加强计算机技术对数据库科学管理的研究,建设数据库科学管理体系,包括对动态数据库与常态数据库的监测、建库程序运行监测等等,可最直观地展示数据库的进展,最大程度地减少人为干预。

其次为共建人员管理体系的建设,中医药科学数据中心经过多年的建设,现在已形成了全国近30家分中心200余人员的数据制作加工队伍,目前每一个项目均形成了人员的三级管理制度,这种制度有效的保障了数据库工作条块清晰、互不干扰及各种数据的安全。同时,这种管理也具有很大的缺陷,条块分隔明显,难以统一管理,同一个人员参加多个数据库的建设,没有统一的权限,密码账户多样,给加工人员造成混乱。项目高层次管理人员无法统一管理,每个项目的人员管理互通性与共融性极差,不同的项目管理人员无法介入其它项目的工作,只能局限在自己所管理的项目,对其它工作了解甚少,也无了解的途径。因此,加强共建人员管理体系的建设也是当务之急,要建立一个基于一个平台上的人员管理体系,这个体系不仅要保留原有的数据库条块清晰、互不干扰、数据安全性好的特点,还要具有人员管理唯一性(各数据库密码账号统一,或密码账号不统一但可查询)、直观性等特点。

第三为档案文献资原管理体系建设。中医药科学数据中心经过多年的建设,已形成了大量的技术档案文件,这凝集了研究人员的大量心血,如各种课题项目申请书、预算书,成果申报书、各数据库的技术文档、各种程序的开发文件、各种数据库加工制作培训教材、各种总结等等。目前我们对已形成的文本文件进行了档案管理,但大量的电子文档还都散在不同的计算机上,没有形成有效的管理,查询整理非常困难。应该加强对档案文献资源管理体系的研究,对所有资料进行分级分类,确认保密级别,注意知识产权的保护,利用我们数据库的建库优势,建设档案文献资源管理系统,研究存储这些电子文件的方式,开发查询检索的方法,确立文件的等级制度,更有效地保护这些文件,更方便地查询这些文件。

3标准规范及数据评价体系建设

中医药科学数据标准规范的研究是非常重要的一个方面,是科学数据共建与共享的前提,它的作用是在科学数据范畴内促进科学数据共建与共享的科学化、合理化和工程化,使数据库工程建设在一开始就能够自上而下地遵循规范化的途径有序地进行,减少无效的建库劳动,从而提高科学数据共享工程建设的效率。只有在统一标准的前提下,科学数据共享的总体目标才能够有效地实现。科技部科学数据共享标准体系分为3方面:指导标准、通用标准和专用标准,共32项标准,这些均是管理性标准。目前我们已经研制了中医药科学数据元数据标准、中医药科学数据分级分类标准,但是还没有详细著录所有数据库的元数据,我们的分级分类标准是否合理,有待于实践的检验。还要根据医学数据中心总平台管理性标准的研究进展,继续研究相应的近30项管理标准。数据库建设标准更是实际操作中不可缺失的重要内容,数据库的建库质量保证了数据库的生命力,多年的实际工作也使我们体会到,标准的建设要密切结合数据库的建设,只有和数据库建设相融合的标准才有生命力。数据库建库加工制作标准的研究是一项长期的工作,只有在动态的加工数据库的同时,才能不断地完善标准、更新标准。标准词的建设(包括临床术语和语言系统)还需要深入探讨标准颗粒度粗细问题,颗粒度太细导致数据过于分散,不能形成有效的查询检索结果,反之标准过于粗放,又影响数据的准确性,如何确定颗粒度粗细,这需要对数据进行深入研究。改变了标准,如何回朔以往的数据,如何将以往非标准化数据库更改为标准化数据,也需要研制相应的程序,定期进行整理研究。

对现有数据库进行评价是一个重要的方面,它关系到数据库今后的发展方向与可持续发展问题。一个优良的数据库并不应该由建库人员主观判断,应该有一套评价体系,这个评价体系应遵循公正性、科学性、可操作性的原则,包括专家评价、一般用户评价、决策层评价、自我评价等等。多年来我们除对个别数据库进行过专家评价外,基本没有形成一个有效的评价体系,这也不利于我们及早的发现问题,完善数据库,扩充数据库使用领域。建设有效的数据库评价体系,将有助于中医药科学数据建设可持续性发展。

4共建与共享政策支撑体系建设

政策体系的研究包括数据资源政策、数据共享政策、资金政策、人才政策等等的研究,针对中医药科学数据库研究过程中所产生的数据库与拥有的科学数据资源,深入分析各种相关利益,如国家利益、集体利益、数据产出者利益、数据提供者利益、数据服务者利益等,通过政策与规范的研究和建设,实现科学数据最大程度地共享,最有效的知识产权保护,最佳的数据利用度和数据增值服务,最大程度的调动科研人员的积极性,充分发挥中医药科学数据资源在中医药科学研究中的巨大潜在作用。立足科学数据库资源,研究制定数据共享的政策性的保障措施,建立政策层面的可行性数据共享保障体系,可为科学数据共享提供政策调控、法律规范和技术标准等各个体系的保障,从国家层面上统一规划中医药科学数据库的数据共享技术框架。

5服务体系建设

目前中医药科学数据中心服务体系建设是比较薄弱的环节,人力、物力各方面的投入不足,导致科学数据服务体系建设与研究的不足。服务体系的建设应包括服务方式与服务内容等方面。目前我们的服务方式有两种,在线服务与离线服务,应重点研究导航方式、数据查询方式、图片与图形展示方式、原始数据与数据集等查询与利用方式的研究。

随着数据库建设水平的提高与数据库建库技术的提升,数据库群整合的资源越来越丰富,越来越广泛,目前我们已经提供了50多个数据库的服务,随着工作的进展,今后有可能提供上百个数据库或数据集群,这些数据库的种类有关联结构型的、单表型的、多媒体、全文图形等。要对数据库内容的进行深入研究,哪些数据库可成为一类,哪些数据库可具有关联性,检索界面可分门别类多层次展示,利于扩展使用者的思路和联想,继续加强中医药科学数据本体查询研究。

6技术与运行体系建设

科学数据库系统平台项目,主要基于计算机网络与网格技术、元数据目录技术等,实现对科学数据库分布、异构的数据资源的共享、集成。科学数据库系统平台的建设任务主要包括三方面内容,即硬件环境建设、系统平台软件的开发、先进应用系统的开发。

科学数据库系统平台的维护分为硬件环境的维护、软件系统的维护两个方面。硬件环境的维护主要进行日常的硬件维护,包括对网络设备、服务器、其它各类设备的维护。软件系统的维护包括对软件系统的更新、升级,软件系统的性能调整,元数据目录库的备份、恢复等,以此保证整个系统的正常运行。

中医药科学数据库的日常维护按照指定的《科学数据库日常维护规程》进行,日常维护的内容包括运行环境的监控、软件系统运行状态监控、元数据目录库的备份管理、数据库系统的备份管理等。日常运行维护应通过专门设计的运行支持系统来进行,可以监控系统的当前运行状况,对数据备份、元数据备份等日常操作提供有效支持。

技术支持主要针对个建库单位在数据库建库、数据库日常维护过程中出现的技术问题提供有效的支持。主要包括在数据库建库中协助完成数据库模式设计、应用系统结构设计、元数据建设等,在日常维护中对数据管理、数据备份提供技术指导,并在出现系统运行异常时进行更加有效的支持。

7小结

中医药科学数据建设应围绕全面提升国家科技创新能力,实现推进现代化建设的国家目标,以科技创新为动力,以需求为导向,以政策法规为保障,实现科学数据资源的规范化管理与高效利用。以共享促进应用,最大限度地发挥科学数据的潜在价值,强化对科技进步与创新的支撑能力。