高职院校数据治理体系建设研究

时间:2022-06-08 14:55:24

高职院校数据治理体系建设研究

摘要:本文主要研究了基于大数据环境下高职院校数据治理方法,提出高校数据治理过程中存在的最主要问题;针对该现状,分析数据治理过程中产生数据问题的原因,借鉴质量管理体系中的PDCA循环理论,结合高校数据治理的工作实际,探索高校数据治理体系的建设途径。

关键词:PDCA理论;数据治理;数据质量;智慧校园

自2000年以来,伴随着国民经济和信息科技的蓬勃发展,国内高职院校的师资力量、教育资源、基础设施等皆有着大幅度改变。当今,新一代信息产业技术给人们带来前所未有的发展机遇。在人工智能及大数据技术的强力推动下,互联网及网络应用平台实现广泛应用。高职院校在信息化建设进程中其智慧校园应用缺口持续攀升,在当前阶段,如何运营一站式网上办事大厅创建管理数据、网上智慧学习空间拓展、师生行为管控系统等,来妥善解决数据信息不对称,继而获取更加理想的数据治理能力已然成为国内高职院校最为关注的课题。对于国内高校而言,数据资产、技术应用等不再是难以规避的制约因素,数据治理工作重要性愈加凸显。新形势下,国内各高职院校将数据视为战略性资源,并将数据治理工作置于极为重要的位置。基于数据治理的紧迫性,国内高职院校希望通过建设主数据库中心、数据分析平台等提高数据采集与分析能力,促使数据治理工作实现有序推进。在数据管理活动中数据质量问题客观存在,究其原因在于数据治理统一管理体系缺失,数据治理过程并未得到应有关注及系统解决。需要注意的是,数据治理难以做到一蹴而就,是一个循序渐进最终步入良性循环的持续性系统性工作。

1数据治理过程中存在的问题和分析

国内高校数据治理的研究大多都是为了方便数据管理和信息互通,在关于提高数据利用率的研究中,数据确权、数据检查、数据更新、数据质量、数据监控等问题,仍然是现在各高校研究的重点。国内许多学者从不同角度和不同层面提出了高校范围内的数据治理思路,在教育信息化的改革发展方面取得了丰硕的成果,但针对高职院校数据治理体系建设的研究还是较少。首先,国内高校很多管理者加大了对数据管理工作的关注,但是未能提出针对性的核心要求。在数据治理关键因素缺失的情况下,工作人员无法确定工作重心,其数据治理效果不甚理想。经过调研发现,国内高校内部业务信息系统多是由不同厂商提供,数据关键词段侧重点不同,接口适应性、可移植性较差。在数据集成共享方面,国内高校所拥有的自主控制权较少,习惯性依赖厂商。在此境况下,数据开放力度无法得到真正改善。此外,面对多源异构数据,国内高校未创设能够进行可视化处理的平台,结果导致无法结合数据生命周期开启全方位监管与督促活动。其次,国内高校未完成数据治理体系创设,缺少数据管理工作组织,仅仅是将注意力集中在数据管理平台与工具建设中,忽略了数据治理管理制度的制定与执行。这也是高校数据治理工作中,数据孤岛、数据质量不理想、数据准确性问题等频频出现的关键,且亟待改善。再次,在数据治理过程中,部门间的配合度较低,虽然能够做到数据互补同步,可是缺少标准化同步管理。以业务部门为例,习惯性“要数据”,却抵触“给数据”,数据流动性备受影响。与此同时,习惯性以部门工作要求为重点,对部门数据的存在价值和意义了解不足,其数据质量意识和数据治理意识较为匮乏。最后,从宏观角度来看,国内建立校本大数据标准体系的高职院校并不多见。从实践角度来看,数据正确率较低、信息标准不一致、数据格式不够规范等问题屡见不鲜,继而导致数据应用价值无法得到体现。基于上述分析能够发现,在高校数据治理活动中所存在的客观问题,也是导致其数据质量不理想的关键。

2PDCA循环理论与数据治理

PDCA循环理论(即戴明环)是美国知名学者戴明的理论研究成果。该理论是基于休哈特构想予以形成的科学工作程序,早在初始发展阶段被应用至企业质量管理活动中,随后在管理领域内大放异彩。PDCA循环是本着循序渐进的原则,结合时间因素,将质量管理系分为四个阶段,即Plan(计划)、Do(执行)、Check(检查)和Action(处理)。在质量管理实践活动中,需要参考这一理论将整体工作任务进行拆分,遵循计划制定、计划执行、成果检查、反馈处理等工作流程,促使各工作环节向着标准化方向发展,弱化不确定因素带来的负面影响。这一作业方式不仅仅有助于工作质量改善,同时为企业管理工作提供了有力支撑。PDCA循环管理过程由四个单独的部分予以组成,彼此间存在循序渐进的内在逻辑关联,通过循环反复,促进管理闭环形成。第一部分为计划(P)阶段,结合管理实际工作来看,该阶段中的重点包括质量管理计划的拟定、管理目标确定、管理举措形成。根据高校数据治理工作要求,其工作重点能够被细分为数据治理规划制定、数据治理目标明确和数据管理制度建设流程形成。第二部分为执行(D)阶段,在实践活动中,主体需要以既定质量管理方向为导向,基于部署运行,促进质量管理目标实现。结合数据治理工作来看,该阶段中的重点包括依赖现有数据管理工具完成数据采集、分析和梳理,注重数据质量监督的实施,精准定义数据质量规范,实现对劣质数据的正确识别,推动数据管理工作稳步进行。第三部分为检查(C)阶段,通过检查知悉执行结果,经过比对分析,对存在于执行结果与预期目标之间的差距做深入研究。结合数据治理工作来看,需要通过检查和分析对数据管理平台建设工作做全面了解,理解数据管理工具存在价值,对数据所具有的规范性和精准性加以评估,促进数据质量跟踪报告、劣质数据质量分析和整改方案形成,实现对数据管理工作的监督与合理管控。第四部分为处理(A)阶段,需要本着抓主放次的原则对现存质量问题做妥善处理,持续优化工作质量,完成修订质量计划的制定和实行。结合数据治理工作来看,应按照工作流程将数据质量问题向数据源头部门予以反馈,通过修改抑或是清洗数据、促进数据源输入行为的规范性发展,促进数据管理工作质量改善。

3数据治理的PDCA管理模型

对于高职院校而言,数据治理工作并非易事,需要得到全校教职员工的支持和参与,参与主体数量众多,且依赖各部门间的合作。一方面,涉及线上线下数据配合。另一方面,又需要实现管理业务与数据业务的同步处理。一言蔽之,数据治理工作兼具精细化、严谨性等显著特点,是一项循序渐进的系统性工程。本文基于NikThompson等所描述的DGI数据治理框架和SoaresS所描述的IBM数据治理统一流程,将PDCA模型理论应用于高职院校数据治理全过程。通过此方法,分析和梳理高职院校在数据治理工作中存在的诸多短板,提出系统解决方案。通过图1所示能够直观了解到数据治理的PDCA模型。(1)计划阶段数据治理的计划阶段在全过程起到提纲挈领的作用,决定着数据质量的改善情况。高职院校应注重数据质量评价体系及评价标准的形成和应用。通过规范性文件颁发,明确数据治理思想及治理目标,完成数据治理工作组织的创建,按照学校各部门职能明确其参与数据治理路径及工作重点。对学校现有数据进行区分,明确质量标准和数据治理中的管理范畴,形成切实可行的数据采集及交换流程,为实现对有限数据资源的合理应用,完成数据应用管理制度及质量反馈机制的制定,注重其存在价值体现。在计划阶段,将确定数据治理工作组织作为重点,在注重其稳定性增加的同时,持续优化数据治理工作作业效率,以便为数据治理工作有序推进保驾护航。与此同时,对国内高职院校的发展概况及组织结构做必要分析,基于分析结果,对数据治理项目的执行机制予以明确,详细阐述其工作职能及管理任务。对数据治理工作组织进行细分。具体组织架构如图2所示。通常来说,决策层是由高职院校分管领导者及信息化决策组织所组成,由其负责围绕学校数据治理工作进行讨论,明确工作思想及工作目标,为数据管理工作指明努力方向,并加强对各部门的监管和指引。组织协调层的工作任务是对数据治理工作进行统筹规划,为业务部门和信息化部门提供指点,进行答疑解惑。执行层由业务部门、信息化部门及其工作人员所组成,属于是数据治理工作的直接操作者,其工作态度与工作能力直接决定着高职院校数据治理的规范与深入程度。(2)执行阶段该阶段重点是通过设计和执行数据治理将数据治理工作落实到位。该阶段的所有工作皆需要以目标为导向,注重不同治理工作与相关规章制度、工作流程间的匹配度。从具体工作来看包括以下几点,一是数据管理平台的建设,二是业务数据主体的分类设计,三是相关数据模型打造。对于业务部门而言,应注重数据的采集,分析和交换,并明确数据来源。存在于数据质量工作中的治理环节是重中之重,应注重全面数据质量管理工作制度的创建和应用。在促进全面数据质量管理工作制度形成的准备阶段中,需要针对数据质量进行评估。在评估环节,将数据完整性、安全性、唯一性、及时性、准确性等等作为评估关键点。与此同时,分析数据质量维度与业务客观所需间的契合度。定义质量规则时,还需要加强对数据长度、时间精度等影响因素的客观了解。伴随着数据质量规则的形成,参考业务规则及工作流程实现对数据质量的进一步分析完善。(3)检查阶段这一阶段的主要工作是本着循序渐进的原则评估实施效果,探察数据质量,注重数据错误报告的形成与分析。其中,数据质量检查工作发挥着举足轻重的影响。在该工作环节中,高职院校业务部门和信息管理部门属于责任主体,全校教职员工及学生等数据使用人员则是其中的客体。在具体检查活动中,其检查方式主要有主动检查和被动检查。主动检查是指参与主体在管理范围内主动履行其岗位职责,围绕数据及相关工作进行检查,同时在软件帮助下形成数据分析报告,完成查漏补缺。被动检查是指数据治理中的客体将存在于实践活动中的数据问题反馈至校方,然后由校方安排参与主体有针对性地对反馈数据问题进行核实。对于高职院校而言,应本着未雨绸缪的原则为师生等数据治理参与客体反馈相关意见提供可行路径。譬如,通过个人数据中心创设,明确用户权限等。作为教职员工能够通过个人数据中心实现对个人基本信息、学生信息、教学信息、科研信息等相关数据的获取;作为学生能够通过个人数据中心知悉个人基本资料、学习成绩、学习计划等数据。在检查阶段中,一方面需要通过仔细检查找寻漏洞,并进行弥补。另一方面对那些频频出现的错误数据做深入分析,探究问题成因,制定具有针对性的应对举措,持续优化数据治理过程及治理效果。在数据检查阶段中,数据治理工作居于核心地位,只有通过不断查漏补缺,才可能促进数据治理目标实现。(4)处理阶段在处理阶段中,应参考检查结果,对现有问题进行区分,基于追根溯源的原则,对数据问题进行一一排查,并注重数据治理流程优化。作为高职院校的业务及信息管理部门,面对主动排查结果或师生反馈数据问题,均需要对数据源头做精准定位,参考实际因素,梳理数据流转过程,探究问题成因,明确相关责任部门,并做妥善处理。如数据源本身存在问题,那么数据源头部门应实事求是进行更正,此时相关责任人应及时优化数据录入流程。如果存在客观所需,可以选用技术手段提升数据录入质量。如在数据流转过程中存在问题,那么需要由信息部门出面对数据采集、数据交换等同步机制进行着重分析,探究数据流动方向,采取针对举措,完成本阶段数据处理流程。此外,为避免同类故障频频出现,有必要通过修订规章制度,赋予工作流程更多标准化特点,力求避免在下一个PDCA循环过程中再次出现类似问题。PDCA循环管理模式在高职院校数据治理过工作中可以发挥积极影响,有效提高数据治理效果。PDCA管理模式能够参考原有工作基础,提高现有工作效率及促进质量改善,同时能够做到兼顾整个数据治理制度体系形成和具体数据治理字段。随着PDCA管理模式应用范围的拓展,自主闭环工作意识及习惯形成,高职院校的数据治理工作将会愈加规范,其数据治理目标能够得以实现。

参考文献:

[1]刘桂锋,钱锦琳,张吉勇.我国高校科研数构建研究[J].情报科学,2020(06).

[2]曹琳.智慧校园建设中的高校档案馆数据治理路径研究[J].浙江档案,2020(05).

[3]范鸿兴.高校教学研究项目的PDCA循环管理[J].财富时代,2020(05).

[4]余鹏,李艳.智慧校园视域下高等教育数据生态治理体系研究[J].中国电化教育,2020(05).

[5]林仙土.基于PDCA循环的高校大型仪器设备开放共享平台研究[J].中国教育信息化,2020(05).

作者:高博 单位:天津职业大学电子信息工程学院