数据价值开发的校园大数据生态治理研究

时间:2022-06-02 11:28:36

数据价值开发的校园大数据生态治理研究

摘要:挖掘与提升数据价值是智慧校园发展的原动力。智慧校园建设已步入深水区,各高校均已累积了相当数量的数据资产。梳理数据资产各要素之间的关系,帮助高校完善数据治理生态,可以提升数据资产的价值。通过校园大数据生态治理要素研究,构建大数据智慧服务平台,为实现高校数字化转型、建设高质量发展的智慧校园提供理论支持和决策参考。

关键词:大数据;数据治理;数据资产;数据价值

高校智慧校园经过多年建设逐渐步入深水区,由起步阶段的烟囱式系统建设、提升阶段的集成式系统建设,迈入以校园大数据为核心的“智能+”系统建设阶段。这个过程所依托的新技术层出不穷,无线定位、人脸识别、态势感知、行为分析、深度学习等技术的应用为学校积累了大量不同类型的数据。但是,目前校园大数据从采集产生,到汇聚清洗,再到存储查询,最后到挖掘与应用的整个过程中,最深层次的矛盾是对数据的认识、管理、运用的方式和能力与数字化发展的要求不匹配,缺乏系统、有效的治理,使得校园大数据蕴藏着的巨大价值难以得到体现。因此,亟须深化数据治理,释放数据效能,助推学校真正实现数字化转型。

一、智慧校园数据治理现状

数据治理是推动高校治理体系和治理能力现代化的有效抓手。在教育信息化加速发展的新形势下,营造安全的环境,通过数据治理实现数据的高效利用并提升数据价值,已成为教育现代化的底层逻辑和学校高速发展的动力引擎。

(一)治理依据

数据治理是推动学校治理体系和治理能力现代化的必然要求,是“互联网+”教育深度融合的必然要求。要通过有序汇聚高质量数据,最大化释放数据价值,实现治理体系和治理能力现代化,构建系统完备、科学规范、运行有效的制度体系。数据作为智慧校园的基础,是一种新型的生产要素。2021年,教育部了《高等学校数字校园建设规范(试行)》和《职业院校数字校园规范》,均提到“教育信息化过程中产生、使用和积累的各种结构化、半结构化和非结构化数据统称为信息资源”,信息资源在高校数字校园建设中起到关键作用。高校在数字校园建设中应将信息资源建设放在关键位置,逐步形成内容完善、数据准确、组织有序、广泛关联、更新及时、安全可靠、服务优质的全域信息资源库,为学校、师生以及社会公众提供优质信息服务。

(二)治理方向

《中国教育现代化2035》提出“统筹建设一体化智能化教学、管理与服务平台”目标,要求我们在智慧校园建设过程中进一步革新理念、统一认识、放眼未来、大胆创新,将云计算、人工智能、物联网、大数据等高新技术与教育教学深度融合,让信息技术真正有效融入学校发展的每个环节,为学校业务管理、教学创新跨越式发展提供信息化深度支撑,实现“持续的创新”“智慧的场景”“智慧的数据”“智慧的教学”等一体化的智慧校园发展目标。数据驱动和基于数据的创新是教育信息化2.0的主要特征,特别是在抗击新冠肺炎疫情期间,学校管理层面需要掌握更多精准的数据来决策。智慧校园建设正逐渐由需求驱动向数据驱动转变。目前,许多高校都在探索适合发展现状的数据治理之路:一是依靠数据血缘关系,在学校层面开展多维度、深层次的数据治理。数据血缘能够确认数据的来源、数据的加工方式、映射关系以及数据出口,适合业务流程类的数据治理。二是依靠数据标准动态更新,实现数据循环优化,适合由上往下推动的校园数据治理过程,但容易忽视内部的治理需求。

二、校园大数据生态治理体系构建

(一)总体思路

“校园大数据生态治理”是面向教育信息化进程中校园大数据治理的内生需求,基于智能定位、无线传感网络通信、人脸识别、深度学习、分布式存储、安全认证、智能分析与决策等新一代信息技术的综合应用研究。该研究方向是物联网、大数据、机器学习、数据安全、人工智能等新一代信息技术的综合应用领域,对支撑学校教育教学,促进师生发展,提升学校内部治理能力,促进校企合作,深化产教融合,加快学校数字化转型具有重要意义。在校园大数据治理的数据价值管理、数据质量管理、数据安全管理、数据架构管理等四个工作领域的基础上,搭建以元数据管理体系为基础、标准体系为核心、流程体系为关键、价值体系为重点、安全体系为保障的数据治理框架,创建众筹群智、共生自洽、有机协调的数据生态治理环境,挖掘数据价值,提高教育服务的参与度和透明度,提高教育决策的科学性与预见性;以提升校园大数据价值为宗旨,以校园大数据安全技术与数据血缘关系的研究为切入点,完善设计数据安全与数据标准的动态更新机制,研究校园数据全量覆盖与全量共享技术,构建自动化、可视化、分布式、生态化的智能数据池,服务校园数据的开放及开发,建立校园大数据智慧服务平台,实现数据共享、价值提升、应用升级。

(二)主要研究内容

1.以元数据模型为基础研究动态更新机制大数据融合了计算机、云计算、互联网等新兴产业技术,以数据为基础,围绕大数据的采集、整理、挖掘、处理分析等活动,各数据主体交互协作,通过数据流动的串联形成了类似于生物生态链条的大数据生态链。以元数据模型为基础,研究数据间的安全技术与血缘关系,从以业务为核心向以数据为核心转变,制订校园大数据发展规划与标准。从业务数据化的角度,全面梳理学校系统数据流、业务流程和部门UC矩阵,建设一套符合职业院校实际的信息标准体系,保证信息在采集、处理、交换、传输的过程中有统一、科学、规范的分类和描述,确保大数据治理体系的建设、使用、管理及维护规范有序,并且形成校园数据标准、校园数据模型、校园数据资产、校园数据服务和校园数据管理等方面的制度性文件。2.采用数据同步框架DataX设计智能数据池基于数据同步框架DataX,实现结构化、半结构化和非结构化等不同类型校园数据的共享与交换,采用分布式数据采集实现海量数据实时处理,实现异构数据源的数据同步……这些研究工作将使数据同步任务变得简单可控。设计可弹性扩充的Hive数仓,采用高容量的分布式存储来承载治理完成后的海量数据。实现数据治理与管理过程自动化,自动发现数据流向与依赖关系,自动识别元数据,自动创建数据的约束规则。同时,还考虑采用小型数据仓库和数据集市,设计分布式关系型数据库TiDB,提供高性能、低延时的数据分析,最终形成校园高质量的智能数据池。3.以Spark数据挖掘分析技术设计智慧服务平台校园大数据生态治理形成的高质量数据资产,需要实际应用才能体现价值,因此可采用数据接口、数据推送、数据直连、数据下载等方式对外部用户开放、提供服务,实现共享。对于校园多个业务系统产生的大量多维度过程化和结果性数据,应基于Spark搭建数据挖掘分析平台来实现可视化编辑页面,降低数据挖掘门槛,如通过拖拽式流程设计和MLlib内置算法库,快速实现各类数据挖掘应用。可通过平台数据挖掘建模,满足不同用户、不同场景的分析需求,帮助用户参与业务数据价值挖掘,高效辅助和驱动高校业务决策。另外,还可以利用数据挖掘分析平台开发“学生学业预警”“校情驾驶舱”“数据资产利用”“运营分析报表”等数据应用模块,帮助高校管理者进行科学决策,实现全面精准化的管理。

(三)数据价值提升

数据智慧化能够将高校内部数据资源变为核心竞争力战略中的重要资产,而科学有效的数据治理体系则是保障战略资产形成的重要条件。以元数据管理体系为基础、标准体系为核心、流程体系为关键、价值体系为重点、安全体系为保障的数据治理框架,其创新点在于研究并构建业务应用与数据治理的内在循环,以及治理后的数据衍生新兴应用、业务分析指导和业务应用改进的外部循环。通过不断双循环迭代,逐渐提升数据质量,最终营造良性、可持续的校园大数据治理生态环境。1.基于Flink的大数据实时分析校园业务系统的复杂性和多样化使得数据实效性要求变高,针对大数据的实时分析愈显重要。Flink作为新一代分布式计算引擎,为实时流数据分析和批量数据处理提供了统一的编程模型和执行引擎,研究并优化Flink的多表连接作业,可提高生产数据的采集和分析效率,从而解决不同数据源的差异性所带来的问题,为数据治理提供支撑。2.基于DAG模型的分布式任务调度研究遵照有向无环的DAG构建任务配置,实现任务无缝漂移、顺序触发,完成精准、实时、稳定、高效的多任务调度,以及任务的切分和编排。任务调度中心通过进行分布式部署,让每个节点根据consistency-hash算法进行任务分配,确保计算与存储资源越多、定时任务越多、各个任务联系越紧密的情况下,任务正常进行。

三、校园数据安全保障措施

可采用Kerberos协议来实现大数据平台的身份认证;采用基于角色访问控制(RBAC)模型来实现大数据平台的访问控制功能;应用DES、RSA等加密算法进行身份认证、访问控制、数据传输以及数据存储。打造校园大数据治理全过程、全周期的安全体系,围绕活动的主体,为使用者提供可靠的认证、授权、访问与审计功能,实现对非敏感数据、敏感数据脱敏、隐私数据保护工作的运营管理。总之,数据治理工作对高校数据规范化建设至关重要,其本质上属于高校数据开发和利用的基础性工作。通过构建全域数据中心建设与数据生态治理体系,打破传统的“存、管、治、用”数据资产管理桎梏,能够有效整合数据资产,全面提升数据利用率,完成数据在价值流里的有效循环,达到不断挖掘数据价值、全面提升学校综合竞争力的目的。

参考文献:

[1]吴绍波,余维新,王琳,等.大数据生态链的数据整合模型构建与运作研究[J].决策咨询,2022(1):23-27.

[2]邵家勇.智慧校园视域下高等教育数据生态治理体系研究[J].华东科技,2022(1):133-135.

[3]秦新国,薛雅.高校教育数据治理框架与生态体系建设研究———以南京审计大学为例[J].高教论坛,2022(2):23-28.

作者:姜建峰 单位:江苏经贸职业技术学院