数字化校园大数据分析

时间:2022-02-13 11:04:33

数字化校园大数据分析

摘要:数字化校园是高校信息化建设的必由之路,其建设内容涉及高校教学工作的方方面面。笔者主要针对数字化校园背景下,大数据分析在教学中的应用进行研究,从而进一步完善教学体系,促进高校信息化发展,提升办学水平。

关键词:数字化校园;大数据分析;教学

数据挖掘,也称为数据库中的知识发现(KDD),是从大量数据中挖掘出有用的信息。在国外,已有许多组织和高校着眼于教育数据挖掘(EducationalDataMining,EDM)的研究,并将各类数据挖掘的方法应用于教育中。在国内,越来越多的人也开始关注教育数据挖掘,具有教育技术、教育管理、计算机技术等相关专业的人士都参与到这个领域的研究中来。在国内高校的数字化校园建设中,虽然各高校都加大了管理和挖掘数据的力度,但是仍然存在数据挖掘不充分、应用范围较小的现象。因此,需要进一步提高对数字化校园产生数据的挖掘广度和深度,为教学的评价和改革提供客观的科学依据,让以往得不到利用的历史数据充分发挥其价值。

1大数据及数字化校园概述

1.1大数据概述。目前,学术界对大数据还没有统一的定义,现在所说的大数据,一般是根据其特征定义的。大数据有四个基本特征,一般称为4V特征,如图1所示,即多样性(Variety)、价值大(Value)、数量大(Volume)、速度快(Velocity)。目前,高校教学对大数据的使用主要表现在数据统计和数据分析方面,学校通过综合分析各类数据,通过数据挖掘技术找出数据的深层价值,进而提高我国高校教学水平。1.2数字化校园内容及框架。数字化校园建设的主要目的是通过校园内部的数据共享平台,建立统一认证服务和信息服务[1]。数字化校园建设初期,主要是建设并完善数据平台,进而对高校中现有的数据资源进行整合和管理,建立包括身份认证、数据平台、人员数量相互统一的结构体系,进而建设完整的数字化校园平台。数字化校园平台应选择开放模式,要能够实现所有数据的关联,进而促进数字化校园建设的进一步完善,即确保所有数据资源能够在该平台共享。另外,数字化校园还要充分考虑数据的可重用性和安全性,确保管理层决策的高效性。数据的安全性主要表现在传输过程中传输系统的安全和网络传输中数据传递的安全,数字化校园系统必须具有良好的扩展性,同时硬件应具备可扩展接口,进而提高数据备份的速度和质量,为应用者引入新的应用类型提供便利条件。

2大数据分析在高校教学中的应用研究

大数据分析是一个广义的概念,它可以理解为从数据统计到数据分析(狭义)再到数据挖掘逐层递进的过程。对数据的统计分析,具有一定的目的性,根据具体目标使用方法工具对数据进行处理与分析,提取有价值的信息;对数据的挖掘是在大量的数据中,采用统计学、人工智能、机器学习等方法,得到未知的有价值信息。从海量的数据中完成基于广度的分析和基于深度的挖掘,它多利用分布式系统基础框架Hadoop,以及基于Hadoop的HBase、Hive、Mahout、ZooKeeper、Pig、Sqoop等完成数据挖掘任务,也可依托第三方数据挖掘工具完成,例如Weka。其主要使用的编程语言为C++、Java、Python等。2.1数据挖掘方法。(1)分类分析。分类分析是数据分析中最常用的方法,其主要用于分类处理具有明确界线的数据。分类分析能够根据分类情况,为相关人员提供简单的数据图,为后续数据处理工作打下基础。(2)聚类分析。聚类即将抽象或物理对象的集合分成由类似对象组成的多个类的过程[2],聚类模型能够迭代处理数据,将不同数据划分到不同区域,进而形成一定的数据集合,为同类数据特性分析提供便利条件。(3)推荐系统。推荐系统包括基于用户和基于物品的推荐,主要是通过对喜好、习惯等模式进行预测,以发现用户未知的,却会喜爱或感兴趣的新事物。2.2应用分析过程。2.2.1数据采集及预处理。基于数字化校园平台,数据源非常多,数据类型也多种多样,在数据库内的数据是以多维并行的形式存在。具体的数据库结构多类似图2。由图2可知,数字化校园建设系统包括用户层、业务层、应用组建、基础层四层结构,每一层对应的内容都不相同,例如,业务层对应学员管理、科研管理、图书馆借阅等。2.2.2数据的应用分析。下文根据图2对数据的应用进行了相应的分析。(1)数据统计分类。通过大数据的统计分析,可以对数字化校园各类数据进行整理分类,并通过对各类数据的分析,推算出数据内在的规律,从规律中寻找出提升办学水平的方法。例如,通过对科研管理系统中的数据统计分析,得出学校近几年的科研方向及科研成果,根据这些科研信息,能够分析出目前的科研方向,以此为依据,改革教学内容,探索“以教促研、教研结合”的办学模式,使培育人才更加适合社会需求。(2)数据聚类分析。数据聚类分析能够根据各层的分析结果,绘制出相应的曲线。例如,在数字化校园,能够得到出课表的排课计划、学生的生源地、出勤情况、在俱乐部的活跃程度、是否担任班级职务、前期课程成绩等各类数据,以各类数据形成维度,生成每个学生对应向量,采用聚类算法将学生进行聚类,探索影响学生素质培养的因素,因材施教,为每类学生规划出其在学校几年中比较合适的成长路线,帮助他们成为他们想成为的人,使他们毕业后更快融入社会。(3)数据推荐。利用数据挖掘中的推荐算法,可以分析学生与他们所产生的选择类数据间的关系,并以此计算出有意义的推荐结果。例如,可以通过一卡通系统获取学生食堂各档口上每个学生每天的消费流水,对数据采用推荐算法进行处理,最终针对学生消费习惯进行用餐推荐,并促进各档口的食物品质和服务水平的提升。同时,还可据此调整食堂的菜系配比,为学生提供更好的用餐保障。

3结语

本文通过研究数字化校园背景下大数据分析在教学中的应用,得出以下结论。第一,数字化校园建设,完成对学校各类数据的统一管理,这为基于数字化校园的大数据分析提供了基础支撑,我们需要充分利用大数据技术,对数字化校园产生的各类数据进行挖掘分析,从中获取有助教学的有价值信息。第二,数字化校园产生的数据的多样性,决定了对此类数据的大数据分析是一直持续的过程,挖掘方式也需要不断丰富和完善。文中提到的例子是笔者研究过程中采用的分析角度,部分已设计实现,部分仍在探索中,希望可以起到抛砖引玉的作用,使数字化校园不仅仅是为师生提供服务的系统,更真正成为辅助决策、提升办学水平的数据来源。

参考文献

[1]牛俊祝.大数据时代数字化校园建设的研究[J].通讯世界,2017(11):25-26.

[2]陈娅.大数据分析在高校信息化教学中的应用——以中国矿业大学为例[J].无线互联科技,2017(14):79-80.

作者:翟晓宁 乔杰华 郭杰 单位:陆军装甲兵学院