大数据分析技术在教育教学的应用

时间:2022-10-14 10:47:37

大数据分析技术在教育教学的应用

在教育信息化2.0时代把智能和信息化技术融入日常教学,实现教学信息化、学习智能化的新型教育体系一直是教学改革的重要方向。目前,部分高校已经开始智慧校园建设,通过大数据、人工智能、物联网等新兴技术,建立数据共享平台,打通数据孤岛。学校把校内数据汇总起来,构建教学诊改系统,用于诊断教学中存在的问题,借助融课堂平台时刻关注学生学习轨迹、任务完成情况以及学生的校内外活动轨迹等,实现了在线数据的智能化使用及开发。

一、大数据分析技术概述

(一)何谓“大数据”。目前,“大数据”虽然没有一个十分精准的定义,但是,学界普遍认为,“大数据”指的是海量、高增长率和多样化的信息资产。这也是信息化时代的产物,数据的来源多、增速快促成了大数据时代的到来。一般来说,大数据可以和任何行业实现无缝对接,如大数据融入金融就是金融大数据,融入教育就成为教育大数据,它的诞生使潜藏于数据深处的价值得以挖掘,使原本看似无用的数据为企业和社会带来效益,更促进了日常生活、企业管理、教育教学的智能化。(二)何谓大数据技术。大数据技术是指对庞大的潜在数据进行专业化处理的手段。飞速增长的数据不是简单的数据处理工具就能解决的,需要凭借分布式数据存储器、Hadoop集群平台、数据采集技术、数据清洗工具、数据挖掘算法等等一系列的专业化技术手段进行存储、处理和分析,更需要一些大数据技术与应用的专业人才去管理、维护、使用、开发,从而形成大数据集成平台。

二、当前教学现状

随着高校学生规模的扩大,教师除线上线下授课、批改作业、辅导学生外,还要担负繁重的科研任务。传统的教学模式使教师分身乏术,教学效果和输出质量不尽如人意。于是,很长一段时间,人们一直在呼吁智慧办公、智慧校园等,希望可以通过科技的手段减少工作负荷。因此,将大数据技术融入校园,融入教育教学,提高教学质量,满足学生需求,已经成为大势所趋。近年来,河南机电职业学院对大数据人工智能技术的应用进行了积极探索,构建数据中心,打通数据孤岛,进行智慧校园建设,对学生和教师的日常学习、教学、活动等情况进行分析,从而为教学改革提供决策依据。今年突发肺炎疫情,教学模式由之前的线上加线下全部改为线上进行。学校利用大数据技术对线上教学进行多维度分析,并对学生的学习状态进行跟踪分析,实现了“停课不停学”,高质量、高标准、高要求地开展教学活动。

三、大数据技术在教育教学中的应用

(一)采集以学生活动为主题的数据。随着教学改革的不断深入,在高校对学生的评价主要侧重于对学生综合素质进行分析,其中包括学生成绩的对比分析、学生校内外活动轨迹的分析,以及影响学生职业素养和综合素质因素的分析等。以河南机电职业学院为例,大数据技术与应用专业以800名学生为样本进行分析,学生的学习轨迹主要体现在线场课堂平台上,活动轨迹主要体现在学生管理平台上。通过建立中间库,学校将学生日常产生的学习和活动碎片进行收集整理,采集到大数据中心的分布式存储器上,并进行实时更新。具体采集数据的步骤如下:1.创建一个学生成绩分析项目,并选择EXCEL数据源,添加所要分析的数据,部分数据可以通过连接数据库,轻松导入所要分析的数据。2.连接数据源“大数据专业成绩表.xls”,对数据类型进行格式变更,进入数据预览的页面,将“snumb”“ternumb”“clanumb”设置为字符串类型,命名为“高校大数据班学生成绩分析”。这一步主要是将所获得的数据统一类型,以便进行下一步详细的数据处理。通过创建的MySQL数据库,我们将所需要的数据分类导入学生数据库。(二)清洗获取到的数据。数据清洗是指找出并改正数据源中不正确数据,如检查数据的一致性,处理无用值和残缺值等。由于汇聚到的数据是从不同系统获得的,系统的开发商各不相同,导致各个系统的数据格式及命名规范参差不齐。在拿到数据之后,数据清洗的工作量很大,数据清洗是否完整、是否正确,将直接影响分析结果的精确度。数据清洗的方法有很多种,如编写SQL语句、使用Python中的数据清洗库、利用八爪鱼工具等。本案例主要是在搭建好的Hadoop集群平台上实现数据的清洗,结合魔镜平台编写SQL语句来实现数据的清洗功能。数据清洗是数据分析当中至关重要的一步,数据清洗得是否彻底直接影响数据分析的准确性。经过数据清洗之后,一些格式不统一、残缺、无价值及干扰项便不复存在,新生成的数据源则用于下一步的数据分析及可视化。(三)挖掘产生的数据。数据挖掘是指通过一系列的算法对处理过的数据进行分析,寻找数据中隐含的价值,常见的算法有聚类算法、关联规则算法、基因算法等。数据挖掘的过程就是从这些庞大的数据中找出潜在的、未知的、对决策有帮助的关系、模式和趋势,并建立决策支持模型的过程。本文主要采用的是聚类和关联规则算法。聚类算法,即根据已经设定好的规则,对数据进行分门别类的处理,如将学生群体分为熟手、生手和能手;关联规则算法,即探究两种及以上事物之间的关联关系,如每天学习Python课程的学生也会去学习PHP。(四)大数据分析。大数据分析是指利用大数据技术手段,在对汇聚到数据库里面的数据经过数据挖掘之后,根据实际需求以数据分析报告或者仪表盘形式,将分析结果可视化地展示出来,使分析结果清晰明了,并可以实时更新,便于分析、决策。根据处理过后的数据,教师可以对学生各科成绩的数据和学生活动情况进行关联分析,找出影响学生成绩的因素,并将分析结果展示出来。确定成绩影响因素后,便于学校今后教学工作的顺利开展,有的放矢地进行教育教学改革。其具体分析步骤如下:1.分析学生在课堂学习以外的活动数据,如兼职、寒期打工、大学生社团、学生会等校内外活动,并分析该活动的所占比重。2.对融课程、腾讯会议等教学平台产生的教学数据和学生的学习轨迹数据进行收集,经过处理后在Hadoop集群平台进行处理、分析。3.对学生学习、活动所产生的数据进行整合,综合分析出学生的成绩波动情况及影响学生成绩的存在因素,并对预处理后产生的数据进行可视化分析,其分析结果如上所示。我们通过一系列的分析得出结论,学生的成绩和参与活动的类型及时间有一定的关系,比如数学和阅读类的课程,需要付出较多时间和精力,不参与校内外活动的学生大多成绩偏中上等,参与学生会、校外兼职的学生成绩普遍偏低。而对于偏科学类和通识类的课程,需要学生具有丰富的生活阅历,参加校内外活动多的同学大多成绩处于中上等,成绩和课外活动呈正相关。通过这个分析,我们也发现大部分学生喜欢阅读武侠小说,对于编程类的课程喜爱度次之,对于拔高性质的、难度系数较大的课程则兴趣又不大。学生的个人发展不能靠单一的考试成绩来判定,要想满足企业实际需求,成为适应企业需要的具有职业素养的人才,就必须实现德智体美劳全面发展。通过此次分析,我们发现,学生的培养计划需要改变,培养模式需要改革,找出学习时间和课外活动的均衡点尤为重要,确保学生可以在不影响学习的前提下能够全面均衡发展。同时,对分析出的个别孤立点的学生,要采取差异化对待,实现“一生一课表”“一生一方案”,不遗漏任何一位学生,全面提高整体教学质量。

作者:王欢欢 范桂丹 单位:河南机电职业学院