基于数据挖掘的学生成绩预警模型研究

时间:2022-07-10 04:03:46

基于数据挖掘的学生成绩预警模型研究

摘要:本文通过分析得出学业预警的难点在于成绩预警,然后提出了基于数据挖掘技术的成绩预警模型,并对该模型进行了详细说明。

关键词:数据挖据;成绩预警;模型研究

在我国高校扩招的大背景下,高等教育已不再是精英教育,越来越多的高中生得到进入高校学习的机会。随之而来出现了生源质量下降,师资不足,人才培养水平下降等一系列问题。如何帮助学生避免在学习中出现问题和克服学习中的各种困难,学业预警机制就是在这一背景下应运而生。

1.学业预警的内涵

学业预警是学校将严重影响学业的情况,及时告知学生本人和家长,并通过学校、学生和家长之间的沟通和协作,从而采取针对性措施,帮助学生完成学业的教育危机干预制度。学业预警的对象包括旷课预警、考试预警、成绩预警三大类。而如何利用学生成绩中隐含的可用信息,挖掘内在联系,则是学业预警的难点。

2.成绩预警模型设计

通过分析,本文提出了基于数据挖掘技术的成绩预警模型。该模型可以有效发现偏低型、滑坡型和潜在型三种问题类型。结合预警情况的严重性,可将模型划分为一般预警、严重预警、非常严重预警三个级别。

3.常见预警设计分析

3.1偏低型预警设计

偏低型预警主要包含以下两个方面:一是不及格门次统计,统计输出某一学期分专业、年级、班级的不及格门次信息。二是不及格详情统计,统计输出某一学期分专业、年级、班级的不及格详细情况,如不及格课程名称。

3.2滑坡型预警设计

传统计算成绩是否滑坡的依据是按总分或平均分计算名次,若名次下降幅度超过某一界限,则认为成绩滑坡。这种方法计算简单、结果直观,但不能准确地反映成绩的分布情况。为解决此问题,本文利用聚类技术把成绩分为5个等次,各等次内部的差距最小,等次之间的差距最大,从而准确地反映成绩的分布情况。具体实现步骤如下:(1)对上学期成绩用改进的加权Wk-means算法进行聚类,设置簇数=5,课程权重=该课程学分/总学分数,将聚类结果按质心各维加权平方之和从大到小排列,簇号依次设为1、2、3、4、5,则所有成绩被划分到A、B、C、D、E5个等次;(2)本学期成绩作相同处理;(3)比较每名学生两学期成绩的聚类结果,若等次下降或两学期都处于第D、E等次,则进行预警,输出相关信息。

3.3潜在型预警设计

潜在型预警是利用关联技术对学生历史成绩进行挖掘,生成成绩关联规则库,进而预测学生今后学习中潜在的危机。潜在型预警模块的实现步骤如下:(1)数据预处理。①从待处理的所有成绩记录中筛选出成绩不及格的记录。②为方便课程排序,将课程的编码设置为“学期”+“课程序号”。某课程成绩将被转换成一个2位数,第一位表示学期,第二位表示课程序号。如“计算机应用基础(1)”被转换成10。③原数据库表数据格式为“学号,姓名,不及格课程名称”,将数据转置变为“学号,姓名,不及格课程1,不及格课程2,……”。(2)挖掘频繁项集。支持度反映项集在数据库中的普遍性。设置合适的支持度,使得出的关联规则具有一定的普遍性。(3)生成预警规则库。按照传统方法生成的关联规则不能直接作为预警规则。因为无用的规则会降低预警的准确率和效率。为解决此问题特做如下限定:一是设置合适的置信度。二是按学期顺序规则前、后件。三是同一学期的课程成绩不能同时出现在规则的前件和后件。四是规则的后件只包含一学期课程。(4)搜索预警规则库,进行匹配。将当前学期成绩进行预处理,搜索预警规则库,进行匹配,输出结果。

4.结语

及时发现偏离正常发展轨道的学生,并进行有针对性的学业干预,有利于高校教学水平的提升。而成绩预警则是学业预警的核心和难点,为此,本文利用数据挖掘技术,针对成绩预警设计了三种模型,使学业预警更具实用性和有效性。基金项目:安徽省高校质量工程项目(编号:2015zjjh051),淮北职业技术学院自然科学重点项目(编号:2016-A-4)。

作者:陈衡 单位:淮北职业技术学院教务处

参考文献:

[1]李昊,周振华.基于数据挖掘的高校学生成绩预警系统[J]大庆石油学院学报,2011(04):91:95

[2]叶福兰.基于数据挖掘的高校学生成绩预警状况分析[J]长春师范学院学报,2013(10):43-45

[3]杨萧屿,高职院校学生成绩预警管理模式的探究[J]辽宁高职学报,2014(07):110-112

[4]宋绍云,基于SQLServer数据挖掘的学生成绩预警预报研究[J]电脑知识与技术,2015(17):18-20

[5]吕萍丽,基于关联规则的成绩预警模型的实现[J]数字技术与应用,2015(04):105