教育数据挖掘研究与思考

时间:2022-03-06 11:02:02

教育数据挖掘研究与思考

[摘要]对国内外教育数据挖掘的发展与应用进行深入分析,结合国内教育环境对数据挖掘在教育领域应用过程中遇到的问题进行探讨,指出目前存在的不足,就如何在当前教育体制改革的背景下,结合国内高校的办学特色和实际状况,推动与促进教育数据挖掘的发展提出了一些建议。

[关键词]教育数据;数据挖掘;现代教育技术

大数据时代的来临,推动了数据挖掘技术的高速发展,也使得该技术进入了各个领域[1]。现代教育技术的蓬勃兴起,催生了数据挖掘向着高校等教育领域的延伸,高校教育资源异常庞大和复杂,如何从这些海量的教育大数据中探索教育变量之间的相关关系,发现并诊断现存问题,预测发展趋势,是一个非常迫切的问题。通过教育数据的挖掘与分析,与传统教育业务相融合,可持续推动高校教育系统的智慧化改革、教学模式改革,对促进实现真正个性化学习、教育评价体系重构、科学研究范式转型都具有非常重要的意义。本文对数据挖掘技术在教育领域的发展与应用进行研究,基于教育数据的特征分析,探讨教育数据挖掘的关键环节与重点,就如何整合教育资源、推动教育数据挖掘在教育领域的发展和应用提出一些建议。

1国内外发展状况

随着数据挖掘技术的不断发展,将该技术应用于教育领域,对海量的教育资源进行分析和处理是一个新兴的正日益受到关注的研究领域。从早期基于调查问卷的统计分析到目前基于在线学习平台的信息处理,教育数据挖掘技术日趋多样化[2]。自2008年首届教育数据挖掘国际学术会议召开以来,欧美等教育发达国家部分高校分别实施了教育数据挖掘相关计划,而2012年美国教育部的《通过教育数据挖掘和学习分析促进教与学》蓝皮书则标志着该研究方向已受到广大教育学者的关注[3]。国内在教育数据挖掘方向的研究尚处于起步阶段,加之受到现代教育技术发展和教育数据采集等因素的影响,直至2004年,随着网络教育、在线课程等的兴起,数据挖掘技术才引起国内学者的关注,目前国内研究主要集中于理论研究和方法描述以及分析论证等描述性阶段。例如,利用SPSS中关联规则的Apriori算法来分析录取结果与考生类别、地区等级之间的关系,为教育资源的统筹安排提供决策支持[4]。运用聚类方法对某一课程的多个模块成绩重新分类,再运用关联规则算法找到院系类别、各题所得分与总分三者之间的联系,最后利用聚类的结果和挖掘到的关联规则得出有助于教学的结论[5]。在指导就业方面,利用Weka平台,对决策树分类方法进行改进,应用于分析市场上就业单位的类别、归属地等特征,以及与学生的性别、专业、学历等之间的关系,从而为指导就业提供辅助信息[6]。总体来说,国内教育数据挖掘的研究还处于起步阶段,多集中于对个别教育环节的技术研究,缺乏对教育系统资源的整体统筹与规划。

2国内教育数据挖掘的主要问题

教育数据挖掘结合了教育学、现代教育技术、计算机信息处理技术、数据挖掘等多个学科,是随着教育教学改革和信息技术的发展而产生的新领域,一方面教育数据资源的外延在不断扩大,包括大量非结构化、异构的数据使得教育数据的复杂性在不断增加,另一方面教育信息化的发展给教育机构的管理体制和运行机制也带来巨大挑战,教育人员不仅需要转变观念,还需要为教育信息化提供强有力的技术和管理支持,这对教育数据挖掘的技术和方法提出了更高的要求,结合国内教育数据挖掘的发展状况,其发展与应用还存在着不少问题和矛盾,主要表现在以下几个方面。2.1教育数据资源缺乏整合。高校教育数据资源庞杂而繁多,既包括存储在教育管理系统数据库中的结构化数据,也包括课件、成绩、课程、毕业设计、学科竞赛、评价、试题、大纲等传统数据资源,涉及基础、状态、资源和行为等多个层次,具有多格式、多语义、多噪声和数据缺失等特征。随着信息技术和现代教育技术的不断发展,以慕课、微课、反转课堂、在线学习、网络课程等为代表的新兴教学方式代表了未来高校教育教学改革的方向,也是教育数据挖掘最能体现出价值的方面,但目前国内高校教育中仍以传统的课堂教育为主,在这样的背景下需要将传统的教育信息与现代教育技术下的教育数据结合与整合,以奠定教育数据挖掘的基础资源,但目前缺乏对基础数据资源的整合,影响数据挖掘技术在教育领域的应用与推广。2.2基础设施薄弱。随着现代教育技术和教学方法的发展和改革,教育数据不仅包括传统的试卷、成绩单、教材等基于纸质的数据,也包括微课、慕课、网上评教、实践创新、过程考核等电子的非结构化的数据,如Word、PDF、网页文本、图像、视频和地理空间数据等非结构化信息资源等,而现代化的教育数据挖掘的本质是一种教育信息化技术,是伴随着信息技术的发展而发展的,特别是教育大数据的爆炸式增长对计算机存储能力、数据采集分析和兼容性都提出了更高的要求。但与之不对应的是国内教育数据挖掘的基础设施薄弱,相关技术有待提高,缺乏必要的数据应用的基础设施建设,区域间技术资源分布不均。在系统的选择方面缺乏统一规划,因此数据兼容性矛盾较突出。数据资源繁杂多样,即便是电子数据如教务管理、学生信息、在线教育平台等数据,其数据结构和数据格式也存在不统一的问题,给进一步的研究工作带来不便。2.3重理论研究,轻实用推广。目前国内对于教育数据挖掘的研究多集中于理论、算法和技术本身,与教育实际结合不多,例如利用数据挖掘技术对线上教学方式的隐含影响因素进行挖掘与分析,得到教育各关键要素之间的关联,力图构建网络教学评价的相关流程,为教学管理和决策提供有效支持[7]。利用离群点检测技术从海量动态教育数据中定位异常数据,识别不符合一般特征规律的行为路径,为学习者的个性化指导和教育决策提供有价值的信息[8]。基于由在线评测系统所采集到的学习者信息,通过分析其数据结构构造学习者特征,再在此基础上对学习者进行聚类分析,从而分析出学习者的特征信息[9]。这些成果具有一定的代表性,均是利用数据挖掘技术对某一方面的教育资源进行统计分析,但其成果没有与具体教育应用相结合,而基于顶层设计、面向整个教育数据的分析框架更是鲜有涉及。尽管目前许多高校的教务、科研、教学、师资等教育信息均已实现了计算机自动化管理,但类似的系统只是实现了把纸面的表单迁移到了计算机系统中,并具备了简单的增删、查询和统计功能,也就是事务处理功能,而更高级的管理决策功能仍依赖于人工经验。因此从数据挖掘的角度分析,还远未达到多角度、全方位的数据自动化分析以及深度数据挖掘,从而为教育及教学管理提供辅助决策的目的。

3促进教育数据挖掘的建议

3.1制定规范与标准。教育数据挖掘的基础是数据,而教育数据复杂而庞大,应通过对这些多源异构数据的特征进行对比、分析和预处理,研究各类教育数据的特征,构建面向教育规范的特征数据模型和逻辑处理模型,使其统一到一个度量框架体系中,为其后的数据分析与处理奠定基础。对于当前已经建设起来的信息化教学环境课,如课程中心、特色教学资源库、智慧教学环境、雨课堂和各类课堂互动系统等,尽管在各自的教育领域都发挥着一定作用,但都是独立运行的系统,各系统之间数据并没有联系,导致数据鸿沟与信息孤岛问题依然存在,因此必须对现有的平台进行统一,制定标准,加速与促进各类教育数据的融合。3.2强化顶层设计。随着现代教育技术与教育教学理念的发展与变革,教育数据挖掘已成为高等院校顺应信息时展的趋势之一,因此应该对其从顶层进行设计,统筹规划,将教育数据挖掘定位在新的高度,克服破解高校数据挖掘发展的瓶颈。例如,优化组织结构,组建现代教育中心或数据中心等信息管理机构,将信息化建设与教育数据挖掘提高到重要位置;制定教育数据管理标准,制定数据采集、分析、安全管理等方面的标准规范,形成统一完善的高等院校教育大数据规范体系;加快数字化校园建设进程,将课堂互动系统建设与一卡通系统、教务系统、网络学习平台、考试系统、图书馆资源等有机融合起来[10]。3.3特色化发展。尽管教育数据挖掘所用到的原理与技术基本相同,但不同学校有不同的历史和现实条件,其在高等教育体系中所发挥的功能、承担的任务以及范围、作用也各不相同,学校自身的特色、区域、规模、层次、学科等也有很大差异。从国际角度而言,国内外高校更是存在着很大差异。因此,一方面国内高校在教育数据挖掘的研究方面需要紧跟国际方向,积极参与国际交流与合作研究,以保持对国际主流与前沿方向的跟踪;另一方面,要基于国内高校教育环境的实际状况,不盲目跟风、机械照搬,立足中国独特的教育数据研究背景和实践经验,形成中国特色的教育数据挖掘学术概念和分析框架,推动中国教育数据挖掘研究的范式转型与良性发展。

4结语

信息时代的发展,促进了高校现代教育理念及技术的发展,也导致了教育数据的爆炸式增长。如何将数据挖掘技术引入教育领域,促进高校管理与教育发展是值得深入研究的课题。本文分析了国内高校教育数据挖掘技术发展过程中的不足与问题,就如何结合技术优势与教育实际状况提出了相应建议。

[参考文献]

[1]王晓妮,韩建刚.数据挖掘在教育大数据中的应用研究[J].无线互联科技,2018(18):135-137.

[2]肖巍,倪传斌,李锐.国外基于数据挖掘的学习预警研究:回顾与展望[J].中国远程教育,2018(2):70-78.

[3]雷晓锋,杨明.教育数据挖掘的研究进展与趋势[J].北京航空航天大学学报(社会科学版),2018(4):108-114.

[4]于宝华.基于数据挖掘的高考数据分析[D].天津:天津大学,2009.

[5]柳玉巧.聚类分析和关联规则技术在成绩分析中的研究及应用[D].武汉:华中师范大学,2014.

[6]孙中祥.数据挖掘技术在大学生就业指导中的应用研究[D].重庆:重庆师范大学,2013.

[7]张鸰.数据挖掘技术在线上教学评价中的应用[J].电脑知识与技术,2018(29):6-8.

[8]陈世超,杨现民,潘青青,等.离群点检测技术在教育教学中的应用[J].现代教育技术,2018(6):101-107.

[9]石振强.基于教育数据挖掘的学习者聚类分析与研究[J].电脑知识与技术,2018(6):154-156.

[10]黎生,冯鸟东.基于课堂互动系统的教育大数据挖掘与学习分析研究[J].教育信息技术,2018(Z2):57-60.

作者:张志刚 单位:西安财经大学信息学院