数据挖掘技术深化数据采集应用系统

时间:2022-10-08 05:53:16

数据挖掘技术深化数据采集应用系统

摘要:大数据使现代化信息技术实现了高速发展,利用现代化信息技术建立状态数据采集系统进行院校评估,是院校管理的发展方向。数据采集系统不应只注重平台服务而忽视了功能的挖掘与发挥。数据挖掘技术对高职状态数据采集的应用系统建设方法应注重关联规则方法和聚类分析方法的构建与使用。

关键词:数据挖掘技术;状态数据;数据采集;应用系统

数据采集应用系统又被称之为高职院校人才培养工作状态数据采集应用系统,该数据采集应用系统在2008年得到教育部门批准并公布实施,这使数据采集应用系统成为高职院校进行方案评估的重要组成部分,并越来越受到各个高职院校的关注与重视。不过,由于数据采集应用系统出现的时间较短,各个高职院校还没有真正认识到数据采集应用系统的作用,对数据采集应用系统的框架体系与逻辑关系的理解仍旧需要一段时间,对应用系统中相关联的数据进行聚合,使其成为一种能够帮助学院进行教学决策与管理的价值信息,更需要探索一种新的数据分析方法,再加上高职院校只注重系统的服务评估功能而忽视了其他功能的挖掘与应用,这就造成许多高职院校只是在填报时才会用到该系统,而在填报过后便成为了摆设,这使数据采集应用系统的作用未得到真正发挥,利用率较低。为此,针对以上问题,通过数据挖掘技术对高职状态数据采集应用系统进行深化分析。

1数据挖掘技术

大数据具有增长速度快、海量、多样、真实、价值密度低五大特点,从数据本身进行分析,所谓数据挖掘技术便是通过算法搜索,从海量的大数据中对价值密度低的价值数据进行挖掘与收集的过程。数据挖掘技术和计算机科学有着紧密的联系,通过数据的统计、处理、机器学习、模式识别、情报检索等诸多手段来达成价值数据挖掘目的。这些手段能使企业决策者根据价值数据来对策略进行调整,以此降低风险,并做出正确决策。数据挖掘由三个阶段构成:数据准备、数据挖掘、结果表达。

2数据挖掘技术在高职状态数据采集应用系统中的深化基础

高职状态数据采集应用系统属于一种数据仓库,该系统每进行一次数据采集便会采集到超过50万条的数据,通过将状态数据采集应用系统与互联网技术进行结合,还能使数据采集应用系统一次性采集到的数据量更多。以知识管理理论对数据进行分析,数据自身是不会提供太多价值信息的,因此,需要将这些采集到的数据进行转化,使其成为有效信息,并利用科学的数据分析方法,通过关联、聚类、聚合等方法来对这些海量的数据进行分析。现如今,数据分析在各行各业中发挥越来越重要的作用,数据挖掘技术的相关理论与方法也使数据采集应用系统具备极高的应用价值与意义。可以说,数据挖掘技术作为一种新型信息处理技术,能对大量数据中人们所不知道而又潜在的有用信候进行提取,属于一种更深层次化的数据分析方式,其与传统分析方法的最大不同是传统分析方法具备非常明显的指向性特征,而其目的是通过结果来对预设命题的正确性进行验证,或是通过对预设模型的机理进行量化分析。而数据挖掘技术则是在没有任何比较明确的假设情况下对信息进行挖掘,找出信息的关联性,并获得那些难以通过直觉,甚至会违背直觉的相关信息,这样挖掘出的信息极有可能出人意料而又富有价值,可以说,数据挖掘技术是传统分析方法不断变革后的结晶。

事实上,经过教育界诸多专家对数据采集应用系统的不断完善,在数据采集应用系统颁布应用的三年里,系统结构与信息的采集量都发生了极大改变,以版本来说,最初的数据采集应用系统是08c版的,之后经过不断的改进已经成为现今的10a001版,原有采集字段仅为594字段,现如今已经增长到了750个字段,采集字段的大幅增加,也使数据采集应用系统的信息容量得到了大幅度扩充,其数据仓库特征也越来越明显,尤为重要的是数据间的关联度不断增加,使其成为数据挖掘技术的深化基础,从客观上来说,通过数据挖掘技术的应用来进行数据分析,能为数据采集应用系统创造更加有利便捷的条件。

3数据挖掘技术深化高职状态数据采集的应用系统分析

数据挖掘技术在高职状态数据采集应用系统中的应用方法主要有关联、分类、聚类、估计、细分或预测等,数据挖掘技术的自身理论与思维方式给数据采集应用系统带来了广阔的发展空间。在这些应用方法中,以聚类分析方法和关联规则分析方法最为易于理解和实施,以下便对这种主要方法在高职状态数据采集应用系统中的深化应用进行探讨。

3.1关联规则分析

在关联规则方法中,数据是以孤立、单独的形式分散存在的,这也使单独的数据不能形成信息,不过将这些单独、分散而又相互关联的信息数据收集起来,则能多角度、全方位地对某一对象进行高效的价值辨别。而对于刚开始接触数据采集应用系统的用户来说,在数据采集应用系统使用过程中,应以海量信息数据作为依据来对高职院校在人才培养过程中的各个方面进行判断与价值辨别,这就造成系统用户往往感觉无从下手,只会对各个表格中的数据进行割裂而孤立地分析,更加难以找出数据之间的关联性与内在规律,同样难以对这些相互关联的数据进行聚合,这使高职院校难以将人才培养工作过程中的关键要素进行全面呈现,以此帮助管理人员进行工作决策。而通过关联规则挖掘方法的应用,则由数据采集应用系统提供数据,并对人才培养工作的所有关键要素进行分析,通过挖掘与之相关的所有数据,能更加清晰地呈现数据与指标间的相关关系及关联规则。例如,在对高职院校的“兼职教师队伍”建设现状进行分析时,利用数据挖掘技术中的关联规则分析方法,能将兼职教师的人数和整个高职院校的教师总数量进行对比,能清楚地知道兼职教师在整个高职院校的教师队伍中占据的比例,再将兼职教师数量和高职院校所设置的专业数量进行对比,还可清楚地知道各个专业所安排的平均兼职教师数量等等。这些与之对比的数据均分散在整个系统中,但它们都和兼职教师队伍有着很强的内在关联,通过对这些与之关联的数据进行采集,能非常直观地对某个方面的具体工作情况进行真实反映。通过将这些数据进行聚合,还能非常直观地反映高职院校对专业教师队伍建设的重视程度及总体规则,并将其与预期的高职院校教师队伍规划进行比较,能清楚地知道当前教师队伍建设能否满足学校师资建设的发展需要,具体的实施情况如何等问题。

3.2聚类分析

在聚类分析中,对于不同的数据,通过关联规则分析,能获得大量的价值信息。而对于同一类的数据,则将这些数据利用聚类分析思路进行相应整合,这样能使信息的呈现更加丰富,并能对某项工作的进程及各个部门间的差异进行真实可靠的反映。例如,在对高职院校的师生比情况进行分析时,利用聚类分析将历年的院校招生情况及教师人数情况进行对比,能非常直观地对院校在历年中的师生比情况进行衡量,当发现每一年的学生数量都有所增长,而教师数量增长不大时,则可以通过师生比来衡量院校的教师增长数量难以满足学院的教学要求,应加强师资队伍建设。

3.3聚合分析

对于不同系数中的同类数据来说,可以通过聚合分析的方法来对系部间的差距进行直观衡量与观察,仅仅对同一系部中的数据进行分析,是难以获得较多有价值信息的,而通过聚合分析方法将不同系部中的同类数据进行聚合,则能使数据信息变得更加丰富,进而可以非常直观地了解到不同系部在相同工作之间的差距,从而使院校管理人员能根据这种差距来对工作差距较大的系部进行加强。

4结语

综上所述,数据挖掘技术在高职院校状态数据采集应用系统中的应用案例比比皆是,这也证明了数据挖掘技术能使院校状态数据采集系统的作用得到更进一步的发挥,使数据采集应用系统能对各类数据进行有效挖掘与转化,并将其应用到高职院校的管理与教学工作中,提高了高职院校的管理服务水平,为高职院校管理人员提供大量的有效信息。可以说,数据挖掘技术在很大程度上促进了高职院校状态数据采集系统的深化应用。

参考文献:

[1]张晓蕾.基于Android平台的人才培养工作状态数据采集管理系统的设计与实现[D].成都:电子科技大学硕士论文,2014.

[2]苏世文,王国庆.高职院校人才培养工作状态数据采集平台的柔性UML模型设计[J].江苏经贸职业技术学院学报,2013(2).

[3]伍丹.高职院校信息化管理系统建设与应用的思考——以网络版《高等职业院校人才培养工作状态数据采集平台》为例[J].中国信息技术教育,2010(2).

作者:毕诚 单位:安徽国际商务职业学院