煤矿安全隐患数据挖掘分析

时间:2022-12-21 09:34:25

煤矿安全隐患数据挖掘分析

【摘要】煤炭资源是我国的重要能源,煤矿安全生产对我国国民经济的发展有着很大的促进作用。大数据技术是继云计算、物联网等技术之后又一重大的技术革命。本文首先对煤矿安全监测系统获取的海量的煤矿安全隐患参数数据进行标准化处理,然后构建数据仓库进行存储,最后利用Apriori算法对标准化处理的数据进行数据挖掘,得出了煤矿安全生产有关的有用信息,从而为煤矿安全生产提供指导。

【关键词】煤矿;大数据;标准化处理;Apriori算法;数据挖掘

煤炭资源是我国重要的生产能源以及战略储备资源,对我国国民经济的发展和工农业生产意义深远。我国是一个煤炭大国,拥有丰富的煤炭资源,在我国所有的能源消耗里面,煤炭也占有很高的比重,其中,20世纪50年代的比重曾高达90%。煤炭产业对于我们国家的稳定和发展有着不可替代的作用。即使在现今倡导新能源使用的大环境下,我国的煤炭能源占比任然高达60%。因此,煤炭行业能否安全稳定发展将直接关系到我国的能源战略和经济的可持续发展[1]。煤矿生产过程中会出现很多的安全隐患,近几年来,学术界开始出现通过数据挖掘方法对煤矿安全隐患数据进行挖掘,进而获取有用信息的研究。但是由于从煤矿安全隐患监控系统获取的数据大都是半结构化的数据,人们不能直接对这些数据进行挖掘,必须要进行前期的处理以后才可以挖掘,而这些工作又可能带来挖掘上的误差,这使得人们只能通过研究一小部分数据获取比较有限的潜在信息资源,而针对海量煤矿安全隐患参数信息的研究工作还很少有人涉猎。大数据技术是继云计算、物联网等技术之后又一重大的技术革命。大数据技术是指通过使用单片机传感器、视频监测系统、以及数据处理软件等捕获数据的技术。大数据具有存储数据量巨大、数据处理超快、数据类别繁多、数据真实性需要进一步处理才能获取、数据有效价值密度低等5V的特点。大数据技术已经渗透到人们日常生活和生产的各个环节,成为不可或缺的生产要素。本文结合大数据技术,通过对煤矿安全生产中存储的海量不规则的数据进行数据获取、数据标准化处理、数据挖掘等过程,获取煤矿安全生产过程中数据的有用信息,指导煤矿安全生产工作。

一、数据获取

本文以石板桥煤矿2015年12月-2016年12月的煤矿安全隐患监测数据作为研究对象,通过自动或手动的方式获取了瓦斯量、瓦斯压力、通风量、温度以及矿井深度等煤矿安全隐患参数信息。

二、数据标准化处理

本文将瓦斯量、瓦斯压力、通风量、温度以及矿井深度分别用字母C、P、V、T、D来表示,将瓦斯量分为(0-0.16),(0.16-0.31),(0.31-∞)三组,对应的字母分别为C1、C2、C3;将瓦斯压力分为(0-10),(10-17),(17-∞)三组,对应的字母分别为P1、P2、P3;将通风量分为(0-1100),(1100-1250),(1250-∞)三组,对应的字母分别为V1、V2、V3;将温度分为(0-20),(20-30),(30-∞)三组,对应的字母分别为T1、T2、T3;将矿井深度分为(0-300),(300-350),(350-∞)三组,对应的字母分别为D1、D2、D3。根据瓦斯浓度的值的情况可以将其分为(0-0.15),(0.15-0.33),(0.33-)三组,对应的标志分别为:Q1,Q2,Q3;根据瓦斯压力的值的情况可以将其分为(0-7),(7-18),(18-)三组,对应的标志分别为:R1,R2,R3;根据通风量的值的情况可以将其分为(0-1200),(1200-1300),(1300-)三组,对应的标志分别为:S1,S2,S3;根据温度的值的情况可以将其分为(-11),(11-15),(15-)三组,对应的标志分别为:T1,T2,T3;根据煤层厚度的值的情况可以将其分为(0-4),(4-7),(7-)三组,对应的标志分别为:U1,U2,U3。

三、数据挖掘

存储在数据仓库中的数据蕴含有丰富的有用信息,这些信息必须进行专业的数据挖掘处理才能获取,本文采用关联算法对数据仓库中海量的数据进行挖掘。(一)Apriori关联算法简介。Apriori算法的原理是通过逐层迭代的方法来产生候选项集合,然后通过生成的频繁k-项集查询候选(k+1)-项集,这种算法每一次都需要对数据仓库进行重新扫描,最终挖掘出数据仓库中所有满足条件的频繁项集。(二)Apriori算法实施环境。硬件环境:处理器为酷睿i7,内存为4G,硬盘为500G。软件环境:SQLServer2008+VisualStudio2010。算法运行环境为jre1.6.0_39,Tomcat6.0。(三)Apriori算法运行流程。通过使用Apriori算法对煤矿安全隐患参数信息进行数据挖掘的关键因素是获取极大频繁项集。首先通过使用web浏览器登录煤矿安全隐患数据管理系统,打开关联规则数据挖掘界面,并进行如下的操作:(1)设定需要挖掘的煤矿安全隐患参数信息,主要包括瓦斯量、瓦斯压力、通风量、温度以及矿井深度。(2)输入最小支持度:最小支持度的数值应该在0-1之间。(3)设置最小置信度:最小置信度的数值应该在0-1之间。(4)运行挖掘算法程序,通过数据库关联代(下转第68页)学活动设计时,就应预见此类情况,对于没有及时响应的教学活动,设置响应时间阈值,建立及时响应保障策略。2、促进深度学习,提倡个性化学习。一方面,网络教学的学习者在对课程的知识储备、接受能力和学习时间分配等方面存在差异,缺少个性化设计已成为网络教学发展的一个瓶颈。为此,在课程设计过程中,就要有意识地考虑教学对象的差异性,将个性化设计的理念融入到整体课程设计中,个性化的学习活动可看做整个课程设计的子集,并随着教学的逐步深入和学生能力的提高以及学习状态的变化,在不同个性化子集之间转换。个性化的学习方案还必须能够与标准配置的教学活动设计无缝对接,以避免因过分强调个性化而偏离了网络教学的正常轨道。另一方面,与传统教学相比,网络教学活动缺乏灵活性,尤其在开发深度学习方面还存在空白。在“互联网+”的时代,同商业领域的应用相似,在网络教学中也可以利用大量的学习行为数据分析学习者的需求,按照分析结果中[4]所显示的学习者的学习习惯、学习能力以及对课程知识点的掌握程度,自动过滤或重复某些碎片化学习活动,从而提高学习效率和保证学习质量。3、挖掘教学活动的可追溯性,构建网络教学的增量发展模式。网络教学资源的复用性远远低于传统教学,教师在网络课程设计时通常有一种惯性思维,按照正常教学计划进行设计之后,教学活动呈现出不可逆性。但随着课程教学的深入,学习者对教学资源必定会有新的认识,同样的教学活动也会带来不同的效果。根据学习内容的难易程度,适时回溯到上阶段的教学活动,转换角度或提高活动难度,制定增量式的阶段性学习目标,不仅提高教学资源的复用性,也可激发社会心理学中的间歇效应,即当停止一段时间后,再继续,对它的学习兴趣反而会恢复正常甚至比之前有所提高,在掌握知识的深度和广度上有一个螺旋式的上升。

针对智慧教育过程中产生的海量数据进行分析,与挖掘,可以构建各种评价模型,以便对智慧教育的质量进行检测与管理,为学校和教师的教学提供参考[5],完整、准确的评估学生的学业状况和教师的授业情况,及时发现教学过程中潜在存在的问题,保障教学质量。通过开展该领域的研究工作,将会有力带动和加快信息共享综合治理的步伐,突破现有的数据壁垒,避免不必要的资源浪费,积极推动生态环境的良性发展[6]。

参考文献

[1]张庆堂;曹伟,学习者和管理者视角下现代远程教育服务质量评价体系研究[J].中国远程教育2016(10),44-50

[2]牛拥;冯奕兢.教育信息化新阶段教育技术中心发展路径探析[J].实验室研究与探索.2017(9).229-232

[3]李彤彤;武法提.给养视域下网络学习环境的生存结构新解[J].电化教育研究2016(11):51-58

[4]张浩;吴秀娟;王静.深度学习的目标及评价体系构建[J].中国电化教育.2014(7):52-55

[5]黄华兴;袁艺标;刘力嘉;杨海源;沈历宗;夏添松;秦超;叶俊;王水.E-learning网络平台的构建及应用效果分析[J].实验室研究与探索.2017(2):200-203

[6]罗晓东戴庆伟尹立孟陈玉华张丽萍喻祖建蒋月月.互联网+实践教学模式探讨[J].实验室研究与探索.2018(1).218-222

作者:孙国营 单位:六盘水师范学院数学与信息工程学院