数据挖掘在未成年人口数量统计的应用

时间:2022-09-20 04:34:06

数据挖掘在未成年人口数量统计的应用

摘要:随着各地各省市教育大会的召开,未成年的教育问题备受关注,本文通过对中国近年来各地区的青少年的人口进行数据收集,运用数据挖掘的方法进行预测,得知未来青少年的人口数量和各地区青少年人口结构情况,从而可以明晰数据背后的意义和规律,对未成年展开适合的教育有着十分重要的意义。

关键词:未成年人口;教育;数据挖掘

根据党的“”报告,中国经济已由高速增长阶段转向高质量发展阶段,报告指出“在转变发展方式、优化经济结构、转换增长动力的攻关期,建设现代化经济体系是跨越关口的迫切要求和我国发展的战略目标”。实现此目标的驱动和载体就是人才,并且未成年人的教育会间接影响国家人才的质量和数量,只有了解各地区青少年的人口数量,才可以因地制宜,更好的进行教育工作。国内有许多专家学者已经运用数据挖掘方法进行了研究。采用数据挖掘的方法,对北京市人口增长影响因素进行分析,通过进行相关性分析,挖掘出34个与北京市人口增长相关性较强的因素,构建了一个较为完整的北京市人口增长影响因素指标体系。通过属性规约和属性相关分析对人口信息系统的数据进行了预处理,对预处理后的属性采用信息增益方法构造决策树,并对决策树表示的知识利用决策表的规则合并方法进行合并,据此得出了人口变动的基本规律。

数据潜在信息的重要技术,将它运用在分析中国人口方面一定能起到非常好的效果。研究各个地区的未成年人的人口数量是一个严峻的工作,本文使用spssmodeler软件对2006-2017各个地区未成年人的数量进行分析,对未成年的教育工作提出一些建议。模型建立—聚类分析聚类分析是一种对物品、样品或者指标进行分类的一种统计分析方法,它们讨论的一般是量比较大的物品,要求按照物品各自的特性进行合理的划分,没有任何的前提要求和参考标准,即是在没有先验知识的情况下进行的分析。本文中案例数据主要来源于中国统计年鉴,数据中主要包括了各个地区青少年的人口数量从2005到2016的数量情况。本文采用聚类分析的方法,按照中国各个地区的未成年的人口增长趋势的不同将地区进行聚类,明晰各组聚类数据的特点,从而能更好的把握中国未成年人口增长的地区性特征。根据第五次人口普查资料,按各省(区)人口平均密度可分成4类地区:(1)非常稠密区。每平方公里人口在400人以上,包括沪、京、津、苏、鲁、豫、粤、浙、皖等6省3市。占全国总人口的38.8%,平均每平方公里高达552人。(2)稠密区。每平方公里人口在200-400人之间,包括渝、冀、鄂、湘、辽、闽、赣、琼、晋、黔等10省市。(3)较稠密区。每平方公里人口在100-200人之间,包括桂、陕、川、吉、云、宁等6省(区),占全国总人口的194%,平均每平方公里155人,高于全国平均人口密度。(4)稀少区。每平方公里人口在100人以下,包括黑、甘、蒙、新、青、藏等6个省(区),人口1.13亿人,只占全国总人口的9%,平均每平方公里20人,远远低于全国平均的人口密度。根据以上数据的分类,可以将此次聚类数目设置为4类。根据聚类结果可以看出,聚类1中包含的省份有北京,天津,内蒙古,吉林,上海,海南,重庆,甘肃,青海,宁夏,新疆。未成年人口的初始数量在1000万人和500万人左右,并且在持续快速的增长。聚类2包括山东,广东,河南,四川,初始未成年人口数量在8000万人左右,并且增长速度稳定较缓慢。聚类3包含河北,江苏,湖北,湖南,初始未成年人口数量在5000万人左右,无明显的增长。聚类3包含陕西,云南,贵州,广西,安徽,福建,黑龙江,辽宁,初始未成年人口数量在4000万人左右。

通过对数据的预处理、数据的聚类分析之后,我们对2005到2016年之间人口的增长状况有了全面的把握,不仅可以较为科学合理的预测出人口增长的大致趋势,也可以了解到各个地区的人口增长特点。运用数据挖掘中聚类的分析方法,我们将各个省份近几年的未成年的人口增长方式进行分类,将中国的未成年的人口增长方式分为了5类。对于人口基数大,并且人口平稳增长的城市,相关政府要合理控制人口增长速度,鼓励本城市人口向外地发展,缓解城市内部由于人口过多,积压而产生的社会矛盾。对于人口基数不大,人口增长缓慢的城市,政府应当积极出台相关政策进行吸引,鼓励外来人口进行务工,为外来人口提供较为舒适的居住环境和工资条件。同时对于教育问题,政府也需要根据未成年门口的变化趋势,因地制宜,灵活运用教育政策,促进未成年人教育的高效发展,同时国家应完善法律法规,健全未成年人权益保护制度;父母应履行家庭保护的职责和抚养义务,教育、引导未成年人;学校应全面贯彻国家教育方针,保证未成年人的身心健康和全面发展;社会为未成年人健康成长提供良好的社会环境;青少年自身增强自我保护意识,掌握日常生活中自我保护的方法和技巧。

参考文献:

[1]冯守平.中国人口发展预测模型的构建与应用[J].统计与决策,2010,(15):24-27.

[2]柳德江,殷凤玲,唐红燕.玉溪市未来人口预测三种模型的分析[J].中国人口•资源与环境,2011,(3):17-19.

[3]龙承星,张波.昆明市人口预测模型研究[J].云南民族大学学报:自然科学版,2011,(7):258-261.

[4]赵沙,张福平.西安市未来人口规模预测及人口发展对策研究[J].干旱区资源与环境,2012,(2):7-12.

[5]沈巍,武鑫.基于数据挖掘的北京市人口增长影响因素研究[J].中国人口•资源与环境,2013,23(S2):470-473.

作者:王瑶 臧子雁 单位:北京物资学院