统计数据质量提升分析

时间:2022-04-08 10:19:43

统计数据质量提升分析

摘要:近几年以来,我国的民营经济发展速度不断加快,并逐渐成为国民经济体系的重要组成部分,所以在对国民经济的发展进行研究时,必须深入研究民营经济的统计工作。但是,根据我国的部分民营经济官方统计数据显示,其中存在许多失真的现象,不能对我国的国民经济发展起到良好的借鉴作用。因此,本文对民营经济统计数据工作现状展开了深入分析,并提出了数据挖掘技术的应用策略。

关键词:数据挖掘;民营经济;统计数据;质量

在大数据技术快速发展的推动下,大数据时代逐渐来临,人们越来越重视数据的价值。通过采用数据挖掘技术,能够从海量的信息数据中挖掘出比较具有价值的信息,所以必须保证统计数据的质量合格,才能对挖掘信息起到至关重要的决定性作用。对于政府统计工作而言,民营经济统计数据质量影响着政府统计部门的公信力以及整体信息。随着社会主义市场经济的快速发展,政府部门在日常工作事务中越来越注重使用统计数据。但是,在使用官方统计数据时,其质量很容易受到社会公众以及媒体的质疑,认为民营经济统计数据中存在失真信息。为了有效提升民营经济统计数据质量,必须加强研发全新的数据挖掘技术,才能改善质量低下的问题,满足使用者的需求。因此,数据挖掘技术对于提升民营经济统计数据质量起到重要作用。

1民营经济和统计数据质量的概述

目前,学术界对于民营经济的研究仍然处于初级阶段,没有形成相对统一的观点,其中比较普遍的观点认为:“民营经济属于国有和国有控股、集体控股、外商以及港澳台商独资和控股经济组织,民营经济体系中的重要组成部分为私营企业、个体工商企业以及农民专业合作社。在民营经济体系中,有私营企业以及个体工商户两大重要部分。”而统计数据质量,主要受到多方面因素的影响,其中的主要评判标准为实用性、准确性、及时性、可解释性以及衔接性等等。具体而言,统计数据质量主要从准确性、适用性、可比性、可获得性以及时效性等各个方面来进行评判。

2当前我国民营经济统计数据质量的主要现状

目前,我国政府每年都要对外公布大量的民营经济统计数据,这些统计数据和人们的日常生活存在密切相关的联系,对于民营经济决策和得出结论具有不可或缺的作用。但是在我国民营经济统计数据工作中存在许多复杂的现象,所以造成了各种问题。2.1当前民营经济统计数据存在失真现象。目前,社会公众以及媒体普遍了解民营经济统计数据存在失真的现象,例如:部分地方的GDP增长速度已经逐渐超过全国,GDP总量逐渐大于全国。而这一民营经济统计数据就存在严重的失真现象,主要原因在于缺乏完善的统计制度。而且在部分地区的统计部门工作中,在民营经济统计数据时,没有设定专门的统计负责部门,完全把各个行业的民营经济统计数据工作指派为相应的行业部门负责,然后在调查队以及统计组和数据统计完成之后,再通过各级政府部门向上通报。而许多地方政府为了节约人力、物力和时间,没有进行数据统计工作,完全以虚假数据上报,所以造成民营经济统计数据中存在失真的现象,无法保证统计数据质量。2.2各个地区的民营经济统计指标存在偏差,无法使统计数据准确衔接。从整体层面上来看,在我国的各个地区民营经济统计中没有形成统一的指标,也没有专门设定相应的部门来进行民营经济统计,所以就导致各个省市在统计民营经济数据时,缺乏完善的参考标准,分别按照自身的实际情况来进行统计,所以就造成各个地区的民营经济统计数据缺少可比性,无法使统计数据形成准确衔接。例如:在湖北省的民营经济统计数据工作中,工商局、工商联以及中小企业局等几个部门都负责民营经济管理工作,但是市级的民营经济统计却由中小企业主管部门来进行控制。正是由于各个部门的概念模糊不清,没有形成统一的统计标准和统计体系,所以对湖北省的民营经济统计工作以及科学决策造成较为不利的影响。2.3民营经济部门配合统计工作缺少积极性,随意申报各项数据。随着大数据时代的来临,民营经济统计数据不断增多,这也就造成民营经济统计工作任务的负担不断加重,如果仍然通过统计部门和政府部门来开展工作,将会导致工作效率降低,必须充分调动民营经济实体的工作积极性。然而在民营经济统计工作中没有制定完善的法律法规约束,其完全要求民营经济实体按照义务的要求进行统计工作,导致许多统计部门缺少工作积极性,喜欢随意敷衍了事,随意申报各项数据,这也就导致民营经济统计数据不够准确。

3数据挖掘技术对民营经济统计数据质量的提升作用和应用策略

3.1微观层面的应用。由于我国民营经济体系存在的对象比较广泛,各个对象的规模都不一样,而且在分布范围上比较广泛,所以在开展民营经济统计工作时具有较大的难度。因此,为了提升民营经济统计数据质量,笔者针对数据挖掘技术的应用作用展开了深入分析。3.1.1识别孤立点。在应用数据挖掘技术时,首先需要明确孤立点,也就是数据集合中和许多普通数据存在不一样特征的数据。因此,在挖掘数据的孤立点时,需要同时提供n个数据点或对象几何,然后在集合中挖掘发现预期孤立点m,并且及时发现和剩余数据存在显著差异的数据对象,这m个数据对象都属于孤立点。在应用数据挖掘技术对孤立点进行挖掘时,可以采用基于统计、距离、密度、偏离、粗糙集以及聚类的多种不同方法,或者应用人工神经网络的方法。在挖掘民营经济统计数据的孤立点时,其中包含的数据内容比较庞大,所以在政府机构人员收集数据工作时,无法进行一一核实,必须在一次筛选的过程中,把差异性孤立点数据准确筛选出来,把许多无效的数据剔除出去,才能得到更加真实的原始数据。所以可以应用聚类分析的方式,来分析民营经济统计数据的孤立点,这样能够减少工作量。3.1.2替代缺失数据。在大数据中的缺失数据主要指的是集中部分记录的属性值丢失以及空缺,这些属性值反映了缺失信息。在我国的民营经济统计数据中存在大量的信息数据,但是缺少完善的记录制度,所以很容易提交空白数据或虚假数据,从而影响了数据统计结果的准确性以及真实性。因此,为了替代民营经济统计数据中的缺失数据,可以采用单值替代、回归替代以及类均值替代等多种方式,才能获得准确的替代结果。3.2宏观层面的应用。我国的许多地方统计部门在对民营经济统计数据进行处理以及分析的过程中,通过应用数据挖掘技术,能够提高操作效率和数据处理速度。因此,需要从这样几点入手,才能获得准确的分析、预测结果。第一,加强应用关联规则。在事务数据库中把不同事务的属性表现出来,然后把这些事务的关联规律找出,从中深入挖掘隐含信息,这样能够快速汇总出和行业存在关系的数据信息,从而消除空白数据和虚假数据。第二,应用决策树。其主要通过构建分类、聚类以及预测模型,能够利用决策树来综合分析和预测民营经济统计数据,从而获得准确的预测、统计结果。

4结语

总而言之,在我国社会现代化改革发展的过程中,为了促进社会经济稳定可持续发展,必须加强利用数据挖掘技术等先进的技术,以此来确保民营统计数据质量,创造良好的社会经济效益。

参考文献:

[1]柯芳.基于数据挖掘技术的提高民营经济统计数据质量研究[J].经济论坛,2017,(6):141-144.

[2]辛金国.基于数据挖掘技术的统计数据预处理研究[J].JournalofDataAnalysis,2013,8(5):55-65.

[3]辛金国,柯芳,李绍君等.数据挖掘技术在浙江省经济统计中的应用[J].统计科学与实践,2009,(4):31-33.

作者:万金 单位:河南驻马店市统计局