林业统计数据质量评核体系

时间:2022-07-27 02:31:24

林业统计数据质量评核体系

1林业统计数据质量评估现状分析

1.1统计数据质量评估现状

统计数据质量评估是对取得的统计数据进行核对、分析和评价,通过评估得到统计数据误差,利用误差率进行调整来提高统计数据的准确性[1]。20世纪80年代以前,国际统计界是以提高数据准确性为核心,从数理统计和抽样技术角度,研究如何缩小统计误差既而控制数据质量。在改革开放初期统计数据质量问题就引起了关注,在1988年Perkins提出了中国经济增长率可能存在上偏误差的问题,到90年代初期开始对这一问题进行初步研究。刘孝新等(1997)运用事后预测和反常结果判断法对统计数据质量进行了评估和推断;成邦文等(2002)从一致性误差和非一致性误差两个方面分析了社会经济统计数据误差;刘洪和黄燕(2007,2009)运用趋势模拟评估法和相关指标分析法,对统计数据质量进行了定量评估[2]。DonaldPBallou等提出DQ优化模型,介绍如何根据既定的数据集来获得解决质量问题的方案集(DonaldPBallou等,1999)[3]。

1.2林业统计数据质量评估现状及存在的问题

林业统计数据在收集、整理、加工至运用各个环节中都有可能会产生大量的质量问题,影响到数据的利用效果,而目前对林业统计数据质量的评估内容还仅是针对统计数据准确性,需要将评估内容扩展到林业统计数据质量的其他特征的评估。林业统计数据质量的评估工作不仅得到了政府部门的重视,更是成为专家学者们研究的重要课题。统计部门的行为会直接影响数据质量,如统计数据搜集整理过程中出现的设计误差、调查误差、汇总误差等(王强,1990;颜德纶,1990)。成邦文等(2000,2003)[4]提出了对数正态分布检验法,主要针对一维数据,并结合实际情况将这一方法推广至多维统计数据的质量检查和异常点识别当中;王华和金勇进(2010)在提出了对统计数据准确性评估方法及适用性分析之外,又提出可对统计数据质量进行用户满意度测评的重要方法;直接对统计信息质量评价十分困难,许涤龙和张芳运用层次分析法建立评价指标体系间接对统计信息质量进行评价,这样的方法可推广到林业统计数据质量的分析中;屈耀辉、曾五一(2004)[5]借助Cochran(1977)提出的计量误差数学模型,分析了计量误差的来源及其对总误差的影响。要提高林业统计数据的质量,就要建立有效的林业统计数据质量评估体系,而要建立评估体系仍有很多困难,例如在建立的评估体系中要重点突出林业统计数据质量评估指标及评估方法的选取。同时也暴露出林业统计数据质量评估中自身存在的问题。①中国目前采用的林业统计数据质量评估方法主要是一维评估法,而林业统计数据的复杂性决定了它需要多维的质量评估方法,由于对统计数据质量内涵的认识较浅显使得寻求一种多维度的林业统计数据质量评估方法存在很多困难。②普遍适用的林业统计数据质量评价指标体系难以建立。林业统计工作的独立性较差,重视单项数据质量,忽视全面的、综合的数据质量,评价指标难以界定和精确测量。③在林业企业,统计部门与业务部门各自收集一套数据,这样就不可避免地出现统计部门的数据与业务部门的数据之间存在差异的现象,使得林业统计数据的可释性变弱。④林业统计数据失真。失真原因可能如下:统计法制观念淡薄;现行统计管理体制使统计工作易受到行政干预;基层信息化人才力量相对不足,人才培养工作相对薄弱的问题越来越突出[6];统计基础工作不规范,核算管理差。⑤林业统计数据多但适用性不强。数据的过剩和数据的不足是同时并存的一种矛盾现象[7]。用户无法从繁多的数据中找到真正需要的数据,国家和地方的指标体系涵义有所偏差,导致数据适用性更加低下。

2林业统计数据质量评估体系的构建

2.1林业统计数据质量评估体系指标的选取原则

科学性原则。林业统计数据质量评估体系的建立,各项指标必须有机结合,形成体系,将指标体系做到科学性。②定性与定量相结合原则。结合当地的实际情况,再进行量化分析,做到定性定量相结合。③可比可行性原则。指标数据收集的可行性,要求在现有条件、技术手段下能够而且易于取得数据。林业统计数据质量评估体系的构建,要具有实用性,要考虑指标要有统一的度量口径。④层次性原则。指标应采用层次分析法,使林业统计数据质量的评估指标涵盖主要要素,从而全面真实地反映林业统计数据质量。

2.2构建林业统计数据质量评估体系

统计数据评估体系应包括三个方面的内容:评估实施机构、评估方法、评估指标体系。评估体系构建的关键是指标设计有客观的标准可以度量。首先要确定数据质量的评估指标,根据数据质量评估指标采取一定的评估方法对数据质量进行评估。IMF的数据质量评估框架DQAF提供了对统计数据质量进行定性评估的一种方法。在为IMF建立一个数据质量的评估框架时,Carosn(2001)指出一个数据质量的评估工具需要有以下的特性:对质量的维度和能代表质量的特性的全面覆盖;专家希望得到的数据特性和一个普通数据使用者希望得到的数据特性之间的平衡;结构化的,但又是足够灵活的,可适用于一个比较宽的数据收集范围。

2.2.1林业统计数据质量评估指标体系林业统计数据质量指标是多维的,包括林业统计数据内容质量的评价标准、林业统计数据描述质量的评价标准及林业统计数据质量的约束标准。建立有效的林业统计数据质量评估指标体系,宗旨是要满足用户的需要,并且如何将定性指标量化是一个核心难题。通过查阅和收集国内外现有的统计资料、统计指标和统计信息,借鉴王华和金勇进研究的通用的统计数据质量评价指标体系来寻求适合林业的统计数据质量评估指标体系见图1。统计数据质量的评估指标反映统计数据的优劣,与用户需求密切相关。而林业统计数据质量未必都要满足统计数据质量的指标体系的所有特性,而是要根据用户的需要,满足某一种或几种指标特性。林业统计数据涉及林业的方方面面,总量庞大,针对不同的林业统计数据的质量会有其相对应的具体评价指标。

2.2.2林业统计数据质量评估方法体系①层次分析评估法。对具有多维属性或受多种因素影响的数据质量确定各因素权重是一个棘手的问题,确定权重一般采取经验判断法,受主观性影响较大,所以要将难以量化的定性指标量化就要借助层次分析法。而对于林业统计数据质量的评估很难将统计数据质量指标达到量化的效果,所以这种方法要针对林业统计某一方面的具体数据质量评估时建立适用于此方面的层次分析模型,确定权重,然后结合其他的综合评价方法达到评估的效果。②模糊综合评价法。模糊性是指某些事物或概念的边界不清楚,这种边界不清的模糊概念,不是由于人的主观认识达不到客观实际所造成的,而是事物的一种客观属性[9]。林业统计数据质量受到多种因素的影响,对于各因素的评价不是好与不好所能分辨的,在这种情况下要采取模糊综合评价法。通过专家评价法、抽样调查、问卷调查等给各评价指标赋值,运用层次分析法得到的各指标的权重,计算出模糊评价矩阵,得到最大的可能性即可评估数据的质量。③逻辑性评估法。遵循逻辑关系进行对比的同度量统计指标彼此互为参照标准,为对方设立统计核算规则所允许的动态的取值范围。如果进行对比的统计指标间违背了特定的逻辑关系,表明其中必定有某个(或多个)统计指标的数值超出了正常的取值范围。在统计数据生成过程的各层环节当中,逻辑规则检验是各级统计部门进行统计质量检查与控制的主要手段之一,这也是国际上通用的可解释性原则的应用(刘延年,2002)[10]。④趋势模拟评估法。搜集与评估内容有关的统计资料,根据统计数值构建模型,进行趋势模拟,通过比较实际值与模型模拟出来的数值的离差来评估数据质量。这种方法有一定的局限性,要假定林业统计数据是按正常环境下收集的,如发生偶然事件导致数据准确性有偏差就不能用此法来片面评估。具体做法是把统计指标实际值与预测值比较,计算出误差U,U=为实际值,yi为预测值,事先通过专家评分法及往年的数据经验给定一个允许的误差范围,在误差范围内则认为统计指标数值是可靠的[11]。

3林业统计数据质量评估实证分析

依据表1采用层次分析法和模糊评价分析法对黑龙江省1990~2008年人工造林面积数据质量进行综合评估(见表2)。根据设置的评价指标体系及标度表(见表1)建立如下判断矩阵(见表3~表6):Q对Q1,Q2,Q3权重分别是0.58,0.31,0.11;F1,F2,F3权重分别是0.6,0.2,0.2;F4,F5,F6权重分别是0.6,0.2,0.2;F7,F8,F9权重分别是0.6,0.2,0.2;用专家评价法对评价指标体系中的指标赋值,然后用模糊评价法数据质量进行综合分析(见表7)。第一级模糊综合主价为:二级模糊综合主价为:结论:选取的林业方面的统计数据质量得到一种评价的可能性各是多少,最大的为30.12%。按最大隶属原则,可认为所要评估的林业统计数据质量较好。