消费数据论文:小议消费数据误差与修正

时间:2022-02-19 03:15:52

消费数据论文:小议消费数据误差与修正

本文作者:王松付志刚工作单位:湖南商学院

中国居民消费率数据的三个主要来源及特征

在当前的中国国民经济核算体系中,居民消费率数据主要有三个来源,其具体推算方法和特征如下:第一个来源是根据支出法国内生产总值及其结构中相应的居民消费与GDP数据比例推算,简称为支出法(下同)。其核算方法用公式表示为:居民消费/支出法GDP。由于该方法中推算涉及的所有数据都来源于《中国统计年鉴》,数据获取直接、来源权威,且保证了统计口径一致,使其成为衡量宏观居民消费率最常用的方法。在实际分析中,大量学者(李姝,2002;董辅祁,2004;何刚,2005;刘尚希,2008等)基于此得到的数据,给出了中国居民消费率偏低和存在下降趋势的判断。但一个不容忽视的事实是,该方法存在一些问题,如会受到国家统计核算体系调整等因素的影响。许宪春(2004)指出,统计核算的调整和完善会导致GDP和居民消费统计数据的变化,从而导致居民消费率的变化。第二个来源是根据31个省市自治区支出法GDP核算与结构数据的加总进行推算,简称为地区加总法。其核算方法用公式表示为:ΣCiΣGDPi,i=1,2,…,31其中,分别表示31个省市自治区,Ci表示各地区的居民消费,GDP表示各地区GDP1。该方法数据获取没有前一种方法那样直接,不过还是比较容易获取,而且数据的统计口径一致,因此在宏观层面数据难以直接获取或存在误差的情况下,不失为一个可行且有效的方法。如白重恩、钱震杰(2009)在推算劳动收入占比时,采用类似的方法进行分析,具体利用省际收入法GDP加总数据进行处理。但在分级核算体系下,该方法的准确性直接受到地区统计核算因素的影响。第三个来源是将微观家计调查数据与宏观支出法GDP数据结合起来进行推算。具体而言,是利用微观家计调查得出的城乡居民消费数据与各地区城乡人口数据,通过加权推算出居民消费数据,然后与支出法GDP相比得出居民消费率,简称城乡加权法。其核算方法用公式表示为:POPfarmCfarm+POPcityCcity支出法GDP,其中POPcity与POPfarm分别表示为城乡人口数,Ccity与Cfarm分别表示对应城乡家计调查的消费支出。该方法最为显著的特点是有效减少了统计核算因素对数据的影响,但加权得到的居民消费的口径比定义的小2,且加权的居民消费与支出法GDP的口径存在不一致。在宏观层面数据难以直接获取或存在误差的情况下,这种推算数据仍可以作为一个参考。如余永定、李军(2001)推算中国城镇居民可支配收入总额时,采用类似的方法,具体利用家计调查的城镇居民家庭人均可支配收入的数据,然后乘以城镇居民人口数而得到。根据以上三类方法得到的1978~2010年居民消费率变化趋势如图1。总体而言,以上三个来源各有优缺点(具体见表1)。就核算方法的特点而言,支出法和地区加总法数据获取比较简单,且统计口径一致,是衡量宏观居民消费率最常用的方法,但它们分别受到国家、地区统计核算因素的影响,尤其是考虑到我国统计核算体系正处于调整与完善的时期,这一影响是不容忽视的;而城乡加权法受到统计核算等客观因素的影响相对较小,但存在统计口径不一致的问题,即居民消费的统计口径与GDP核算数据的统计口径不一致,很有可能导致居民消费被低估。就数据的状态和变化趋势而言,支出法与地区加总法的数据在20世纪80年代初和2006年以来的这段时期内基本一致,但其他大部分时间段内支出法的数据大于地区加总法数据,这是由于分级核算体系造成的。其中,80年代中期到20世纪90年代初期,两者下降的幅度相差不大,从90年代中期到2010年各地区加总法下降幅度较小,而支出法下降幅度非常明显。在整个时间段上,城乡加权法的数据都小于支出法的数据,但两者的变化趋势很一致,即除2000年前后,两者都保持着相对稳定的下降趋势。三个指标的统计数据特征也有很大的区别,从均值水平上看,支出法为45.54%,大于地区加总法约2.7个百分点,大于城乡加权法约3.6个百分点,从波动水平来看,支出法波动中等,方差为5.53,地区加总法波动最小,方差为5,城乡加权法为6.1。可以看出,均值水平和方差上,三个数据都显示了较大的差异。这充分表明,由于来源的不同,导致了三个数据的状态和变化趋势彼此存在差异。更为重要的是,这也进一步表明三个来源的居民消费率数据都存在不同程度的误差。

数据修正模型

由以上分析可知,不同数据来源的居民消费率数据有着不同的状态和变化趋势,且都存在误差,不能准确反映居民消费的实际情况。而实际的居民消费率是不可能直接观测到的,因此如何修正以上数据,从而减少和消除误差,使之更能精确反映真实的居民消费率,本文借助加权法和状态空间模型进行分析。(一)加权法支出法和地区加总法尽管都存在误差,但在一定程度上都反映了真实居民消费率的状态和变化趋势。基于此,本文引入Aruoba等(2011)分析GDP统计核算数据的加权法,构建一个组合的居民消费率,该数据的特征是其误差比组合前的原始数据的误差都要小,也就是说组合后的数据能够更准确地反映真实居民消费率。考虑到口径的一致性,本文选取支出法和地区加总法为基础进行分析。具体模型构建如下:consc=λconse+(1-λ)consw+ut(1)其中consi,i=e,w,c分别对应支出法、地区加总法和加权法居民消费率(以下简称加权法),λ为权数,处于0与1之间。则(1)式表示加权法居民消费率为支出法和地区加总法的加权平均,故称为加权法。当λ=1时,加权法等价支出法;当λ=0时,加权法等价地区加总法。因此,λ的选取成为此模型的关键,本文以测量误差的方差最小的标准确定。首先,根据(1)式得到三个居民消费率与真实居民消费率的测量误差关系为:ec=λee+(1-λ)ew(2)其中,ec=cons-consc,ee=cons-conse,ew=cons-consw,分别加权法、支出法和地区加总法与真实居民消费率的差,即测量误差。cons为真实的居民消费率。(2)式显示加权法的误差为支出法和地区加总法误差的加权平均。进一步令E(ec)=E(ew)=0。对(2)式左右两边求平方期望,可得:E(ec2)=λ2E(ec2)+(1-λ)2E(ew2)+2λ(1-λ)cov(ec,ew)(3)左边即为组合消费与真实消费的均方误差(即方差)。本文参考RyanGreenaway-McGrevy(2011)的做法,使(3)式达到最小(鉴于此,加权法也可称为均方误差最小法)。求极值可得最优λ为:λ*=σ2w-σewσ2e+σ2w-σ2w=σ2w-ρσwσeσ2e+σ2w-2ρσwσe。(4)其中,σ2i=E(ei2),i=e或w,σew=Cov(ee,ew),ρ=Corr(ee,ew)。最后,本文根据支出法和地区加总法数据计算σ2e=E(ee2)=2104.512、σ2w=E(ew2)=1860.881与ρ=0.922,此时可得最优的λ*=0.115。当λ*=0.115时,(1)式为consc=0.115conse+0.885consw,则通过此关系式得到加权法居民消费率的结果如图2所示:(二)方法拓展:状态空间模型以上加权法能够有效减低统计核算数据带来的误差,但无法剔除统计核算体系等客观因素的影响,其准确性仍存在问题。进一步,考虑到真实居民消费是一个不能被直接观测到的指标,本文借鉴RyanGreenaway-McGrevy(2010)状态空间模型分析GDP统计核算数据的方法,研究真实居民消费的状态和变化趋势。根据三个来源居民消费数据之间的关系,建立状态空间模型。其量测方程为:const=rconst+ε1t(8)wconst=β1rconst+ε2t(9)其中,const、rconst及wconst分别表示支出法、真实居民消费与城乡加权法居民消费,ε1t及ε2t表示观测误差,都具有独立同分布性质,其方差分别为:σ21及σ22。从(8)、(9)式可以看出,状态空间模型把真实的居民消费作为未知观测变量,支出法与城乡加权法为观测值,观测值受到统计核算因素的影响存在误差。进一步,支出法核算的居民消费是对真实居民消费的观测,故(8)式中回归系数为1,考虑到由抽样等因素造成的测量误差,其含义表示支出法居民消费为真实居民消费与观测误差之和;(9)式中,考虑到支出法与加权居民消费存在很大的差异,且城乡加权法核算的范围小于真实居民消费核算的范围,故量测方程(9)中包含一个回归系数β1。另一方面,还需要对随机干扰项与的关系进行设定。考虑到加权法与支出法居民消费是按两种不同方式进行核算,且加权法居民消费不受统计核算调整的影响,故可令两者的误差项不具有相关性,即cov(ε1t,ε2t)=0。完整的状态空间模型还需要包括状态方程。一般而言,状态方程是一个可包含外生变量的滞后回归模型。本文认为未知观测量即真实居民消费为带有截距和趋势项的时间序列过程过程,故可建立如下状态方程:rconst=β0+β2t+rconst-1+vt(10)其中β2,β1表示未知参数,t为时间趋势项,Vt表示随机干扰项,具有独立同分布性质,其方差为σ23,且与上述随机干扰项ε1t及ε2t不相关。本文利用1978~2010年的数据对(8)、(9)、(10)组成的状态空间模型进行估计。其中城乡加权法居民消费数据来源于中经网数据库和国研网数据库,支出法居民消费数据来源于《中国统计年鉴2011》。估计的方法为卡尔曼滤波法。运用eviews7.0软件,输入下列关系式:@signalcons=sv1+[var=exp(c(1))]@signalwcons=c(2)*sv1+[var=exp(c(3))]@statesv1=c(4)+c(5)*@trend+sv1(-1)+[var=exp(c(6))]其中@signal表示信号方程,sv1为状态变量,即未知真实居民消费,var为相应干扰项方差,其等号后面表示方差的形式;@state为状态方程,@trend为趋势项。根据以上输入,得到的结果见表2。其中,列(1)显示c(4)及c(5)系数不显著,故考虑删除截距项或趋势项,其结果见列(2)、(3)。进一步,假设加权居民消费与真实居民消费差异不大,即令c(2)=1。得到的结果见列(4)。为了判断哪个结果较优,还需要对以上模型结果进行检验。从列(1)、(2)、(3)发现,c(2)系数接近于0,因此需要检验c(2)=0是否成立。利用Wald检验,结果都显示拒绝其为0的假设,因此认为c(2)不等于0。进一步,对列(4)中假定c(2)=1进行检验,同理,结果认为在1%的显著水平上拒绝其为1的假设。故认为列(3)为较优的结果因此本文根据列(3)的估计结果,选择平滑方法4对真实居民消费进行估计,估算结果再除以支出法GDP得到居民消费率。此时的居民消费率称为滤波后的居民消费率(简称滤波法),结合其他两个居民消费率的数据,结果见图3。图3显示,2000~2010年滤波法的居民消费率下降了10.21个百分点,支出法的居民消费率下降12.63个百分点,前者比后者下降幅度少了2.43个百分点。这充分说明,2000年以来支出法居民消费率夸大了的下降幅度和趋势。(三)综合修正模型的构建以上分析显示,利用加权法和状态空间模型进行处理,结果都是从不同方面接近真实的居民消费率。其中加权法是把原来两组存在误差的数据组合,得到更能有效反映真实情况的数据,但仍会受到统计核算体系等实际因素得到影响;状态空间模型是将真实居民消费率当作未知观测量,构建模型对未知观测量进行预测或估计,不断逼近真实值,而且能有效减小实际因素的影响。基于此,为能结合两者方法的优点,并保证修正后数据的更具有稳健性,本文建立以下模型:rconst=λ0+λ1consct+ut。其中rconst表示状态空间模型得到的居民消费率,是对真实居民消费率的观测,有效减少的某些实际因素的影响,但无法完全剔除所有影响,因此还存在着随机的波动;consct表示加权法的居民消费率,由于加权法使结果的方差最小,因此有效剔除大多数随机干扰因素的影响,但可能受到其他趋势性因素的影响,在此用λ0表示;λ0、λ1都为待估参数;ut为随机干扰项。利用加权法和状态空间模型所得的结果,本文首先对数据进行单位根检验,发现加权法居民消费率和状态空间模型居民消费率并不存在单位根,因此,可以进行以下线性回归分析,得到的结果为:rconst=-1.639+1.073consct(11)std(1.926)(0.044)***R2=0.949,其中“***”表示在1%的水平上显著,下同。其中括号内的数据为标准差,模型的拟合优度为0.949,但(11)的回归结果中,常数项λ0的结果不显著,因此剔除常数项λ0,得到的结果如下:rconst=1.036consct(12)std(0.039)***R2=0.949拟合优度为0.949,λ1系数在0.01的显著性水平成立。因此利用(12)式对居民消费率进行估计,得到的结果简称为回归法如图4所示。图41978~2010年不同来源的居民消费率进一步,本文对三个方法修正的居民消费率统计特征进行比较,详见表3。结果显示,在均值、方差和下降幅度三个方面,三个居民消费率存在差异。从数值上看,回归法的结果位于滤波法和加权法之间。具体而言,回归法的方差(27.08)比滤波法(30.59)低3.51,这在一定程度上降低了滤波法结果的波动性;回归法的均值(44.71)比加权法(43.71)高1个百分点,从而减少了某些实际因素的影响。由此可见,回归法综合了滤波法和加权法的优点,更有效的反映真实居民消费率的状态和变化趋势。

结论与研究展望

本文指出中国居民消费的核算数据主要存在三个来源,即支出法、城乡加权法与地区加总法。通过以上数据来源及其特征的分析,笔者认为在中国统计核算体系经历调整和完善的过程中,由于受到了统计核算体系、统计口径和调查方法等客观因素的影响,三个来源的数据都存在误差,都仅是对实际情况某种程度的反映。数据显示不同来源的居民消费率表现出不同的状态和变化趋势,且差异较大。考虑到实际居民消费率的未知性,本文引入加权法和状态空间模型对以上三个来源推算出的数据进行处理。结果表明两种方法各有优劣,其中,加权法能有效减小统计核算数据的误差,状态空间模型能消除部分客观因素对数据的影响,但两种方法得出的结果准确性还是存在问题。为能结合两种方法的优点,并保证修正后数据的稳健性,本文综合两种方法构建了综合修正模型(回归法)对中国居民消费率数据进行修正。修正后的数据对比修正前的数据,一方面准确性得到提高,即误差更小,受客观因素的影响更少;另一方面显示出的变化趋势也不一样,即修正后的居民消费率显示出的下降趋势并没有修正前数据显示的那么快,这表明如果基于修正前的数据来判断变化趋势,会夸大下降的程度。综上可知,修正后的数据比修正前的数据更逼近真实居民消费率,由此为研究中国居民消费问题提供了更为有效的数据支撑。当然,本文还存在进一步改进的空间。其一,支出法、城乡加权推算法与地区加总推算法在哪些方面未能准确反映真实居民消费率的变化,以及与此相关的典型化事实的挖掘,都有待进一步的分析;其二,中国国民经济统计核算体系不断调整和完善,很有可能给统计核算数据带来系统性影响,这也是本文未能深入探讨的,有待于今后深入研究;其三,在处理方法上,未能构建更为有效、完整的修正模型来综合处理统计数据,这是下一步研究需要重点改进的方面。