中国城市公共服务提供绩效评价

时间:2022-04-28 04:22:04

中国城市公共服务提供绩效评价

我国城市公共服务绩效评估指标构建

城市公共服务绩效是一个度量城市公共服务提供的目标性词汇,从内容结构上包括人民满意与物质提高两个方面。要评价这两方面内容,就需要科学、合理地反映这两方面现实的指标体系,它实际上是个跨学科测量问题,既涉及经济学、管理学所强调的投入产出和效率问题,也涉及心理学、社会学所要求的人民满意、心理满足问题,还涉及政治学、法学、公共行政学所要求的权力合法运行、人民权利正确保障问题,对于这些问题的正确评估需要从这些不同的学科视角提供不同的指标池。(一)确定指标池(Indicatorpool)按照城市公共服务绩效的内容结构与跨学科特点,本研究在“人民满意”与“物质提高”两个领域分别设置了“印象满意”、“政府效能”和“企业经营环境”、“基本公共服务”4个维度,并在这些维度中基于已有的各类公共服务绩效指标体系、公共效能评价指标体系、政府绩效评估指标体系遴选了99个横跨经济学、管理学、社会学、心理学、政治学、公共行政学、法学等学科的具体指标作为指标筛选的“指标池”②。(二)指标池筛选本文在筛选中利用单轮德尔菲法结合隶属度计算的方式来消除噪音。在单轮德尔菲的专家选择方面,我们采取了向全国在公共服务研究领域具有较深造诣专家发送Email的方式发送指标池,请他们对自己认为属于该评估维度的指标进行圈选,在Email发出后以电话提醒帮忙填答。本研究按照理论专家、实践专家、其他类专家共3个口径各选择了30人(如表1)。“其他类专家”是指“理论专家”和“实践专家”之外,对于公共服务领域颇为了解或者颇有研究的群体,比如专门关注公共服务的记者、第三部门志愿者、学生等。第一步,专家临界值确定。专家临界值下线的计算公式为M=μ+S∑nx=1槡Nta(x∈R+),其中,μ表示欲选择专家的期望数量;S表示专家对备选问题选择数量的标准差;N代表备选问题被专家选中的频数;tα是置信度α取特定值时的t检验值,它可以通过查阅t检验表获得。最后计算出临界专家数量为M=30+19.77槡4118×2.36≈31。第二步,隶属度确定。依照模糊数学的观点,城市公共服务绩效评估指标体系(I)本身就是一个模糊集合,每个指标就是集合中的一个元素,对每个指标进行隶属度分析即可确定出哪些指标在合格线之上。隶属度可以表示为Rn=MnT(n=1,2,…J),其中Rn为隶属度,J为指标的数量,T为反馈消息的专家总数。通过对反馈回来的82份有效问卷的统计分析,分别得到了99个指标池中指标的隶属度,并将其与临界值进行了对比。由于临界专家数量为31,临界值便为R=3182=0.378,这样,“事业单位满意度”、“市民感知的政府服务态度”等隶属度小于0.378的23项指标被剔除,剩下了76个指标。第三步,指标的鉴别力判断。指标的鉴别力涉及两方面的问题:其一是指标之间是否相关性过强,以至于一个或者多个指标实际上都指向同一个问题;其二是指标是否正确表达了所要评估的标的物。对于第一个问题,主要是通过对各个评价指标间的相关分析,删除一些相关系数比较大的评估指标。而对第二个问题,比较常用的方式是借助变差系数来消除这个问题。按照统计学原理,相关系数一般可分为3级:|R|<0.4为低度线性相关,0.4≤|R|<0.7为显著性相关,0.7≤|R|<1为高度线性相关①。本研究按照这种分类,将所有两两相关中|R|≥0.4的一项指标都进行了删除。结果,“交通警察处理小案速度”、“公民参与听证的频率”、“固定、移动与网络通讯的平均价格”、“年底平均房价”等14个不合格指标被删除,如表2。变差系数计算一般式为Vx=Sx珋Ix×100%,其中,珋I=1n∑nx=1Ix是指标的均值;Sx=1n-1(Ix-珔Ix槡)是指标的标准差。一般而言,一个指标的变差系数越大,则该指标的鉴别力越强,反之亦然。按照Foster、Greer、Thorbecke(1984)①、章炼(1992)②等的研究,如果测量指标都为正值,只要不同的指标总体在珔Ix±3Sx的范围内,就可以形成正态分布,其变异系数也达到了最大。从本研究的数据来看,珔Ix±3Sx≤0.590是变差系数的临界下线,也就是本研究删除指标的依据。经过SPSS18.0软件分析,我们删掉了“城市地税办税厅税务登记速度(0.52)”、“企业家对政府官员的信任度(0.44)”、“在岗职工社会平均工资(0.36)”等6个变差系数小于0.590的指标,最终形成了我们的指标体系(表3)。

L市公共服务绩效实证评估

在获得指标体系之后,本研究采取了一种不同于传统绩效评估价的方式来具体实施评估。首先按照“人民满意”与“物质提高”的评价域将需要评价的城市绩效分类展开;其次,将数据分为软数据与硬数据,软数据对应“人民满意”,硬数据对应“物质提高”;第三,将传统上单独进行的指标赋权过程与问卷调研、硬数据获取过程有机结合起来;第四,结合测量平差理论的已有成果,利用标准差倒数来确定权重并在此基础上开发出绩效评估的一般模型,进而评估出L市公共服务的整体绩效③;最后,为了判断该城市公共服务绩效的现状,我们还采取了与特定标杆值逐项、总体比较的方式。(一)数据的来源与搜集评估指标数据采集是城市公共服务绩效评价实证阶段最为关键的环节之一,本研究的数据采集包括软数据和硬数据的采集两部分。对于难以通过查阅文献记录获得的软数据,需要通过问卷调查、座谈会等实证调查方法采集。我们编制了面向普通市民、企业、第三部门的问卷④,在小范围试调研的基础上完善了该问卷,然后在L市发放了1000份针对市民的问卷、200份针对企业主的问卷和50份针对第三部门的问卷。硬数据的搜集主要通过查询政府公布的权威资料得来。本研究主要通过查阅《2009年中国统计年鉴》、《G省年鉴2008/2009》、《L市政府工作报告2008/2009》以及G省、L市政府门户网站的数据获得。(二)评价方法和评估一般式确定笔者采用测量平差理论中利用标准差来客观赋权的方式(喻国荣,2007⑤;王中宇等,2008⑥;王穗辉,2010⑦),利用问卷获得的实际数据、各类统计年鉴、行政记录等实在性数据对方差进行分析,然后按照测评理论中方差越小、其权越大的性质将赋权与评价结果结合进行。由于公共服务绩效评估涉及到的对象广泛,本文采用标准化方式实行无量纲化。其过程如下:设珔I为一列单位不一的指标实在值数据I的均值,σ为其标准差,那么对这列指标实在值I做无量钢化处理(标准化处理),求其无量纲值I′的公式便可以记为式(1):I′=I-珔Iσ(1)在解决了无量纲问题之后,就可以确定出最终的绩效评估一般式(2)了。本研究中最终的绩效评估结果都采用式(2)作为绩效评估的一般式。(三)评估实施在计算总体绩效的过程中,我们主要以(1)、(2)式为依据,这两个公式的展开都依赖于数据真值、数据均值、无量纲值,笔者利用SPSS18.0将这些值分项统计,其结果如表4。在获得了历史均值、无量纲值之后,就可以利用(2)式来计算每个指标的绩效值和总体绩效值了,这些结果也都整合在表4中。然而,仅仅获得L市的绩效值我们还很难弄清其政策含义,具体来说就是还很难依据它来提出改进L市公共服务绩效的措施,因为还欠缺可资比较的标杆。为了解决“有比较才有鉴别”的问题,本研究还引入了一个“理想值”变量作为标尺来判断L市公共服务绩效的好坏。理想值的产生基于4种逻辑:其一是根据理想化状态,比如人民对企业的满意问卷的最高值为6,我们便将该指标的理想值设置为6;其二是关于硬数据中的比率,如“燃气普及率”,我们按照理想状态将其设置为100%;其三是硬数据中的比较性理想值,这类指标既没有理想化值,也不可能具有比率的最大值100%,本研究选取了与L市同属于一个行政区,但发展势头更好、各方面情况均比L市更为理想的X市的值作为参照的“理想值”;其四是针对国家出台了明确标准的硬数据标准值如“每平方公里公共厕所数量为3个”①,这种本身属于国家层面确定的理想值,我们直接将其引用过来。在理想值的基础上,我们将之进行了无量纲化,产生了无量纲值,同时也计算了理想值的均值,最终也计算出了总体理想绩效值,处于表4的右半列。表4的“标志”是我们对筛选出的56个指标重新编号后的排序。在总体绩效评估结果中之所以出现了0值与负值,是因为我们假定,不管哪个城市都应该努力改善人民满意和物质提高的状态,实现“市富民乐”的施政追求,如果该市的绩效不能达到历史数据的均值状态,我们就认为它们在当年是缺乏绩效的,甚至是负绩效的。需要指出的是,这种逻辑是“第三只眼看政府”的第三方评价属性,其主要目的在于为政府诊断问题,引起它们的警醒,并非要全盘否定它们的工作,在这里负值只具备咨询价值和参考价值。尽管这不太符合常理,因为政府忙碌一年不可能一事无成,但我们认为以数量测评的直观结果来看,应当就是这种反映方式。(四)L市公共服务提供绩效概况总结表4来说,L市的公共服务绩效整体状况可以概括为4个方面:1.市民满意度、第三部门满意度、一站式服务中心办结速度等43个指标的绩效现状相对历史平均数据有了不同程度的提升,绩效整体状况呈现上升势头。从评价结果来看,市民满意(0.373257)、第三部门满意度(0.223954)、一站式服务中心办结速度(0.746514)等43个指标的绩效值均大于0,这说明在56个指标中,绝大多数指标(76.8%)所代表的公共服务绩效在提升,这也可以看作是我国政府持续改革的一个可喜成果。2.与标杆城市、理想值相比,L市的总体绩效仍然相对落后,改进余地尚大。尽管有43个指标对应的公共服务绩效在持续提升之中,但从与标杆值的比较结果来看,几乎每一个指标的绩效值都与理想值有差距,甚至较大的差距,这使得L市最终的整体绩效值(309.9416)仅仅为理想绩效总值(2361.997584)的13.122%,这充分显示了L市的单项绩效、总体绩效还有巨大的改进余地。3.企业主满意度、企业感知的政府服务态度、税务提醒告知服务制度化等12项与民生关系密切的指标的绩效现状甚至比历史平均数据还糟糕。从评价结果可以看出,企业主满意度(-0.1493)、企业感知的政府服务态度(-0.89582)、税务提醒告知服务制度化情况(-29.8606)、登记失业人员再就业率(-22.3954)、城镇居民人均居住面积(-12.6907)、城镇居民无房户比例(-88.7605)、居民月平均工资性收入与平均房价比(-126.882)、治安案件查处率(-131.386)、适龄儿童入学(园)率(-13.4372)、每万人专业卫生技术人员数(-11.9442)、一年中空气污染指数为良好(或二级)的天数(-134.372)、垃圾无害化处理率(-37.3257)共12项指标的绩效值甚至出现了负值,其意涵是相对于历史平均数据,该年L市这些方面不仅仅没有出现明显改善,还有恶化的势头。进一步细究这些指标,我们还会发现,这些指标中很多都属于与民生关系密切、甚至人民反响很大的社会热点问题,比如住房、就业、治安,说明L市与其它城市一样,在这些方面的公共服务还很不到位,甚至出现了下降的势头。4.水质综合达标率相对历史平均数据没有出现绩效改进。该项指标的绩效分值为0,代表该项指标相对于历史数据并未出现提升,说明该项公共服务并未取得应得的绩效。

推论与建议

评价结果实际上还蕴含了一个延伸性的结论,它对于评价、改善我国城市公共服务可能更具有普遍意义,我们认为这是本研究的一种推论,它来自于我们对理想标杆绩效值的分析。在标杆值中,竟然出现了0值、负值,说明我们选择的本行政区的“领头羊”城市与其历史数据相比较,公共服务绩效也存在着这样或那样的不足,如果推而广之,其他行政区的一般城市、“领头羊”城市可能也存在类似问题。推论1:与民生关系密切的评价指标绩效倾向于产生低绩效,甚至0绩效、负绩效。从统计结果来看,标杆值的工业用地平均价格(-22.39541342)、企业成立手续办结平均实际时间(-37.32568903)、城镇居民无房户比例(-394.8311386)、城镇居民3代人居住一套住房的比例(-201.5587208)、居民月平均工资性收入与平均房价比(-12.51654772)、年度刑事案件递增率(-110.4840395)、年度治安案件递增率(-118.6956911)、治安案件查处率(-57.4815611)、教育经费占地方财政支出比重(-119.4422049)、每万人专业卫生技术人员数(-24.11239511)、每万人医疗机构床位数(-79.13046075)、患传染病者未治愈率(-276.9566126)、每日噪音平均数(-20.90238586)、抚恤和社会福利救济费占财政支出比重(-66.81298337)、社会保险参保人次与常住人口比例(-102.2723879)共15个指标的绩效值出现了负值,这说明即使作为该地区领头羊的X市在这些指标上取得的绩效结果也较差,甚至出现了低于历史平均数据的情况。与L市一样,X市的这些负绩效指标也几乎都是与民生关系密切的公共服务事项,这无疑透露了一个具有普遍性意义的现实:在目前公共服务提供中,城市中普遍存在着忽视民生指标的问题,这大抵也是各个城市因为住房、拆迁、治安等问题频频引起自焚、上访等热点事件的原因。推论2:公共服务总体绩效提升更多采取了指标博弈的策略,即“捏软柿子”,“做更容易做的事情”,“不做对的,只做有分数的”。无论从L市还是标杆城市X来说,令人欣慰的是每个城市的公共服务总体绩效都在逐渐提升,这也符合我国各地的整体发展势头。然而我们应该看到,每个城市公共服务绩效得分更多来自于那些容易完成的指标,而对于像“城镇居民无房户比例”、“城镇居民3代人居住一套住房的比例”、“年度治安案件递增率”这种人民反映强烈、希冀有较大突破、需要逐渐降低数值以取得高绩效的指标,我国城市政府显然缺乏有效的办法,甚至其绩效还不如历史平均值;而对于像“居民月平均工资性收入与平均房价比”、“教育经费占地方财政支出比重”、“社会保险参保人次与常住人口比例”等人民热望改善、需要提高数值以取得高绩效的指标,我国城市政府也表现得一筹莫展,也有低于历史平均数据的现象。这些情况显示了我国城市政府在公共服务提供中采取了一种指标博弈的策略,也就是去做更容易完成的事情,“捏软柿子”,“不做人民热望的,只做能获得绩效分数的”。但毕竟提供公共服务不是参加托福考试,对于自己最没把握的听力可以放任自流,在公共服务提供中,如果人民反映强烈的公共服务持续提供不足,会引起政府的合法性危机,引起人民对政府的敌意。推论3:获得的并非“公共”服务绩效,而是“领导”、“上级”眼里的服务绩效。这是与推论2一体两面的问题。从L、X市来看,人民迫切需要提供的公共服务提供很不理想,而其它的公共服务相对来说具有较好的绩效,这其中就有很多属于上级政府、上级领导“严令”完成的公共服务,这是“压力性体制”在公共服务提供中的具体表现,在这种情况下,与其说提供“公共服务”,不如说提供了“上级”和“领导”眼里的服务。推论4:进步慢了就是落后。从L市来看,大多数公共服务绩效指标的绩效值尽管为正,但也仅仅是比0值稍微大一些而已,比如“市民感知的政府廉洁程度”、“企业感知的政府廉洁程度”、“政策信息依法公开程度”、“人均城市道路面积”分别为0.298606、0.223954、2.314193、0.000747,而作为“榜样”的标杆城市X,其绩效值的增长幅度也不够大。在一个追赶型、赶超型的国家,尤其是在赶超型的地区,进步慢了就是落后,我国城市公共服务提供还需要更高的效率,更高的绩效。如何破解结论与推论中的难题,提升L市乃至X市,甚至我国所有城市的公共服务提供绩效,笔者认为可以采取如下措施:措施1:普及型提升措施。由于存在着“进步慢了就是落后”的问题,这就需要我国城市在提供公共服务的过程中,不能“点到为止”,不能蜻蜓点水,无论是“市民感知的政府廉洁程度”、“企业感知的政府廉洁程度”还是“人均城市道路面积”,都需要有大幅度的改善,而不是采取磨洋工的方式,只求有所进步而不求两步并作一步走,需要采取跨越式发展来提供公共服务,绩效才可能有显著的进展。措施2:民生类公共服务提供需要采取特别项目型绩效评价制度。从L市、X市的绩效结果来看,与民生关系极端密切的住房、社会保障、治安保障类公共服务提供不仅改进较小,甚至还有衰退的现象。究其原因,与这些指标被其它容易完成、容易被捏的“软柿子”淹没不无关系。因为按照总体评价结果来看,城市公共服务还是在提升的,但这却掩盖了人民呼声最高的几种公共服务提供的恶化情况,这也是我国城市对房价怨言四起的原因。我们建议对于这些人民极端关注的公共服务,实行“特事特办”式的项目管理、项目评价,每一项都单独列入政府的决策、计划范围,甚至可以实行一票否决式评价,如果这些项目年度绩效评估结果不理想,就动用“一票否决”权,否决掉政府的公共服务提供工作。措施3:民生类指标采取绩效预算拨款方式,甚至采取公开招标方式投入预算,解决预算软约束问题。这是与措施2相互配套的措施,即对于那些有意无意被忽视的民生类评价指标,在采取项目制绩效评价的基础上,绩效评估结果要在来年的预算拨款中反映出来。凡是绩效评价结果好的指标、好的民生项目,就在原有基数上增加拨款;而评估为负绩效、0绩效的,则取消拨款,采取西方国家的“日落法”的做法,将这些公共预算款项面向社会实行招标,寻求更高效的组织来承担这些民生项目,为民谋利。措施4:将连续两年绩效为0、为负值的民生项目所对应的税收由地方税划归中央税,解决地方政府牟利而不服务的痼疾。从我们的评价来看,“城镇居民无房户比例”、“城镇居民3代人居住一套住房的比例”、“居民月平均工资性收入与平均房价比”等与住房有关的民生项目绩效结果竟然为负值,这无疑透露了地方政府在利用“土地财政”赚钱的过程中却放弃了应有的住房、土地的公共服务职能,我们设想如果连续两年该类绩效为负、0值时,就将未来3-5年内该市的该类型地方税种(房产税、土地税等)划归中央,将地方税种改为中央税,这样可以从源头上打击“当官不为民服务”的劣政,使得地方政府不敢轻视民生项目。这样,我国政府的人民满意度一定会得到提高。

本文作者:尚虎平陈星宇工作单位:兰州大学