结构方程公共管理论文

时间:2022-08-15 11:29:12

结构方程公共管理论文

一、结构方程模型概述

(一)结构方程模型的基本思想

结构方程模型也被称为协方差结构模型(CovarianceStructuralModelling),它有效地整合因子分析模型和路径分析模型为一体,开创出全新的量化研究范式。SEM突出了“潜变量(latentvariable)”的概念,在很多涉及到人的研究中,其探讨的变量多数不能被直接观测,比如态度、情感、智力、动机、家庭社会经济地位等。只能用外显的指标(manifestindicator)去间接测量这些潜变量。如图1(b)所示的因子分析模型,潜变量LV1和LV2依靠观测变量OV1至OV6测量,每个观测变量都存在自己的测量误差,因子分析模型可以将测量误差排除于潜变量之外,提高了统计的准确性。在SEM出现前,如果要探讨LV1与LV2之间是否存在回归关系,需先使用观测变量OV1至OV6合成计算出两个指标SV1和SV2,然后使用如图1(a)的路径分析模型计算SV1至SV2的回归系数。此处的SV1和SV2并不等同于LV1和LV2,因为前者在合成的过程中加入了测量误差。而使用SEM的方法,其模型如图1(c)所示,该模型在潜变量LV1和LV2之间建立回归路径。显然,SEM进行路径分析时排除了测量误差的影响,其回归分析的结果更为精准和可靠。

(二)结构方程模型的优势和特点

与原有统计方法相比,SEM整合了因子分析和路径分析的过程,提高了分析的准确性,其优势和特点被Bollen和Long总结为下述五点[6]:1.能同时处理多个自变量和因变量。在以前的统计模型中,可以允许存在多个自变量,但因变量只能有一个,即多元回归分析。SEM可以将多个自变量和多个因变量同时放在一个模型内,考虑的是多对多的复杂关系。2.允许自变量和因变量都含有测量误差。由于潜变量概念的引入,每个自变量或因变量可以由多个观测变量来测量。每个测量变量都有自己的测量误差,测量误差可以被剔除在路径分析之外。3.同时估计因子结构和因子关系。在原来的统计方法中,测量模型与结构模型相分离,需要先计算潜变量与指标间的因子载荷(factorloading),然后根据因子载荷计算获得潜变量的测量值,再分析这些潜变量之间的结构和关系。SEM将这两步同时进行,一次估计获得因子关系和因子间结构的全部参数。4.检验整个模型的拟合好坏程度。传统的回归模型中,一般使用标准化回归系数表示单条路径(两个变量间关系)的强弱,以不能被解释的残差判断回归模型的拟合好坏。在SEM中,则是对整个模型与样本数据间的拟合程度进行估计,从整体上判断哪个模型更为符合数据所呈现的复杂关系。5.允许更大弹性的测量模型。传统测量模型只允许每个题目(或观测变量)从属于一个因子,SEM中不再存在该限制,同一观测变量可以同时从属于多个因子。例如,某地区的服装类消费总额既体现了该地区的经济发展水平,也受到当地居民消费倾向的影响,该观测变量应同时从属于这两个因子。

(三)结构方程模型的主要应用对象

在公共管理领域的研究中,SEM一般用来解决两类问题:一是运用其进行验证性因子分析,检验问卷和量表的信效度;二是进行路径分析,以检验变量间(包括显变量之间和潜变量之间)的相互关系。社会科学的研究中,大量使用量表和问卷作为调查研究的工具。其中结构效度和维度的确定一般使用因子分析的方法完成,SEM的一大应用就是进行验证性因子分析(CFA),探讨量表或问卷的维度是否符合最初的设想。在我们检索到的16篇应用SEM的论文中,张立荣和李晓园运用CFA建构县级政府公共服务能力的结构模型[7],胡杨成和蔡宁则使用CFA验证非营利组织市场导向量表的因子结构[8],张崇辉和李梦楠也在探讨地区中心主义与其他变量的关系前,使用CFA对其修订的消费者地区中心主义量表进行效度分析。[9]验证性因子分析是检验测量工具效度的重要手段,却并非本文所关注的重点。公共管理的研究中,更多的需要SEM处理变量间的复杂路径关系。由于SEM具备上一节中所介绍的五大优势,特别是它可以同时处理多个自变量和因变量、且能够在多个变量之间设定连续的因果关系,非常有助于研究者分析变量间的作用机制。它在路径分析中的应用,将是本文下面重点讨论的内容。

二、典型的结构方程模型路径分析

一些使用SEM的典型路径分析模型将在本节中被讨论,这些模型值得在公共管理的量化研究中推广。

(一)多元回归分析模型

简单线性回归和多元回归是被广大研究者所熟悉的统计模型,主要用于解释因变量受一个或多个自变量的影响程度。SEM同样可以用于该目的,但与传统的回归分析不同,SEM中的自变量和因变量都可以是潜变量,这些潜变量由显变量观测而得;同时,模型中可以混合潜变量和显变量于一体。如图2所示(该模型来自于陈占锋发表于《国家行政学院学报》上的论文[10]),模型假设失地农民的生活满意度受到社会保障、工作等7个潜变量的影响,同时还受到土地补偿、性别等4个显变量的影响。整个模型中,生活满意度为多元回归分析的因变量,而7个潜变量和4个显变量一同构成了该多元回归分析的自变量。图中的e29为回归模型的残差,也就是生活满意度中不能被11个自变量解释的部分,通过它和生活满意度的方差可以计算出模型的解释率。

(二)带有中介变量的模型

在实际研究中,自变量还有可能通过中间变量对因变量产生作用。如图3(a)所示的中介模型(MediationMod-el)(图3和图4给出的模型均为示意图,没有详细表示潜变量的观测变量和残差项),自变量为X、因变量为Y,一部分X对Y的影响通过中介变量M发生作用。通过路径a和路径b形成一条X对Y的影响路径,系数a×b为中介模型的间接效应。同时,在图3(a)所示的模型中,还存在X对Y的直接影响路径,系数c的大小被称为中介模型的直接效应,这样的中介被称为部分中介模型。如果系数c为零(或者可以设为零),则表明X对Y的作用全部通过中介变量M起作用,此时的模型被称为完全中介模型。应用中介模型时,某些情况下特别验证了中介变量的效应大小。如于海波等人考察工作投入在公务员可就业性与工作绩效之间中介效应,表明工作投入在工作家庭平衡与工作绩效之间起完全中介作用,在职业专长、自我完善、个人灵活性、集体意识4个自变量与工作绩效之间起部分中介作用。[11]另一些情况下,虽然使用了中介模型,却并没有重点关注中介变量的作用,而仅仅把中介变量作为整个路经分析上的一个节点,也没有给出每个中介变量的效应大小。如黎洁等人在分析参与式森林资源管理的影响因素时,其所构建的模型中参与态度实际上是参与感知、地方认同和参与行为之间的中介变量,但研究者只讨论了其中每条路径是否显著,并没有对参与态度的中介作用做过多探讨。[12]除了图3(a)给出的简单中介模型外,自变量与因变量之间还可能同时存在多个中介变量,如图3(b)所示,X对Y的作用包含直接效应(X→Y),通过M1的间接效应(X→M1→Y)和通过M2的间接效应(X→M2→Y)。此外,中介变量之间也可能出现串联关系,如图3(c)的模型,M2为X与Y之间的第二重中介,X对Y的作用通过三条路径实现(X→Y,X→M1→Y,X→M1→M2→Y)。刘波等人[13]和董晓松[14]的研究中所构建的模型,均包含了多重中介效应。

(三)带有调节变量的模型

调节模型(ModerationModel)是另外一类典型的路径分析应用。从图4(a)看,其与中介模型的不同主要集中在两点:一是调节变量U不受自变量的影响,二是它的影响作用于X到Y的路径上。例如,面对电价上涨,男女做出节电行为的频率可能存在差异;此时,性别就是经济成本与节电行为之间的调节变量。图4(a)给出的是抽象概念,在SEM的实际操作中,U的影响无法被直接放置在一条路径上,其模型图可转换为图4(b)。如果变量X和U都是连续变量,其调节作用呈现为X与U的交互作用,即X×U的影响。调节变量和中介变量还可能同时出现在一个模型中,形成有调节的中介模型(图4(c))和有中介的调节模型(图4(d))。两种模型的主要区别在调节变量U作用的路径,有调节的中介模型中,调节变量U作用于中介变量到因变量的路径上(M→Y);而在有中介的调节模型中,U作用于从自变量出发的路径上(X→M和X→Y)。温忠麟等人曾经这两种模型做出过详细介绍。[15]我们检索到的16篇论文中,尚没有涉及到调节效应的研究。

三、建立模型前应明确的关键问题

在应用SEM之前和过程中,必须明确下面几个问题。一是必须对所研究的问题有明确的模型假设,然后利用SEM进行假设检验;二是对引入模型的变量和指标类型有清晰的认识,三是要保证充足的样本量和样本代表性。

(一)基于理论的模型假设

SEM是一种验证性的统计工具,不能寄希望于它具有探索变量间关系的能力。如果研究者希望收集好数据后,通过SEM自动运行出某个恰当的模型来,它是无法达成的。SEM只负责评估给出的模型假设与数据之间的拟合程度,以便让研究者对假设模型的合理性做出判断。其次,包括SEM在内的统计方法,无法决定两个变量之中哪个是因变量,哪个是自变量。从统计的角度看,当两个变量间具有较高程度的相关时,将其中任一变量作为自变量,另一变量作为因变量,都可以获得回归分析的结果。然而,究竟哪个变量是自变量,这完全取决于研究的理论基础。例如,公务员对部门的归属感与其工作的成就感之间存在着较高程度的相关,但是归属感影响了成就感,还是成就感影响归属感,需要研究者通过理论分析来证明,统计方法只能给出回归作用的强弱。此外,SEM也不能自动发现模型中的中介变量和调节变量,哪些变量可能发挥中介或调节作用,同样来自于研究者的理论分析。建立SEM的过程,实际上是一个模型比较和修正的过程。在该过程中,往往需要对最初的假设模型进行修正,经过反复比较后,最终获得符合理论构想、且能够得到数据有力支撑的模型。一般而言,模型越复杂、变量间的关系越多,则模型的拟合会越好;当把模型中所有变量都设为相关后,模型的拟合达到最优,此时的模型被称为饱和模型(saturatedmodel)。但饱和模型对研究本身并无价值,因为我们的研究总是希望用尽可能简洁的模型解释较多的变量关系。所以,在模型比较和修正的过程中,不应以追求模型指标的好坏为唯一目标,能否得到理论的支持才是更为重要的标准。

(二)潜变量和观测变量的类型

本文图1和图2中所示的潜变量,均使用多个观测变量来测量,而且观测变量决定于潜变量,此类测量模型所获的潜变量被称为反映式指标(reflectiveindex)。这样的测量模型源于心理学的研究,例如个体对于测验题目的表现(观测变量)决定于其智力水平(潜变量),被广泛用于态度、情感、能力的测量。然而,也有一些指标并不适合于该测量模型,比如管理学、社会学研究中常用的家庭社会经济地位(SES)指标。该指标一般由收入水平、教育水平、职业声望三个变量测量,但这三个变量的数值并非由家庭社会经济地位决定,而是构成了家庭社会经济地位指标,应该使用如图5(b)所示的测量模型,该类指标也被称为构成式指标(formativeindex)。图5中,左侧的反映式指标模型与右侧的构成式指标模型主要存在三点区别[16]:(1)潜变量与观测变量间的关系不同,反映式指标决定观测变量,而构成式指标由观测变量所决定,因此图中作用路径的箭头方向不同;(2)反映式指标中,各观测变量(图中为3道测量题目)之间必须具有内部一致性(即相互间正相关),但在构成式指标对各观测变量间的关系没有限定;(3)反映式指标模型的测量误差存在于各观测变量上(e1至e3),构成式指标模型的测量误差则表现为潜变量的残差(e4)。公共管理研究中,既存在反映式指标,也存在构成式测量指标。选择何种测量模型主要与潜变量的具体内容有关,需要研究者根据模型和问卷仔细分析后确定,而该决定将影响到SEM的统计结果。MacKenzie等人的仿真实验表明,如果错误的使用了测量模型,有可能导致路径系数最多被高估400%、或者被低估80%。[17]另外,测量数据的类型在分析前也应该被考虑,SEM假设其统计数据为多元分布的连续数据,但实际应用中,通过李克特问卷测量的数据往往只能达到顺序数据的水平,而诸如性别等变量只有分类数据的水平。如果不对顺序数据和分类变量进行小心处理,而直接放入到SEM进行分析,很有可能影响到结果的准确性。

(三)样本的充足与代表性

“多大的样本量对于SEM分析是足够的”,这是很多研究者所关心的问题。常见的解答为,样本量应该是观测变量个数的5倍以上,其实际含义是要求模型中每一个待估计的参数对应于数倍的被试(subject)或个案(case)。事实上,要求样本量与观测变量呈一定比例的观点并没有充分的依据,因为这个问题会受到很多其他因素的影响,但所有的统计学家都认为,样本量越大,SEM的参数估计结果越准确。在我们检索到的16篇论文中,最大的样本量为2500,最小的样本量为133,平均样本量达到了573。样本量与参数之比,最小的为4.8,最大为416.7,平均达到45.1。与西方国家量化研究的样本量较小不同,我国量化研究的样本量一般都较为充足。另外,如果数据类型为顺序数据,所需的样本量应该比连续数据更大。因为样本量偏小时,SEM的参数估计过程容易不收敛或者出现估计结果不恰当的现象。[18]还要说明的是,随着统计技术的不断发展,一些新的参数估计方法和模型拟合指标对样本量的要求变得越来越少,如DWLS估计法在小样本条件下就能取得更好的结果。而一些Robust的模型拟合指标也适用于小样本和数据偏态分布的情况。最后,不考虑抽样方法的合理性,而单纯考虑样本量的大小是没有意义的。进行任何实证研究,都首先要求数据有充分的代表性,才有可能得出科学的结论。如果抽样方法不合理,可能会导致样本本身的偏差和偏态分布,此类错误对SEM的影响更大。

四、结构方程模型结果的报告

一般而言,使用SEM的过程及结果应该从模型与变量、样本与数据、统计软件与过程、参数估计结果、模型拟合指标五个方面给予详细报告。下面结合16篇使用SEM论文的结果报告情况,具体说明五个方面应报告的内容。

(一)模型与变量

正如前文所指出的,研究者在运用SEM前对于变量间关系必然存在着假设,且在多数时候,由于存在着不同的理论,或对变量间关系不能完全确定,假设模型往往是一组而非单一模型。研究的任务就是要通过对一组模型的比较,确定最能获得数据支持的一个。在我们分析的16篇论文中,有6篇文献只检验和报告了一个模型,并不明确其是否对模型进行过修正,也不知道是否与其他模型进行过比较。在说明假设和最终模型的同时,还要说明模型中所涉及的变量。需描述清楚每个变量的测量方法,是潜变量还是显变量,每个潜变量的测量模型是否包含于SEM中,潜变量是反映式指标或是构成式指标。如果可能的话,还应该报告潜变量的信度和效度。参见表1,在我们检索到的论文中,多数文献(11篇)引入了潜变量的测量模型进行分析,且全部为反映式指标。

(二)样本与数据

任何量化研究都应该报告抽样人群、抽样方法与过程、样本量的大小,这些因素决定了量化研究的科学性和可推广性。对样本的报告首先应该描述研究对象,还应报告总人数的大小和相关背景变量。抽样如果无法采用完全随机抽样时,要对抽样的方法和理由给予说明。此外,问卷回收率和有效率也是必须报告的内容。在很多研究中,收集数据的分布特征都被忽略或忽视了,但其对SEM结果却有很大影响。数据特征中首先应说明的是变量的类型,对于顺序型的变量,其中分类的数量也是重要的数据特征,如有的问卷使用5点李克特式题目,而有的则为4点或7点。然后,每个变量的均值、标准差、峰度和偏度应该被报告,并指出那些存在明显偏态分布的变量。但16篇论文对样本情况的实际报告并不乐观,有6篇论文没有报告问卷的回收率和有效率,有6篇文献没有对样本的人口统计学特征进行分析,降低了统计结果的可靠性。对于数据的类型,有6篇文献没有报告;报告数据类型的10篇文献中均使用李克特式的问题设置,但问题的分类数并不相同,除常见的5点李克特式问卷,还有4点、6点、7点、9点等不同形式。

(三)统计软件与统计过程

根据SEM的统计基础,它即可以与样本协方差矩阵拟合,也可以用样本相关系数矩阵来分析。不管拟合哪种矩阵,报告结果时都应该说明拟合矩阵的类型,并列出完整的样本协方差矩阵或样本相关系数矩阵,以便其他学者验证或改进研究结果。但在检索到的16篇文献中,只有4篇报告了完整的相关系数矩阵,1篇报告了协方差矩阵,剩下的11篇论文都没有给出具体的拟合矩阵数据,使后人无法验证其模型和统计结果。目前已有多个支持SEM的成熟软件,但这些软件的参数估计方法、估计结果、模型拟合指标并不一致,应在论文中报告具体完成统计的软件名称。除1篇未报告使用软件外,多数研究者(12篇)选用了SPSS公司的Amos软件(版本从4.0到19.0不一),也有3篇使用Lisrel软件完成。接下来,参数估计方法和估计过程是不可或缺的内容。不同的参数估计方法适用于不同类型的数据,所获估计值和模型拟合指标也不同。SEM软件一般都存在预设的最大迭代次数,达到该迭代次数后,无论参数估计值是否收敛,软件都会自动停止估计过程。研究者必须查看估计过程是否顺利完成,估计值是否达到收敛,并报告这一点。遗憾的是,在16篇被分析的论文中,大多数没有报告参数估计方法,仅有3篇报告自己使用了极大似然估计法。而对于估计过程是否达到正确收敛,被全部研究者所忽略。

(四)参数估计结果

多数时候,我们很难也没有必要将SEM软件提供的所有参数估计结果都列在文章中。研究者应重点突出那些研究兴趣点所在的结果,进行问卷的信效度分析时,因子载荷和因子的解释率必须被报告;而进行中介效应检验时,中介路径和直接路径的系数、直接效应和间接效应大小必须被报告。参数的估计值存在标准化和非标准化两类,一般都要求报告标准化的估计值,16篇论文也均报告了标准化参数。标准化的参数估计值应该处于-1至1之间,如果估计值不在该范围内,则表明该参数估计值不合理。造成不合理结果的原因有很多,参数估计方法、抽样的代表性不足、模型的结构不正确都可能是影响因素。还要强调的是,仅报告参数估计值是没有意义的,因为估计值可能会随着样本的不同而变化。为了证明估计值的可推广性,需要给出其显著性检验的结果,或是报告其标准误或显著性。但在分析的16篇文献中,有3篇没有报告路径参数的显著性。如果条件允许,可以报告模型中的残差,它表现了每条路径的拟合程度,以及自变量对因变量的解释程度,16篇论文中的7篇给出了回归分析的解释率。

(五)模型拟合指标

确定最终模型后,以及在进行模型比较和选择的过程中,都需要参考和报告模型的拟合指标,它们是反映模型得到数据支持程度的体现。报告拟合指标时不能只报告一种,而应该综合考虑绝对拟合指标和相对拟合指标①,特别是要报告χ2和RMSEA等常用指标。而且,不仅要报告拟合指标的数值,还应列出指标的判别标准;并对各拟合指标是否达到标准进行说明。在16篇论文的实际写作中,对拟合指标的报告存在较大差异。其中最少的只报告了3个指标,最多的报告了11个指标;有2篇文献未报告χ2,3篇文献未报告RM-SEA,2篇文献未报告任何相对拟合指标,这些文献的报告显然不太合理。另外,有5篇文献未给出拟合指标的判别标准,不利于直接判断其模型拟合的好坏。

作者:吴瑞林杨琳静单位:北京航空航天大学公共管理学院讲师北京航空航天大学公共管理学院硕士研究生