环境污染的因子探索

时间:2022-05-13 03:48:03

环境污染的因子探索

因子分析的数学模型考虑p个成分的随机观测向量X。其均值为u,协方差为∑。因子模型要求线性相关,其中有m个公共因子F1……Fm和p个特殊因子ε1,ε2…εp组成。用矩阵表示:X=AF+ε且满足:(1)m≤p;(2)即F与ε是不相关的;(3)D(F)=Im即F1……Fm不相关且方差皆为1,Im表示m阶单位矩阵。ε1……εm不相关且方差不同。其中X是可观测的p个指标所构成的p维随机向量,F=(F1……Fm)''''是不可观测的向量,F称为X的公共因子;aij成为因子载荷,是第i个因子在第j个公共因子上的负荷,它反映了第i个因子在第j个公共因子上的相对重要性,ε是特殊因子,它包含了随机误差。

模型的统计意义模型中公共因子F1……Fm是在各个原观测变量的表达式中都共同出现的因子,F=(F1……Fm)''''是对所有的Xi(i=1,2,…,p)都起作用的因子,故称为X的公因子,且公因子是相互独立的不可观测的理论变量,它们的含义必须结合具体问题的实际意义而定。εi叫做特殊因子,是向量X的分量Xi(i=1,2,…,p)所特有的因子,即εi只对Xi起作用,并且各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。模型中载荷矩阵A中的元素(aij)pm为因子载荷,因子载荷aij是Xi与Fi的协方差也是Xi与Fj的相关系数,它表示Xi依赖Fj的程度,反映了第i个变量在第j个公共因子上的相对重要性。aij的绝对值越大,表明Xi与Fj的互相依赖的程度越大或称公共因子Fj对于Xi的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,它们是变量共同度和公共因子的方差贡献。因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量Xi的共同度。它是全部公共因子对Xi的方差所做出的贡献,反映了全部公共因子对变量Xi的影响。hi2大表明X的第i个分量Xi对于F的每一分量F1……Fm的共同依赖程度大。将因子载荷矩阵A的第j列(j=1,2,…,m)的各元素的平方和记为gj2,我们称其为公共因子Fj对X的方差贡献。gj2就表示第j个公共因子Fj对于X的每一分量Xi(i=1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。gj2越大,表明公共因子Fj对X的贡献越大,或者说对X的影响和作用就越大。如果将因子载荷矩阵A的所有gj2(j=1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。

因子分析的一般步骤1.原始数据的标准化。标准化的目的在于消除不同变量的量纲影响,而且标准化不会改变变量的相关系数。2.计算标准化数据的相关系数矩阵,并求出相关系数矩阵的特征值和特征向量。3.进行正交变换,通过使用方差最大法。其目的是使因子载荷两极分化,而且旋转后的因子仍然正交。4.确定因子个数,计算因子得分,进行统计分析。

环境污染的因子分析

(一)原始数据的选取原始数据(2010年统计年鉴)为我国各省、直辖市工业和生活污染物排放量。其中:x1为生活污水排放量(万吨),x2为生活污水中化学需氧量排放量(万吨),x3为生活二氧化硫排放量(万吨),x4为生活烟尘排放量(万吨),x5为工业固体废物排放量(吨),x6为工业废气排放量(亿平方立米),x7为工业废水排放量(万吨)。

(二)因子分析的输出结果将上述原始数据标准化处理后,经SPSS18.0统计软件分析可以得到变量相关系数矩阵。结果表明7个变量之间的相关性很高,适合用因子分析来研究变量之间的内部依赖关系。因子分析的关键就是利用相关系数矩阵求出相应的因子特征值和累计贡献率,用SPSS18.0统计软件可得到总方差解释表。结果表明取其中3个因子已提供了原资料85.333%的信息,满足因子选取原则:m个因子的累计贡献率大于或等于85%。同时还表明旋转前后的总累计贡献率没有发生变化,即总的信息量无损失。因子分析的主要目的是将具有相近的因子载荷的各变量置于一个公因子之下,当初始因子不能典型的代表变量的含义时,对因子载荷矩阵采用旋转方法,并施以25次正交旋转,使因子载荷值向两极端发展,以便对因子的意义作出更合理的解释。成分矩阵和旋转成分矩阵表明:旋转前后因子载荷的变量结果基本一致,第一类公因子在变量x1,x2,x6,x7上的因子载荷比较大,命名为水污染因子f1,第二类公因子在x3,x4上的因子载荷比较大,命名为气体污染因子f2,第三类公因子在x5上的因子载荷比较大,命名为固体污染因子f3。为更好地进行分析评价,可运用spss得出各因子在主因子上的得分系数矩阵。计算三个公因子得分函数为:水污染因子f1=0.314x1+0.301x2-0.016x3-0.045x4+0.039x5+0.222x6+0.328x7气体污染因子f2=-0.056x1+0.003x2+0.451x3+0.475x4-0.019x5+0.222x6-0.077x7固体污染因子f3=0.021x1-0.086x2+0.025x3-0.061x4+0.987x5+0.048x60.093x7以各因子贡献率占三个公因子的比例为权重,构造综合因子得分为:f=(41.395f1+29.427f2+14.511f3)/85.333通过公因子得分表达式,可以算出公因子得分。发现河北、江苏、山东、广东几个省在f1上的得分较大,所以可知这几个省的水污染严重,应注意加强对工业和生活污水的治理,使之达到国家污水排放标准。同时可以看出,河北、山西、内蒙古、辽宁、山东几个省的气体污染严重,这是因为这几个省有的省份属于国家老工业基地,工业污染的企业多,有的企业对环境污染的处理不重视,有的省份乡镇企业发展迅速,由于乡镇企业对环境保护意识不强,所以污染严重。重庆的固体污染最为严重说明该省在生产建设、日常生活和其他活动中产生污染环境的固态、半固态废弃物质较多。从得分f可以看出河北、山东、广东、重庆几个省的综合污染严重。说明这几个省的环境污染严重,应采取措施治理环境污染,促进经济社会和环境的和谐发展,可持续发展。

结束语

从以上可验证因子分析在我国环境污染分析中应用的可行性,可减少甚至避免选取综合评价指标和权重的主观性,不合理性。因子分析模型作为一种分析多元数据的强有力工具,能将复杂的数据结果化简,信息交叉冗余减少,挖掘出直观有用的数据,在社会经济状况普查,环境污染监测,空间数据处理等方面有着广泛的应用。伴随着未来信息源的飞速增多,能否从纷繁复杂的信息中快速提取有价值的信息,这将是因子分析模型与相关学科专业结合的最具生命力的生长点,也将促使更多的专业人士拓展它的应用范围。

作者:田国华单位:大同大学商学院