空间化统计指数研究进度

时间:2022-09-09 05:31:15

空间化统计指数研究进度

一、前言

自1998年1月31日,美国副总统戈尔在《数字地球—认识21世纪我们这颗星球》的报告中首次提出了数字地球的概念,掀起了建设“数字地球”的空间信息革命。所谓数字地球可以理解为对真实地球及其相关现象统一的数字化重现和认识。其核心思想是用数字化的手段来处理整个地球的自然和社会活动的诸方面的问题,最大限度地利用资源。由此,“数字地球”、“数字城市”已成为新的研究领域,地球与城市的数字化都离不开社会统计数据的空间化,只有将社会统计数据与空间单元的有效结合,即实现社会统计数据的空间化,才能最终实现“数字城市”和“数字地球”。因此,社会统计数据的空间化是数字地球的重要内容之一,也成为当前地理科学和社会科学共同研究的热点问题。社会统计数据也称统计资料,是统计部门或单位以行政区划为单元进行统计工作所搜集、整理、编制的各种反映该行政区内的社会、经济等特征属性的统计数据资料的总称。社会统计数据是反映一个国家社会与发展状况的重要指标之一,更是中央政府、国家行业主管部门科学有效地制定法规政策,进行决策和宏观调控管理的重要依据。数据统计还是政府进行宏观经济管理的必要手段和重要职能[1]。

长期以来,由于经济地理学与自然地理学分别采取不同的空间单元进行社会统计数据(人口,GDP等社会经济数据)的收集、存储和分析:前者主要是基于行政单元,如省界、县界、乡界等,而后者主要是基于自然单元,如流域、土壤类型单元、植被类型单元等,这直接导致社会统计数据处理方法在理论和实际应用过程中的数据空间单元不一致,因而也产生一系列的问题[2]54。而研究和使用社会统计数据,不仅要关注其数量,更要分析其空间分布。GIS和RS越来越多的应用于统计数据空间分布的研究,随着3S技术的发展和成熟,产生一个难题:传统方法提供的社会统计数据定位不准确,单元不统一,空间分辨率低,造成社会统计数据与自然生态数据叠置分析困难。“社会数据空间化”和“空间数据社会化”也已成为当前地理学、社会科学共同关注的焦点[3]。而将统计数据与自然数据转化到统一平台,即统计数据空间化就是最好的解决办法。将行政区域单元为单元的统计数据扩展到一定尺寸的地理格网上,为可持续发展的研究和决策提供服务[2]55。作者就社会统计数据空间化的关键问题进行了系统的分析和综述。

二、社会统计数据分布与社会统计数据空间化

社会统计数据,尤其是人口数据的空间分布问题本属于社会学范畴,其发展也有较长的历史,随着人口地理学和GIS、RS等地理信息科学的发展,社会统计数据的空间化问题得到了众多地理学者的广泛关注和进一步的发展。

1.社会统计数据空间分布的分析

目前国内主要研究空间化的社会统计数据包括人口统计数据(人口密度)、社会经济统计数据(人均GDP)等。此类研究早期一般由研究者们在社会学、地理学、经济学、生态学等相关学科的基础上进行调研和分析,总结出此类社会统计数据的基本情况和变化规律,进而对其空间分布进行定性的综合描述,来指导我们的生产实践,比如,早在1933年,我国人口地理学家胡焕庸先生提出了著名的“爱珲—腾冲线”,对我国的人口分布格局进行宏观的描述。可以看出,早期的社会统计数据空间化主要是集中于人口数据的空间化,主要研究人口数据空间分布的规律、基本理论和影响因子等几方面,且主要是以传统的统计空间—行政区划为基础,一般采用定性描述的手段,未能充分揭示人口空间分布的内在机理。

2.社会统计数据空间化

随着研究的逐步深入和地理信息技术的飞速发展,社会统计数据空间化已迅速成为GIS和社会交叉学科领域的焦点问题。近些年,很多学者利用卫星遥感数据结合GIS技术反演出大尺度、高分辨率的地面参数,RS和GIS技术也越来越多的应用于社会统计数据的空间化研究中。本文根据研究内容、方法和研究深度的不同,将社会统计数据空间化研究归纳为以下几方面:

(1)社会统计数据与地理因子相关性的定量研究影响社会统计数据空间分布的因素很多,如自然环境状况、社会经济生活、历史传统、文化沉淀等等。诸多研究者从不同角度对各种地理因子与社会统计数据空间分布的相关性进行研究,并取得了很好的研究成果。例如廖顺宝[5]等人以土地利用、海拔高度、主要道路和河流作为影响青藏高原人口分布的主要环境因子,并以居民点信息作为人口分布的指示因子,进行了人口统计数据的空间化,说明在青藏高原,居民点对人口分布有重要影响,而高程和主要河流以及土地利用、主要公路与人口的分布也密切相关;王春菊[6]72等人分析了福建省各市县平均人口密度与海拔高度、河网密度、土地利用以及与海岸线的距离和居民点密度之间的相关性,以居民点作为人口分布的重要指示因子,对福建省人口统计数据进行了空间化。此类研究对于社会统计数据空间化过程中的影响因子分析以及参数设置有很大的借鉴意义,但是只能基于几种特定的因子进行分析,研究的区域性明显,而不具备普遍性,同时研究绝大多数集中于人口空间化的研究,并且对行政区划的依赖性较强,难以真正实现地理空间上的空间化。

(2)集成遥感获取的土地利用、土地覆被信息和其他信息估计社会数据主要是以高时空分辨率的遥感影响为基础,通过提取土地利用等空间信息,建立社会数据与对应的土地利用类型所占面积之间的关系,从而实现社会数据的空间化。这种方法成功地应用了高精度遥感影像的优点。由于遥感影像具有较高的时间分辨率,并能做到及时更新,因此对社会数据的空间化的贡献极大。国内近几年出现的许多人口估计模型都是基于遥感获取土地利用信息和其他信息建立回归方程进行的。例如廖顺宝[7]等人通过对于四川省的151个市县的人口密度与各种土地利用指数进行多元回归分析,发现人口密度与土地利用之间具有非常密切的关系,其中与耕地、居民点—工矿用地之间的关系最为密切。同时基于人口密度与土地利用之间的定量关系对四川省市县统计人口数据进行了空间化探讨和实验,取得了较好的研究结果;易玲[2]57等利用遥感影像信息获取了土地利用/覆盖数据建立与统计型GDP数据的多元相关关系模型,计算了各种土地利用类型中的GDP系数,尝试以土地利用空间格局为GDP空间分布的主要影响因素,提出了统计型GDP数据空间化处理的研究思路和实现途径,并生成了西部12省区1km2格网的GDP空间分布数据;刘红辉[8]等利用土地利用空间格局为社会经济要素空间化展布的主要因素,以遥感数据和统计数据最主要信息源,将统计型社会经济数据展布到地理空间,对现有以行政区划为单位的统计型社会经济数据库(GDP)进行了空间化处理,并实现了1km格网水平上的GDP空间数据集。经济—人口—土地是当今世界普遍关注的焦点问题,而基于土地进行人口、GDP等社会统计数据的空间化是土地和社会经济数据复合研究的最佳方式,同时也具有重要和简明的地学意义。但在现有技术条件下,仍然存在很多问题,例如利用遥感影像提取土地利用/覆被信息时,不可避免地存在信息的丢失和损坏,由于影像数据自身分辨率限制,使得土地利用数据结果存在一定的误差,尤其是某些影像无法识别的特定地区,误差则更大。同时,不同尺度不同类型的土地利用数据,信息的丢失情况也不尽相同,因此,获得高精度估计结果的前提是用于高精度、可靠性和时空一致性好的数据和相关信息,而建立这样的数据集也是目前急需进行的工作,同时,空间化的结果验证有待于进一步提高,建议在实际使用土地利用/覆被数据进行社会统计数据空间化的过程中,对信息的丢失和误差情况作出相应的精度检验分析和研究,而此类研究目前大多属于定性描述,鲜见有定量分析。

(3)社会统计数据空间化的技术方法分析社会统计数据空间化研究的目的是模拟社会统计数据在地里空间上的真实分布情况,为环境规划,资源的永续利用和行政管理提供决策支持。其方法有很多种,目前国内应用较多的方法可以总结为面插值方法和统计模型方法[9],而主要思想则是基于多元数据融合的思想[6]71[7,10]。金君[11]等人针对常用的表示人口分布方法的不足,提出了将人口数据分布到规则网格上的数字人口模型(DigitalPopulationModel,简称DPM),并详细阐述了DPM建立的原理及实现的技术方法,以及目标区域格网划分的原则和方法,通过对具体样区的实验,得到较为理想的结果,有较高的准确性;闫庆武[12]等人基于面积权重内插法与领域平均法原理,提出人口密度空间化的一种方法———网格单元面积权重内插法,并以江苏省丰县委研究区域进行例证,结果表明该方法有效的缓和了传统方法直接生成的人口密度图中的突变线,制作的人口密度GRID专题地图能够很好的反应人口密度的平均性,生成的人口密度三维可视化地图符合人口密度的空间分布特点;吕安民[13]等从GIS的角度研究如何解决人口内插的问题,认为面积内插和GIS中的叠加分析是一致的,在传统的面积内插方法的基础上提出了基于人口真实分布的面积内插方法,并推导出了共识,同时提出了人口密度的递归算法,即把居住区分为人口稀疏地区和人口稠密地区,估计出人口稀疏地区的人口密度就可以求出人口密集地区的人口密度,再把人口密集区分为新的人口稀疏区和密集区,由此反复直至求出接近于人口真实分布的人口模型。在GIS、RS、GPS等技术和多元数据的有效支持下,多级区划、分区建模、空间分析、多元数据融合等研究方法和手段越来越多的应用于多级社会统计数据的空间化模拟研究,但是方法和技术发展的同时也存在很多的问题,社会统计数据空间化的研究是要打破行政区划单元,使得社会统计数据最大限度的接近真实自然分布的情况,而格网单元具有其规则面积,并且在不同尺度的研究格网的面积也应该有不同的设计标准,同时,格网大小是否符合整个研究区的实际情况,更需要进一步的探讨;另外社会统计数据的分布也有其规律可循,是否能够将其规律与新的技术手段进行结合,开发出更好的模型,也是我们需要探讨的问题;在社会统计数据影响权重的估算过程中,存在数据和方法的限制,使得研究的客观性问题始终存在,同时,社会统计数据分布的很多影响因素之间又存在着密切的相关和影响,在多因素融合计算综合权值的过程中,如何消除信息的冗余也有待于进一步深入研究。

三、研究展望

基于GIS、RS和GPS等技术进行社会统计数据空间化的研究已经取得了很多成就,但是应用于实际的社会统计数据空间化还需要从以下几个方面开展更为深入的研究:

(1)提高小尺度社会统计数据空间化的精度相关研究大多认为,小范围的社会统计数据空间化的研究不如大尺度的研究精确[9],其原因是复杂的,但主要是因为大尺度的空间化中的估计过高和过低的数值存在相抵,使得总体精度较高,而小尺度的格网确定较为困难,同时由于尺度小,影响因素也较为细化,这就给提高空间化的精度带来困难,因此建议今后应该在提高小尺度的社会统计数据空间化精度上开展深入的研究。

(2)充分利用更新更精的遥感数据源当前,随着高分辨率遥感影像例如QUICKBIRD、IKONOS等的快速发展,人类应用此类空间信息的对地观测的能力有了很大的提高,这也为社会统计数据空间化的研究提供了广阔的前景,因此,今后应加强更新更精的遥感数据源在社会统计数据空间化方面的应用研究。

(3)加强对遥感影像提取精度的分析和验证虽然遥感数据在社会统计数据中的作用和影响日益显著,但遥感信息的发展仍处于新兴阶段,不容忽视的是由于对遥感影像的解译和判读的误差,通过遥感影像提取相关信息时,难以避免的存在信息的丢失和损坏。因此,在相关研究过程中对遥感影像的提取和分析过程中的精度分析至关重要,这直接关系到研究结果的可靠性。加强这方面的工作也是将来研究中亟待解决的问题。

(4)加强规则格网内社会统计数据空间化的精度验证目前的研究存在社会统计资料不足,无法对设计的规则格网内的统计数据精度进行合理的验证。对于空间化后的社会统计数据,如何寻找与其对应的验证数据集和模型,也是目前存在的问题,今后的工作应加强格网内空间化的社会统计数据的实地调查和采集工作,使其与遥感、GIS等技术充分结合,为空间化后的规则格网社会统计数据提供充分的验证数据集。

(5)注重对空间化结果的验证社会统计数据的空间化是一种间接获得统计数据空间化分布结果的过程,因此由于方法和技术手段的不同,空间化的结果也不尽相同,而该结果与实际情况是否相符,以及相符的程度都是衡量空间化精度的重要指标,建议结合几个采样点的实地调查结果进行分析和校正,提高结果的准确性,同时为改进空间化方法提供依据。

(6)完善社会统计数据综合数据库和构建综合的理论体系目前国内的相关研究已经形成初步的研究成果,中科院知识创新工程重大项目《西部生态环境演变规律与水土资源可持续利用》的成果之一就是建立了我国西部1km格网GDP数据库,为自然、人文科学的研究和政府决策提供了科学数据[2]。但建立和完善社会统计数据综合数据库的工作还在进行当中,而相关的理论、方法、技术手段等还需要进一步的综合,以构建相关的理论体系,为下一步的研究工作提供更好的指导。