引言

我国是世界上地震活动最强烈和地震灾害最严重的国家之一。20世纪全球大陆35%的7级以上地震发生在我国,全球因地震死亡120余万人,我国占59万(高庆华等,2011)。

人口是重要的受灾体,准确的人口空间分布信息是衡量地震灾情,开展抗震救灾工作的重要依据。如何根据地震活动频发地区的社会经济状况,特别是人口分布状况开展灾前御灾、灾中救灾、灾后评灾等工作,越来越受到专家学者的广泛关注和政府部门的高度重视。在震害预测或震害损失评估中,受灾人口、伤亡人口主要以人口普查数据为数据源,根据不同地震烈度圈范围占人口统计单元的面积比例来确定。由于居民点分布的非均衡性,使得这种方法的可靠性差,精度较低。而人口数据空间化可以有效地解决这一问题,即通过人口统计数据,采用定性描述或定量分析的模型方法,反演出人口在一定时间和一定地理空间中的分布状态,实现在不同尺度上的空间单元转换和人口估计(叶宇等,2006)。人口数据空间化可为传统人口统计数据进行空间尺度上的延伸,提高人口数据的空间分辨率和数据集成能力。

人口数据空间化自上世纪末以来,随着全球人口变化研究的深入而逐渐成为学术界研究的热点问题。随着空间分析、统计分析等技术的引入,人口数据空间化问题得到了广泛而深入的研究,发展出一系列具有代表性的模型和方法,其主要有:城市人口密度模型、空间插值法、遥感反演模型、多源数据融合模型以及基于土地利用的人口密度模型等。城市人口密度理论模型(Clark,1951;吴文珏,2010;陈彦光等,1999)以航片或遥感影像为数据源,将人口分布进行抽象和简化,用数学函数对模型进行完整描述,探讨城市内部人口空间分布规律,适合于城市人口宏观分布特征研究。空间插值法着眼于解决人口普查数据的空间区域转换问题,通过面积权重插值(范一大等,2004)、pycnophylatic插值(Tolber,1979)、距离衰减插值算法(Martin,1989)、核估计法(吕安民等,2003)等空间插值法,把人口普查数据从人口普查区转换到规则空间单元中,从而得到精细网格人口表面。遥感反演模型(Harvey,2002;Lo,2002;卓莉等,2005)通过建立人口密度与遥感影像元的波谱反射特征之间的联系,应用于人口密度估计。国内外学者分别利用Landsat TM、Landsat ETM+、SPOT以及DMSP-OLS夜间红外影像等遥感数据源进行相关的研究工作。多源数据融合模型(廖顺宝等,2003;刘纪远等,2003)通过定量分析影响人口分布的各种自然和社会经济要素(如:水系、地形、植被、城镇规模、道路等)与人口分布的相关性,运用较为客观的方式赋予各影响因子不同权值,以获得人口密度表面。基于土地利用的人口密度模型(江东等,2002;廖顺宝等,2004;田永中等,2004)通过建立土地利用指数与人口密度的统计模型,将统计人口总量分配到不同的土地利用类型中,是目前应用最为广泛的人口数据空间化方法。

著名人口学家胡焕庸先生早年曾指出,乡镇统计数据与居民地数据是绘制高精度人口密度图的两个必要条件(杨小唤等,2006)。近年来,随着遥感数据空间分辨率的提高,高精度居民地信息提取技术日趋成熟,基于居民地的人口数据空间化研究也开始受到学者们的关注(杨小唤等,2006;王汶等,2009;杜国明等,2007;闫庆武等,2011)。相比前述方法,基于居民地的人口数据空间化方法采用土地利用中最直接反映人口分布的因子——居民地进行建模,使得模型具有较强的说服力,同时建模所需数据源少也减少了运算的复杂度和人为干预,是获取高精度人口分布信息的有效方法。在实际应用中,地震部门在预测或评估一次地震造成的人口、经济损失时,往往需要按居民区、居民点等社会经济单元来分析,基于居民地的人口数据空间化不仅可以获取精度较高的人口分布信息,还能建立人口与居民区、居民点等社会经济单元的直接联系,是面向防震减灾应用较为可行的人口数据空间化方案。

1 理论基础
1.1 城市人口—面积的异速生长模型及其分形几何意义

城市人口密度模型的研究最早可追溯到20世纪50年代,之后对世界不同国家的城市人口密度分布有大量实证研究。我国城市人口密度模型的研究起步较晚,目前处于对经典城市人口密度模型的实证研究阶段(吴文珏,2010)。

在区域城市化过程中,城市人口和建设用地面积之间通常具有异速生长关系和分形几何结构,其满足如下幂指数模型(陈彦光等,1999):

Aa1×Pb1
(1)

式中,P为城市人口数量;A为城区面积;a1为常数;b1为指数。

幂指数方程变量间的异速生长关系可以从方程的分形几何结构角度来解释。将式(1)两边取对数:

lnA=lna1b1lnP
(2)

在城市人口数量P和城市面积A构成的双对数坐标图上,点(lnP,lnA)呈直线关系,直线斜率为b1。在已知城市面积A为二维的情况下,可以通过b1的大小来考察城市人口数量P的维度。对城市人口—面积的异速生长关系的分形几何意义的解释为:

b1<1时,表示人口数量的维度高于面积的维度,人口数量具有比城市面积更快的增长速度,随着城市面积的扩张,人口密度相应提高;
b1=1时,表示人口数量的维度等于面积的维度,人口数量与城市面积同速增长,随着城市扩张,人口密度不变;
b1>1时,表示人口数量的维度低于面积的维度,人口数量的增长速度慢于城市的扩张速度,在扩张过程中,城市人口密度不断降低。

大量实证案例研究证明(陈彦光等,1999),除个别城市b1>1之外,对于大多数城市b1<1,即人口数量的维度大于城市面积的维度。城市人口—面积异速生长模型分形几何特征的发现,不仅合理解释了该模型的几何意义和地理意义,也为模型从城市向农村的推广提供了思路。

1.2 城市人口—面积的异速生长模型的推广形式——城乡人口—面积统一模型

根据式(1),求其反函数,可以表达为:

(3)
P e -lna1
b1
e lnA1
b1


ae -lna1
b1
b=1/b1,则上式可进一步表示为:

Pa×Ab
(4)

式中,P为城市人口数量;A为城区面积;a为常数;b为指数。

对于城镇人口数,可以根据式(4)计算:

(5)
Pua
i
Auib

式中,Pu为城镇人口;Aui为第i个城镇居民地的面积;ab为参数。

对于农村地区,农村居住房屋基本上以户为独立单元,多户聚集居住构成一个居民地,居民地内每增加一户,就会增加一套宅基地,进而使得居民地的面积增加(杜国明等,2007),这表明农村人口数与农村居民地面积同维,随着居民地面积的扩大,人口密度不变,即式(4)的a为常数,b=1,农村人口与农村居民地之间呈线性关系。因此,一个区域内的农村人口可表示为:

(6)
PrDr
j
Arj

式中,Pr为农村人口数量;Dr为农村居民地的人口密度;Arj为第j个农村居民地的面积。

在一个人口统计单元内的人口总数应为城镇人口与农村人口之和,所以总人口P可以表示为:

(7)
PPuPra
i
AuibDr
j
Arj

式(7)即为城市人口—面积异速生长模型的推广形式——城乡人口—面积统一模型(杜国明,2008)。

2 研究区域

本文以2007年6月3日发生的云南宁洱地震为研究震例,同时以宁洱地震受灾乡镇为研究区域。宁洱地震的震级为MS6.4级,其宏观震中位于宁洱县宁洱镇太达—宁洱—同心乡曼连一带,极震区烈度为Ⅷ度,属于近城市“直下型”地震。地震造成3人死亡,28人重伤,391人轻伤,灾区人口约40.3128万,涉及94286户,毁坏房屋75570间(20m2/间),总经济损失约189860万元。灾区总面积为3890km2,受灾范围主要涉及普洱市的宁洱、思茅、景谷、墨江和江城5个县区,共计18个乡镇单元(卢永坤等,2007)。

在研究区域的18个乡镇中,有7个建制镇,11个乡,2007年末人口数约46万人,总面积约9355km2;该区域位于云南省西南部,属于横断山脉纵谷区的南段,气候类型为亚热带气候,是典型的山区农业区。震区位于宁洱新构造隆起区,新构造活动强烈,区域断裂发育,其中最主要的断裂带是无量山断裂带。本次地震震中就位于无量山断裂带中支的镇沅—宁洱断裂上,在震区50km的范围内历史上共发生过6.0—6.9级地震8次,最大地震为1979年3月15日普洱6.8级地震,是地震活动相对活跃的地区(谢英情等,2007)。

3 研究方法
3.1 研究思路

居民地是人口分布最为直接的指示因子,是存在居住人口的必要条件(杜国明,2008)。对于农村居民地,由于地形、地貌条件以及民族居住习俗等差异,居住密度会有差别,即使在同一乡镇范围内,农村居民地也存在不同的形式,如在城镇周边或沿主要交通线,农村居民地往往表现为居住密集的大型村落,而在地势起伏大的丘陵山区,农村居民地则主要为居住分散的独户、三家村、零散村落等,因此有必要对农村居民地进行分类,分别考查不同居民地类型的房屋聚集状况和人口密度。基于居民地的人口数据空间化,需要解决两个主要问题:第一,居民地信息的准确获取;第二,居民地与人口的定量关系。

本文以高分辨率遥感影像为数据源,根据居民地类型划分,通过人工目视解译获取居民地信息,解决上述第一个问题;同时以乡镇人口统计数据为数据源,根据城乡人口—面积统一模型,建立方程组,采用最小二乘法计算农村居民地人口密度,解决第二个问题;最后在GIS支持下,实现基于居民地的人口数据空间化,获得公里网格人口密度图。

3.2 数据来源

本文采用的遥感数据是IRS-P5全色影像(2.5m)与RapidEye多光谱影像(5m)融合生成的多光谱影像;乡镇人口统计数据和行政区划数据来源于云南省地震应急基础数据库;道路、居民点、兴趣点等辅助数据来源于导航数据库。

3.3 居民地类型划分与解译标志

本文将居民地类型分为城镇居民地和农村居民地,农村居民地又分大型村落、中型村落和小型村落。基于遥感影像,根据目标在影像上反映的形态、纹理结构、地域分布等,建立不同类型居民地的遥感解译判读标志表(表1)和标志图(图1)。在解译标志建立的基础上,借助辅助数据对遥感影像进行目视解译,准确提取居民地的位置、类型和面积等信息。

经解译,研究区域内共有4874个居民地图斑,其中城镇居民地171个,占总数的3.5%;大型村落635个,占总数的13%;中型村落2473个,占总数的50.8%;小型村落1595个,占总数的32.7%。

表1 居民地类型划分与遥感解译判读标志表 Table 1 Residential area classification and interpreting indices

a 城镇居民地

b 大型村落

c 中型村落

d 小型村落

图 1 居民地解译判读标志图 Fig. 1Some examples of residential areas with interpreting indices
3.4 模型建立

研究区域中除宁洱镇、思茅镇、南屏镇为区县政府驻地,包含有较大规模的城镇居民地外,其余15个乡镇的城镇用地范围均较小(<1km2),城镇人口也较少。因此,本文重点考虑三类农村居民地面积与人口的定量关系,对18个乡镇根据式(6)建立如下方程:

PriDr1A521Dr2∑A522Dr3A523
(8)

式中,Pri为第i个乡镇农村人口统计值;∑A521、∑A522、∑A523分别为该乡镇大型、中型和小型村落各自的总面积;Dr1Dr2Dr3分别为大型、中型和小型村落的人口密度,是方程的待求系数。

采用最小二乘法解算方程组可得出大型、中型和小型村落人口密度Dr1Dr2Dr3分别为89.47人/km2、46.12人/km2和14.48人/km2

同时可根据Dr1Dr2Dr3的计算结果和式(8),计算各乡镇农村人口估计值及其相对误差(表2)。为了保证各乡镇空间化后的人口总量与统计人口总量相等,还需要依据相对误差对这3个系数进行修正。相对误差和参数Dr1Dr2Dr3的修正公式为:

Ri=(PriPri)/Pri×100%
DiD/(1+Ri)
(9)

式中,Ri为乡镇农村人口相对误差;PriPri分别为农村人口统计值和估计值;DiDi为修正前后的系数。

各乡镇两类农村居民地人口密度修正值见表2。

表2 农村居民地人口密度和模型相对误差 Table 2 Population densities of rural residential areas and relative errors in study area
3.5 人口数据空间化模型实现

本文借助地理信息系统软件ArcGIS实现基于居民地的人口数据空间化,获得公里网格人口密度矢量数据(图2)。

图 2 研究区域人口密度图 Fig. 2Map showing population densities in study area

人口数据的空间化,分城镇和农村分别实现。对农村区域,首先根据居民地解译结果和各乡镇修正后的人口密度值,计算每块居民地的人口数量;接着将获得人口值的居民地矢量数据与规则网格矢量数据(网格边长为1km)进行空间叠加,依据面积权重法,将居民地的人口分配到公里网格中,实现人口密度的网格化。对城镇区域,城镇居民地的人口密度采用平均人口密度(城镇人口除以城镇居民地总面积),其网格化方法与农村相同。

4 结果分析

相关和回归分析结果表明,乡镇人口估计值与人口统计值之间的线性拟合优度值R2为0.976,两者数量接近,线性拟合斜率接近1(图3)。由表2可见,模型总体相对误差为0.086%,相对误差大都分布在±10%之内,超出这个范围的只有3个,其中误差最大的益智乡的相对误差为13.25%。误差分析表明,本文基于居民地的人口数据空间化试验结果达到了较高的精度,研究方法切实可行。

图 3 乡镇人口估计值与统计值的关系 Fig. 3Estimated vs. census population

通过分析发现,误差主要来源于居民地解译的误差。一般而言,目标面积较小且无明显纹理特征的小型村落比目标面积较大且纹理特征突出的城镇和大型村落的目视解译难度高,产生的误差也较大。相对误差超出±10%范围的3个乡镇均位于研究区域中地形起伏较大的区域,小型村落占居民地的比重比其它乡镇高,居民地面积解译的整体精度较低,从而导致了较高的相对误差。

5 基于人口数据空间化的地震受灾人口估算

在震害预测或震害损失评估中,受灾人口主要以人口普查数据为数据源,根据不同地震烈度圈范围占人口统计单元的面积比例来确定。由于居民地分布的非均衡性和不同类型居民地人口密度的差异性,使得这种方法的可靠性差,精度往往不能满足应用要求。

本文在完成人口数据空间化的基础上,以宁洱地震为例,将网格人口矢量数据和地震烈度分布图进行空间叠加(图4),应用空间统计分析获得各乡镇受灾人口的估算结果,并与基于统计单元平均人口密度的受灾人口估算结果进行对比(表3)。

图 4 网格人口与地震烈度叠加图 Fig. 4Map overlay of grid population and seismic intensity
表3 乡镇受灾人口估算表 Table 3 Earthquake affected population of each township by the estimation

基于乡镇平均人口密度可以得出:Ⅵ度区中受灾人口150511人;Ⅶ度区中受灾人口约66314人;Ⅷ度区中受灾人口约18440人;共计受灾人口为235265人。而基于网格人口矢量数据估算可以得出:Ⅵ度区中受灾人口202347人;Ⅶ度区中受灾人口约44838人;Ⅷ度区中受灾人口约61145人;共计受灾人口为308330人。

由表3可见,采用乡镇的平均人口密度进行受灾人口的估算结果普遍小于基于网格人口的估算结果,其中宁洱镇Ⅶ度区和Ⅷ度区,南屏镇、倚象镇以及云仙乡的Ⅵ度区受灾人口的估算结果有较大偏差。由于缺乏详实的现场调查数据,本文根据遥感影像与地震烈度分布图的空间叠加对两种估算结果进行定性评价。叠加结果显示,宁洱镇的镇区绝大部分落在Ⅷ度区内,剩余区域则大部分位于Ⅶ度区,说明宁洱镇绝大多数的受灾人口位于Ⅷ度区内,而Ⅶ度区内的受灾人口应远小于Ⅷ度区,基于网格人口密度的估算结果较为符合这样的情况;对于南屏镇,虽然其受灾面积较小,但是镇区恰好落在Ⅵ度区内,所以南屏镇的受灾人口占乡镇总人口的比例应该较高,基于网格人口密度的估算得到这一比例约为77%,而基于平均人口密度的估算结果仅为19%,基于网格人口密度的估算结果更为贴近实际。此外,对倚象镇和云仙乡的遥感验证也都得到了相似的结论:传统的基于平均人口密度进行受灾人口估算的结果不能客观反映地震灾情,而基于网格的人口密度数据由于在空间写实程度上的优势,能合理反映行政单元内部的人口分布,使得基于网格人口的受灾人口估算结果更接近实际的震灾空间分布情况。同时本文基于网格的估算结果还能够根据人口的城乡属性,进一步获取各乡镇受灾人口的城乡比例。

6 结论与讨论

本文以城市人口—面积异速生长模型为理论基础,根据其几何分形意义推导出城乡人口—面积统一模型,并将城乡人口—面积统一模型和遥感图像解译相结合,构建基于居民地的人口数据空间化方法,有较强的理论依据;同时,居民地是建模的基本单元,也是防震减灾工作主要涉及的社会经济对象,基于居民地的人口数据空间化方法是面向防震减灾应用的合理方案;经检验,本文建立的城乡人口—面积统一模型达到了较高的精度,可满足防震减灾工作对高精度人口分布信息的需求。

分析表明,居民地类型和面积的解译误差是模型误差的主要来源。高分辨率遥感影像是研究不可缺少的基础数据,采用质量好,空间分辨率更高的数据可以有效提高居民地信息解译的精度;随着自然环境、社会经济条件的差异,居民地的人口密度会有较大不同,适当划分居民地类型是保证模型精度的必要条件。而采取人工目视解译的方式提取居民地信息,工作效率较低,一般只适用于中小尺度的应用。若在大尺度范围应用基于居民地的人口数据空间化方法,理想方式是采用计算机进行居民地的自动解译,这样不仅可提高效率,还能减少人为因素的干扰。

本文尝试将人口数据空间化结果与地震烈度进行空间叠加,快速估算受灾人口。研究结果表明,在已知地震烈度条件下,相比于基于平均人口密度进行受灾人口估算,基于人口数据空间化的地震受灾人口估计结果更符合实际的地震灾情。同时还能够根据人口的城乡属性,获取各乡镇人口受灾的城乡比例,为防震减灾和应急救援工作提供可靠的参考。

参考文献
[1]陈彦光,徐秋红,1999.区域城市人口—面积异速生长关系的分形几何模型——对Nordbeel-Dutton城市体系异速生长关系的理论修正与发展. 信阳师范学院学报(自然科学版),12(2):198—203[本文引用:3次]
[2]杜国明,张树文,2007.面向防洪救灾的人口统计数据空间化研究——以扶余县为例. 长江流域资源与环境,16(2):265—268[本文引用:1次]
[3]杜国明,2008.人口数据空间化方法与实践. 北京:中国农业出版社,103—124[本文引用:3次]
[4]范一大,史培军,辜智慧等,2004.行政单元数据向网格单元转化的技术方法. 地理科学,24(1):105—108[本文引用:1次]
[5]高庆华,聂高众,张业成等,2011.论地震风险. 北京:气象出版社,1—34[本文引用:1次]
[6]江东,杨小唤,王乃斌等,2002.基于RS、GIS的人口空间分布研究. 地球科学进展,17(5):734—738[本文引用:1次]
[7]廖顺宝,李泽辉,2004.四川省人口分布与土地利用的关系及人口数据空间化试验. 长江流域资源与环境,13(6):557—561[本文引用:1次]
[8]廖顺宝,孙九林,2003.基于GIS的青藏高原人口统计数据空间化. 地理学报,58(1)):25—33[本文引用:1次]
[9]廖一兰,王劲风,孟斌等,2007.人口统计数据空间化的一种方法. 地理学报,62(10):1110—1119[本文引用:1次]
[10]刘纪远,岳天祥,王英安等,2003.中国人口密度数字模拟. 地理学报,58(1):17—24[本文引用:1次]
[11]卢永坤,曾应青,周光全等,2007.2007年宁洱6.4级地震震害综述. 地震研究,30(4):364—372[本文引用:1次]
[12]吕安民,李成名,林宗坚等,2003.人口密度的空间连续分布模型. 测绘学报,32(4):344—348[本文引用:1次]
[13]田永中,陈述彭,岳天祥等,2004.基于土地利用的中国人口密度模拟. 地理学报,59(2):283—292[本文引用:1次]
[14]王汶,付文静,鲁旭,2009.基于多重分类平滑法的人口数据格网化研究. 安徽农业科学,37(25):12327—12329[本文引用:1次]
[15]吴文珏,2010.中国城市人口密度分布模型研究进展及展望. 地理科学进展,29(8):968—974[本文引用:2次]
[16]谢英情,李岩峰,张建国等,2007.2007年宁洱6.4级地震发震构造分析. 地震研究,30(4):350—358[本文引用:1次]
[17]闫庆武,卞正富,张萍等,2011.基于居民点密度的人口密度空间化. 地理与地理信息科学,27(5):95—98[本文引用:1次]
[18]杨小唤,刘业森,江东等,2006.一种改进人口数据空间化的方法:农村居住地重分类. 地理科学进展,25(3):62—69[本文引用:2次]
[19]叶宇,冯险峰,刘高焕,2006.人口数据空间化表达与应用. 地球信息科学,8(2):59—65[本文引用:1次]
[20]卓莉,陈晋,史培军等,2005.基于夜间灯光数据的中国人口密度模拟. 地理学报,60(2):266—276[本文引用:1次]
[21]Clark C., 1951.Urban Population Densities.Journal of the Royal Statistical Society. Series A (General),114 (4): 490—496[本文引用:1次]
[22]Harvey J.T., 2002.Population Estimation Models Based on Individual TM Pixels. Photogrammetric Engineering and Remote Sensing, 68(11): 1181—1192※ [本文引用:1次]
[23]Lo C.P., 2002.Modeling the Population of China Using DMSP Operation Linescan System Nighttime Data.Annals of the Association of American Geographer,92(2): 224—240[本文引用:1次]
[24]Martin D., 1989.Mapping Population Data from Zone Centroid Locations.Transactions of the Institute of British Geographers, 14(1): 90—97[本文引用:1次]
[25]Tolber W.R., 1979.Smooth Pycnophylactic Interpolation for Geographical Regions.Journal of the American Statistical Association,74(367): 519—530[本文引用:1次]