Comparative Analysis of Improved Population Gridding Method in Fujian Province Based on NPP-VIIRS Data

HUANG Yaoyi; CHEN Wencheng; CHEN Xianyin; ZHENG Chaohong; ZHAO Yimin

doi:10.13718/j.cnki.xsxb.2023.03.013

Three NDVI-modified models based on NPP-VIIRS night light supersaturation and spillover effects were developed and applied directly to grids. The model was weighted by the number of grids with population distribution in the county, and the least squares regression was used to grid the population, and then a certain proportion of randomly selected town field samples were used for verification. The experimental results showed that: ① the coefficients of the three models after the improvement of the grid method have passed the statistical significance test of p=0.001. This means that the fitting degree has increased and the prediction standard error has decreased significantly. ② The MAE, RMSE and MRE of the three models have decreased significantly. ③ The angle cosine coefficients between the three models were between 0.981 and 0.996, and the absolute distance of each grid was between 29.1 and 75.8 person, which has high consistency and is mutually effective. In conclusion, the three models have taken into account the influence of the difference in scale of the county and avoided the scale transformation between the administrative unit and the grid unit, which significantly improved the accuracy of population gridding.

HTML

目前的人口普查数据主要以不同级别的行政区划为统计单元进行统计，难以与自然、人文要素相匹配，不利于多源数据间的融合分析. 人口空间网格化具有解决行政单元边界不稳定、同级规模悬殊的效果^[1]，使人口空间分布更接近实际，可以实现人口与社会经济、自然资源、生态环境等的有效融合^[2]. 国内外学者对人口空间网格化进行了诸多研究，利用与人口相关程度高且数据来源较为容易的相关数据进行人口网格化分析成为目前的研究目标. 赵鑫等^[3]基夜间灯光、土地利用等构建指标体系后采用主成分赋权法确定权重后的广州市人口网格化; 李翔等^[4]基于夜间灯光数据和空间回归模型在乡镇域尺度下对上海市常住人口格网化; 柏中强等^[5]基于土地利用数据、居民点信息、DEM、夜晚灯光数据等多源数据，利用多元回归方法进行人口分布格网化. 诸多文献研究多以土地利用、居民地、交通廊道、夜间灯光数据、DEM、居住建筑斑块、通信、POI等^[6-8]多源辅助数据为主进行空间网格化，但多源数据存在获取难度大，获取的多源数据常常出现时间和空间尺度不一的问题.

根据福建省乡镇域尺度的第7次人口普查统计数据以及NPP-VIIRS夜间灯光、NDVI植被指数等数据，本文利用NANI、VANUI^[9]、HSI^[10-11]3种灯光修正模型，采用直接面向网格的加权个案(样本加权)及加权最小二乘法(Weighted Least Squares，WLS)分别对3种修正模型的回归建模进行人口网格化，根据两两余弦相似系数、绝对距离差异系数等同一性指标互证模型合理性，并随机抽取不同比例乡镇域尺度下的网格化结果，采用MAE，RMSE，MRE和加权MAE，RMSE，MRE验证网格化精度.

1. 数据来源及预处理

1.1. 研究区数据

①福建省行政区划数据：源于福建省1∶20万比例尺的栅格地图经几何校正后投影为UTM后的矢量化数据(包含县域、乡镇域等面状数据). ②网格数据：采用GIS软件“渔网”功能构建的1 km×1 km网格，与福建省区划数据相交叠加分析得到全省1 km×1 km基准网格. ③人口统计数据：福建省第7次人口普查的常住人口统计数据，往上汇总分别作为乡镇域、县域尺度的矢量数据属性值. ④NPP-VIIRS夜间灯光数据：利用2020年12个月的NPP-VIIRS月份数据合成为年均数据^[12]. ⑤NDVI植被指数数据：利用2020年12个月的NDVI月份数据经算术平均合成为年均数据.

1.2. 数据预处理

NPP-VIIRS、NDVI数据采用最邻近法设置为$1 \mathrm{~km} \times 1 \mathrm{~km}$尺度像元后, 将夜间灯光的DN值、NDVI的DN值分别转点后, 通过空间叠加分析分别赋值基准网格. 为便于NPP-VIIRS灯光修正数据与人口建模, 将最大值规范化变换后的变量记为$x_k \cdot x_k=d n_k / n t l_{\max }, x_k \in[0, 1]$, 当$x_k=0$表示为无灯光, $x_k=1$表示为夜间灯光饱和.

4. 结语

以NANI，VANUI，HSI 3种指数像元饱和与溢出效应修正后的模型的灯光强度为自变量，分别构建人口网格化回归模型，考察改进后与改进前的各项相关指标差异，发现改进后的加权个案及WLS建模与改进前的个案无加权的WLS建模入选模型模糊了方法改进效果，解决了人口统计单元与网格间尺度差异、统计单元间规模差异等可变面元问题，证实了改进效果的有效性，拟合优度增大了2.5倍多，预测标准误差缩小了210多倍，乡镇域随机样本的外推与网格化验证的网格人口、乡镇域人口的MAE，RMSE，MRE和加权MAE，RMSE，MRE分别缩小了3.4~8.2倍与5.0~9.2倍、3.7~6.6倍与5.9~8.4倍、3.4~8.2倍与5.0~9.2倍，提高了人口网格化精度.

3种修正模型彼此间余弦系数$\theta_{1, 2}=0.988, \theta_{1, 3}=0.996, \theta_{2, 3}=0.981$, 均接近1, 平均绝对距离$d_{1, 2}=$ $57.6, d_{1, 3}=29.1, d_{2, 3}=75.8$, 两两间差异性小、同一性大, 说明不同灯光修正模型的人口网格化结果可以互证.

改进方法以相关程度高的指标网格化，降低了多源数据时间和空间尺度不一和处理难度，其统计单元间、统计单元与网格间空间规模差异的方法也适用于GDP等社会经济统计数据的网格化/空间化. 此外，改进方法的加权个案等方法在时空数据(截面数据、面板数据)的一些分析方法中，也可以借鉴参考.

Figure (3) Table (3) Reference (14)

Name
	Name cannot be empty!
E-mail
	Mailbox cannot be empty! Mailbox cannot be empty!
Telephone
	Mobile number cannot be empty! Please enter a valid mobile number!
Title

Content
Verification Code

[1]	陈述彭, 陈秋晓, 周成虎. 网格地图与网格计算[J]. 测绘科学, 2002, 27(4): 1-6, 2. Google Scholar
[2]	黄安, 许月卿, 孙丕苓, 等. 基于多源数据人口分布空间化研究——以河北省张家口市为例[J]. 资源科学, 2017, 39(11): 2186-2196. Google Scholar
[3]	赵鑫, 宋英强, 刘轶伦, 等. 基于卫星遥感和POI数据的人口空间化研究——以广州市为例[J]. 热带地理, 2020, 40(1): 101-109. Google Scholar
[4]	李翔, 陈振杰, 吴洁璇, 等. 基于夜间灯光数据和空间回归模型的城市常住人口格网化方法研究[J]. 地球信息科学学报, 2017, 19(10): 1298-1305. Google Scholar
[5]	柏中强, 王卷乐, 姜浩, 等. 基于多源信息的人口分布格网化方法研究[J]. 地球信息科学学报, 2015, 17(6): 653-660. Google Scholar
[6]	董南, 杨小唤, 蔡红艳. 基于居住空间属性的人口数据空间化方法研究[J]. 地理科学进展, 2016, 35(11): 1317-1328. Google Scholar
[7]	林珲, 张鸿生, 林殷怡, 等. 基于城市不透水面—人口关联的粤港澳大湾区人口密度时空分异规律与特征[J]. 地理科学进展, 2018, 37(12): 1644-1652. Google Scholar
[8]	谭敏, 刘凯, 柳林, 等. 基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 地理科学进展, 2017, 36(10): 1304-1312. Google Scholar
[9]	QINGLING, ZHANG, . The Vegetation Adjusted NTL Urban Index: a New Approach to Reduce Saturation and Increase Variation in Nighttime Luminosity [J]. Remote Sensing of Environment, 2013, 129: 32-41. Google Scholar
[10]	LIU H Q, HUETE A. A Feedback Based Modification of the NDVI to Minimize Canopy Background and Atmospheric Noise [J]. IEEE Transactions on Geoscience and Remote Sensing, 1995, 33(2): 457-465. Google Scholar
[11]	LU D S, WENG Q H, LI G Y. Residential Population Estimation Using a Remote Sensing Derived Impervious Surface Approach [J]. International Journal of Remote Sensing, 2006, 27(16): 3553-3570. Google Scholar
[12]	胡为安, 刘传立, 詹淇雯. 中国区域NPP-VⅡRS年度夜间灯光数据的合成方法与对比验证[J]. 桂林理工大学学报, 2021, 41(1): 141-148. Google Scholar
[13]	赵真, 徐柱, 侯剑. 地理加权回归在人口空间分布研究中的应用[J]. 遥感信息, 2018, 33(4): 128-134. Google Scholar
[14]	王珂靖, 蔡红艳, 杨小唤. 多元统计回归及地理加权回归方法在多尺度人口空间化研究中的应用[J]. 地理科学进展, 2016, 35(12): 1494-1505. Google Scholar

Message Board

Comparative Analysis of Improved Population Gridding Method in Fujian Province Based on NPP-VIIRS Data

Abstract

References

Access History

通讯作者: 陈斌, bchen63@163.com

Article Metrics

Access History

Other Articles By Authors