题目:Understanding the village-scale expansion of rural settlements in China from a topographic perspective
作者:Xiangying Kong,Shengquan Lu,Baoqing Hu,Yurou Liang,Jiaxin Li
来源:Environmental Impact Assessment Review(新锐1区top,IF=11.5)
第一单位:广西南宁师范大学表面过程与智能模拟重点实验室
DOI:https://doi.org/10.1016/j.eiar.2026.108344
地形深刻塑造着乡村聚落(RS)的空间分布。然而,以往研究往往忽视了地形梯度的系统性作用,多聚焦于宏观尺度,难以揭示村级层面的细致模式与内在机制。为此,本研究构建了"高程–坡度"二维框架,在行政村尺度上重建了中国近40年乡村聚落的演化过程,并在村级层面量化其形态变化。进一步引入地理加权机器学习(GWML)框架,将地理加权原理与机器学习能力相结合,以刻画驱动因子的空间异质性与非线性效应。研究发现,中国乡村聚落分布高度不均衡,截至2020年,78.49%的聚落面积集中于仅占国土面积21.74%的低海拔低坡度(L-L)区域。过去四十年间,聚落扩张整体呈现向更高海拔、更陡坡度推进的趋势,但不同地形条件下的扩张模式与土地来源存在显著差异。平原地区以边缘扩展并占用耕地为主,而地形复杂地区则表现出更分散的扩张格局与多元化的土地来源。此外,L-L村庄的聚落密度超过高海拔高坡度(H-H)村庄的一百倍。最优的地理加权随机森林(GWRF)模型表明,平原地区扩张主要由土地利用强度和村庄规模驱动,而复杂地形中则受生态约束或经济密度主导。本研究系统揭示了地形约束下乡村聚落的动态格局与形态分异,为乡村振兴与区域规划提供了科学参考。
Topography critically shapes the distribution of Rural Settlements (RS). However, previous studies have often neglected the systematic role of topographic gradients, typically focusing on macro scales, which obscures the nuanced patterns and underlying mechanisms at the village level. To address this, we developed a two-dimensional elevation-slope framework to reconstruct the 40-year evolution of China's RS at the administrative village scale. We then quantified its morphological changes at the village level and employed a Geographically Weighted Machine Learning (GWML) framework, which integrates geographically weighted principles with machine learning capabilities to capture the spatial heterogeneity and non-linear effects of the driving factors. Our findings reveal a highly uneven RS distribution. By 2020, 78.49% of the settlement area was concentrated in Low elevation-Low slope (L-L) regions, comprising just 21.74% of China's landmass. Over the past four decades, expansion has trended towards higher elevations and steeper slopes, though patterns and land sources varied significantly by terrain. Plains expansion was dominated by edge-expansion onto Cultivated Land, whereas in topographically complex regions, it was more dispersed with diverse sources. Furthermore, settlement density in L-L villages was over a hundredfold greater than in High elevation-High slope (H-H) villages. The optimal Geographically Weighted Random Forest (GWRF) model shows that expansion in plains is driven by land use intensity and village scale, while in complex terrains, it is governed by ecological constraints or economic density. This study systematically dissects the dynamic patterns and morphological differentiation of rural settlements under topographic constraints, offering scientific insights for rural revitalisation and regional planning.
乡村聚落是农村地区生产与生活活动的空间载体,也是地球表层系统中关键的人工景观,其空间格局演变不仅直接反映社会经济发展水平,更与粮食安全、生态平衡、乡村可持续发展等全球议题紧密相关。在快速城镇化与工业化背景下,乡村聚落经历了深刻的空间重构,而地形作为塑造人地关系的基础框架,持续制约和引导着这一扩张过程。因此,系统理解不同地形梯度下乡村聚落扩张的时空动态及其环境互动机制,对区域空间规划和可持续发展具有重要意义。
然而,现有研究在分析视角和尺度上存在明显局限。一方面,相关研究通常仅将地形视为单一控制变量或背景条件,忽视了不同地形梯度对乡村扩张强度所产生的差异化调节作用,已有的单一维度研究多只关注高程或坡度,缺乏对乡村聚落扩张过程的系统刻画。另一方面,在分析尺度上,相关工作要么依赖宏观行政单元(国家、城市群、市县),受制于粗分辨率而掩盖局地异质性;要么采用规则格网或栅格,割裂了物理土地变化与作为社会经济实体的行政村之间的联系。尤其在具有"三级阶梯"复杂地形的中国,行政村(社区)这一最基本行政单元层面的地形梯度效应分析仍相当不足,制约了对聚落扩张空间分异内在机制的理解。
针对上述局限,本研究整合多源长时序空间数据,在行政村(社区)尺度上系统考察中国乡村聚落扩张模式及其驱动机制。研究主要包括三方面目标:
一是从地形梯度视角构建"高程–坡度"二维分类体系,定量评估不同地形类型下乡村聚落的扩张特征与转移路径;二是基于多项景观格局指数,在村级尺度量化乡村聚落的形态变化;三是在方法层面构建一个整合12个模型的GWML框架,覆盖从基线线性回归到全局机器学习及其地理加权版本,识别能够同时捕捉空间非平稳性与非线性关系的最优模型,以提供稳健的驱动机制解释。
本研究以行政村(社区)为基本分析单元,构建了从地形梯度分类、聚落空间与形态演变量化、到驱动机制解析的完整研究链条。首先利用Copernicus 30米DEM提取各村平均高程与坡度,采用Jenks自然断点法构建3×3共9类地形单元;随后基于土地利用转移矩阵与景观格局指数刻画1980至2020年聚落的扩张过程与形态变化;最后构建GWML框架,对12个模型进行系统比较并筛选最优模型,结合SHAP方法揭示不同地形条件下驱动机制的空间分异。
数据来源:
土地利用数据:来源于中国科学院资源环境科学与数据中心,30米分辨率,覆盖1980至2020年;重新分类为耕地(CL)、林地(FL)、草地(GL)、水体(WB)、城镇建设用地(UBL)、乡村聚落(RS)、未利用地(UL)共7类,用于扩张过程分析并计算LUI与CLA指标。
高程数据(DEM):欧空局Copernicus 30米DEM,用于提取高程、坡度并构建地形分类。
气候数据:1公里分辨率降水与气温数据(国家青藏高原科学数据中心),表征自然环境条件。
植被与土壤数据:250米FVC(植被覆盖度)与SoilGrids土壤类型数据,表征生态本底。
社会经济数据:1公里GDP密度(资源环境科学与数据中心)、夜间灯光数据(Harvard Dataverse)、Landscan人口密度,反映经济与人口集聚。
基础地理数据:国家1:25万和1:100万基础地理信息中的主干道、乡村道路、河流与城镇中心,用于计算位置可达性变量。
行政村边界:来源于地理遥感生态网(www.gisrs.cn),作为基础分析单元并用于计算村庄规模(VS)。
地形梯度分类:以Jenks自然断点法划分高程(≤727.22m、727.22–2446.65m、>2446.65m)与坡度(≤4.27°、4.27–11.63°、>11.63°)三级,交叉构建9类地形单元。
土地利用转移矩阵:揭示乡村聚落与其他地类间的双向转换路径与主要来源。
景观格局指数:选取NP、TPA、MPA、PD、MSI、LPI六项指标,从规模、数量密度、形状、优势度四个维度刻画村级聚落形态演变。
GWML框架:整合OLS、GWR以及RF、ExtraTrees、GBDT、XGBoost、CatBoost及其地理加权版本共12个模型,采用Optuna贝叶斯超参数优化,并在独立测试集比较R²、RMSE、MAE、MedAE指标,最终GWRF表现最优(R² = 0.544,RMSE = 0.689)。
SHAP解释方法:对最优模型进行归因分析,识别关键驱动因子的全局重要性、非线性模式与交互效应,并结合局部重要性图揭示空间非平稳性。
研究揭示了中国乡村聚落高度不均衡的空间分布格局。截至2020年,低海拔低坡度(L-L)地区仅占国土面积的21.74%,却承载了全国78.49%的乡村聚落面积;L-L型村庄的聚落密度(PD = 51.04)是H-H型村庄(PD = 0.46)的一百多倍。过去四十年间,全国村均聚落面积由27.51公顷增至34.15公顷,增幅约24.10%,而这一扩张发生在农村常住人口持续下降的背景之下,一定程度上折射出农村土地的粗放或低效利用。
地形梯度深刻调节着扩张的方向、路径与形态。2000年以来,乡村聚落扩张呈现向更高海拔、更陡坡度推进的显著趋势,中高程(1000至2000米)、中坡度(10至15°)区域成为新兴扩张热点。在平原地区,扩张主要通过边缘扩展占用优质耕地完成;而在复杂地形区,土地来源更加多元,草地与林地成为重要补给,部分高海拔地区的未利用地也被转为聚落。形态上,L-L型村庄呈现从高基数稳步增长的填充与边缘扩张模式;M-L、M-M型村庄的TPA出现数量级增长,是扩张最剧烈的区域;H-H型村庄受刚性地形约束,扩张相对平缓。尽管斑块数量普遍增加,各类型LPI仍维持在0.60至0.78的较高水平,表明核心聚落主导与外围扩散并存。
GWRF模型(R² = 0.544)显著优于GWR(R² = 0.362)与全局机器学习模型,验证了乡村聚落扩张机制同时具有显著的空间非平稳性与非线性特征。SHAP归因显示,村庄内生属性LUI与VS在所有地形类型中均居主导地位,体现出强烈的空间路径依赖。平原地区扩张主要由土地利用强度与村庄规模等社会经济路径依赖主导;高海拔生态脆弱区FVC(植被覆盖度)上升为首要约束;而地形破碎的山区则依赖经济密度(GDPD)突破物理限制。这一发现表明,乡村振兴与土地利用政策必须因地制宜:东部平原应聚焦存量优化与功能提升,西部高原须优先考虑生态承载力,复杂山区则需以经济投入与基础设施作为突破口。
本研究也存在若干局限。
其一,受村级统计数据缺失的限制,GDP密度、人口密度等关键社会经济变量均来源于1公里栅格数据,通过空间关联赋值到村,这种粗分辨率栅格与不规则村界之间的尺度失配可能引入一定噪声。
其二,虽已筛选出最优GWML模型,但其最终解释力(R²约0.54)仍较为有限,提示可能存在未观测的重要驱动因子或更复杂的交互机制。
其三,"高程–坡度"九宫格分类虽采用Jenks自然断点法,但阈值划定仍带有一定主观性,不同分类标准可能影响局部结果。
此外,近70万行政村矢量单元的空间叠加与分析对算力要求极高,也在一定程度上限制了时序和多情景模拟分析的深度。
未来研究可进一步探索更客观的地形—人地关系刻画方法,并尝试将集成学习与GWR进一步结合,以增强对深层非线性关系与时空异质性的识别能力,推动多方法、多尺度的综合集成研究;同时呼吁加强国家层面的乡村统计体系建设,为精细化的人地系统研究提供更可靠的数据基础。
Fig. 1. study area.
图1. 研究区域。
Fig. 2. Classification of village units based on topography. a. Spatial distribution of the classification results; b-e are magnified local views.
图2. 研究区域。
Fig. 3. Multi-temporal distribution and quantity of RS. a shows the overall distribution pattern of RS. b-c are magnified views of local areas. d compares the village-scale RS area in 1980 and 2020. e shows the statistics of the total area change of RS nationwide.
图3. 多时段分布和RS数量。a 显示了 RS 的整体分布模式。B-C 是局部区域的放大视图。d 比较了1980年和2020年村庄规模的RS面积。e 显示了全国范围内 RS 总面积变化的统计数据。
Fig. 4. Topographic characteristics of RS expansion. a-d respectively show the topographic distribution of rural expansion in the four periods: 1980–1990, 1990–2000, 2000–2010, and 2010–2020. The data in the figure are statistics based on administrative villages as the basic unit.
图4. RS扩张的地形特征。A-D分别展示了1980–1990年、1990–2000年、2000–2010年和2010–2020年四个时期农村扩张的地形分布。图中数据以行政村为基本单位的统计数据。
Fig. 5.Land use transition matrix.
图5. 土地利用过渡矩阵。
Fig. 6.Model selection.
图6. 模型选择。
Fig. 7.SHAP interpretation results.
图7. SHAP解释结果。
Fig. 8.Spatial non-stationarity of feature importance. a-n represent the spatial characteristics of the importance of each feature.
图8. 特征重要的空间非平稳性。a-n代表每个特征重要性的空间特征。
注:以上总结仅代表个人对论文的理解,仅供研究参考所用,不用于商业用途。若上述理解内容有误,请以论文原文为主。
欢迎转载、转发本号发布的内容,可留言或后台联系小编进行授权。未经授权允许的,请勿在其他渠道或平台转载转发。