The distribution pattern and driving factors of vegetation resilience differences inside and outside protected areas at different levels in China

思路

发布于 2026年5月10日更新于 2026年5月10日

中国不同层次保护区内外植被韧性差异分布格局及其驱动因子：实验完整流程

0. 研究目标与总体思路

你的文章可以围绕一个主问题展开：

中国不同层次保护区内部、外部及其周边反事实区域的植被韧性是否存在系统差异？这种差异是否表现为保护区外部韧性溢出或泄漏？其空间格局和驱动因子是什么？

本文建议借鉴 Protected area management has significant spillover effects on vegetation 的核心设计：将空间单元划分为保护区内部 A、潜在溢出区 B、独立反事实区 C，并通过 A vs B、B vs C、A vs C 三类对比判断保护区外部效应。该论文强调，判断溢出不能只比较保护区外部和远处区域，还需要同时判断保护区内部与外部近邻区是否相似；其中 B vs C 是溢出效应大小的核心对比。

1. 实验总体框架

1.1 空间框架

每个保护区 (PA_i) 周围构建三个空间单元：

A：保护区内部稳定自然植被像元
B：保护区外部缓冲区稳定自然植被像元
C：远离保护区、但环境条件相似的非保护区稳定自然植被像元

其中外部缓冲区 B 分为：

B1：0–1 km
B2：1–5 km
B3：5–10 km
B4：10–20 km

1.2 核心指标

每个像元计算植被韧性：

[ R=-AR(1) ]

其中：

(AR(1)) 越大，表示植被异常状态持续性越强，恢复越慢；
(R=-AR(1)) 越大，表示植被韧性越高，恢复越快。

1.3 三类关键差异

保护区内外差异

[ \Delta R_{in-out}=R_{in}-R_{out} ]

外部韧性溢出或泄漏

[ Spillover_R=R_{near\ outside}-R_{matched\ control} ]

保护区内部相对于反事实背景的差异

[ Protection_R=R_{in}-R_{matched\ control} ]

2. 数据准备

2.1 必备数据

数据	用途	空间分辨率建议	时间范围
kNDVI 或由 NDVI 计算的 kNDVI	计算植被韧性	250 m	2000–2020
保护区边界	构建 A、B、C 空间单元	矢量	最新可用
土地覆盖数据	剔除农田、城市、水体、非植被和土地覆盖变化像元	250 m 或重采样至 250 m	2000–2020
植被类型图	分组统计和匹配	250 m 或更高	静态或多年稳定
生态区/气候区	分组统计和匹配	矢量或栅格	静态
DEM	海拔、坡度	30–250 m	静态
气候数据	年均温、年降水、干旱指数等	1 km 或更高	2000–2020
人类压力数据	夜间灯光、人口、道路距离、居民点距离	250 m–1 km	2000–2020 或多年平均

3. 数据预处理

3.1 建立统一空间基准

所有数据必须统一到同一空间参考、分辨率和范围。

操作步骤

选择中国 Albers 等面积投影。
以 250 m kNDVI 栅格作为基准模板。
所有栅格重采样到 250 m。
所有矢量数据转为同一投影。
保护区边界栅格化到 250 m。

输出文件

template_250m.tif
pa_id_250m.tif
landcover_annual_250m/
climate_250m/
terrain_250m/
human_pressure_250m/

3.2 kNDVI 构建

如果你已有 250 m kNDVI 产品，可以直接进入质量控制。

如果你从 NDVI 计算 kNDVI，可使用：

[ kNDVI=\tanh(NDVI^2) ]

其中：

[ NDVI=\frac{NIR-Red}{NIR+Red} ]

操作步骤

读取 16 天或月尺度 NDVI。
对 NDVI 进行质量控制。
将 NDVI 转换为 kNDVI。
合成为月尺度 kNDVI。

3.3 质量控制

对每个时间步的 kNDVI，剔除以下像元：

云
云阴影
雪
低质量观测
异常反射率
明显离群值

建议规则

对每个像元 (p)：

如果 2000–2020 年有效观测比例 < 80%，剔除；
如果连续缺测 > 3 个月，标记为低质量；
如果某个月所有年份有效值少于 15 个，剔除该像元；
如果 kNDVI < 0 或 kNDVI > 1，剔除该值。

3.4 月尺度合成

如果原始数据为 16 天尺度，建议合成为月尺度。

说明

中位数比最大值更稳健；
如果某月只有一个有效观测，可以保留；
如果某月没有有效观测，可用时间序列平滑补齐，但要记录缺测比例。

3.5 时间序列平滑

建议使用 Savitzky–Golay 滤波。

操作步骤

对每个像元的月尺度 kNDVI 序列按时间排序。
对短缺测进行线性插值。
对插值后的序列进行 SG 平滑。
输出平滑后的月尺度 kNDVI。

敏感性分析

建议至少比较：

未平滑
SG 窗口 = 5
SG 窗口 = 7

如果主要结论一致，说明平滑方法不会主导结果。

4. 稳定自然植被像元筛选

这是你的研究中非常关键的一步。因为人为土地利用突变会显著影响 AR(1)，导致韧性指标失真。

4.1 剔除非自然植被像元

剔除以下类型：

农田
城市建设用地
水体
永久冰雪
裸地
人工表面
湿地中长期水体主导区域

保留：

森林
灌丛
草地
草甸
荒漠草地
稀疏自然植被
其他自然植被

4.2 剔除土地覆盖变化像元

对每个像元统计 2000–2020 年土地覆盖类型。

规则 1：严格稳定规则

如果 2000–2020 年期间土地覆盖类型始终为同一种自然植被类型，则保留。

2000 = 森林
2001 = 森林
...
2020 = 森林
→ 保留

规则 2：宽松稳定规则

如果 21 年中至少 80% 年份属于同一自然植被大类，且从未转为农田、城市、水体，则保留。

[ StableRatio=\frac{N_{dominant}}{N_{total}} ]

若：

[ StableRatio \geq 0.8 ]

且没有转为农田、城市、水体，则保留。

4.3 输出稳定自然植被掩膜

最终生成：

stable_natural_vegetation_250m.tif

像元值建议为：

1 = 稳定自然植被
0 = 剔除

同时保留主导植被类型：

stable_veg_type_250m.tif

5. 植被韧性计算

5.1 构建每个像元的月尺度序列

对每个稳定自然植被像元，得到：

[ kNDVI_t ]

其中：

t = 1, 2, 3, ..., 252

2000–2020 年共 21 年，月尺度为：

[ 21 \times 12 = 252 ]

5.2 去季节性

对每个像元分别计算每个月的多年平均值。

[ Season_m=mean(kNDVI_{m}) ]

其中 (m=1,2,…,12)。

然后得到去季节序列：

[ A_t=kNDVI_t-Season_m ]

其中 (A_t) 是 kNDVI 异常值。

5.3 去趋势

对去季节序列拟合线性趋势：

[ A_t=a+bt+\varepsilon_t ]

其中：

(a)：截距；
(b)：长期趋势；
(\varepsilon_t)：去季节、去趋势后的残差。

最终用于计算韧性的序列是：

[ \varepsilon_t ]

5.4 平稳性检验

对每个像元的 (\varepsilon_t) 进行 ADF 检验。

保留规则

如果 ADF 检验 p < 0.05，保留；
如果 p ≥ 0.05，剔除或进入敏感性分析。

输出

adf_pvalue_250m.tif
stationary_mask_250m.tif

5.5 计算 AR(1)

对每个像元，用残差序列计算一阶自相关。

简单公式

[ AR(1)=cor(\varepsilon_t,\varepsilon_{t-1}) ]

其中：

(\varepsilon_t)：当前月残差；
(\varepsilon_{t-1})：前一个月残差。

5.6 计算植被韧性

[ R=-AR(1) ]

解释：

(AR(1))	(R)	含义
高	低	扰动后恢复慢，韧性低
低	高	扰动后恢复快，韧性高
接近 1	接近 -1	强持续性，可能接近临界减速
接近 0	接近 0	异常不持续，恢复较快
小于 0	大于 0	异常快速反转，韧性较高

输出文件

AR1_2000_2020_250m.tif
R_resilience_2000_2020_250m.tif

6. 保护区数据处理

6.1 保护区属性整理

每个保护区至少需要以下字段：

字段	含义
PA_ID	保护区唯一编号
PA_name	保护区名称
PA_level	保护层级
PA_type	保护区类型
Province	所属省份
Area_km2	面积
Year	建立年份
Main_veg	主导植被类型
Ecozone	生态区
Climate_zone	气候区

6.2 处理保护区重叠

中国保护区之间可能存在重叠，必须处理。

推荐主方案：层级优先

优先级示例：

国家公园 > 国家级自然保护区 > 省级自然保护区 > 地方级自然保护区 > 自然公园

重叠区域归入最高层级保护区。

推荐敏感性方案：保护区复合体

如果多个保护区边界相连或相距小于 1 km，可合并为一个保护区复合体。

6.3 剔除不适合分析的保护区

剔除或单独标记：

面积过小的保护区
内部稳定自然植被像元过少的保护区
外部 20 km 内几乎没有稳定自然植被的保护区
边界严重重叠、无法构建独立外部缓冲区的保护区
主要保护对象为水域或地质景观而非植被生态系统的保护区

单元	最小像元数
保护区内部 A	≥ 30 个像元
每个外部缓冲带 B	≥ 30 个像元
候选反事实区 C	≥ 300 个像元
匹配后 C	至少与 B 数量相当

7. 构建保护区内外空间单元

7.1 构建保护区内部 A

对每个保护区 (PA_i)，定义：

[ A_i={p:p \in PA_i,\ p为稳定自然植被像元} ]

建议进一步划分：

A_all：保护区内全部稳定自然植被像元
A_core：距离保护区边界 > 1 km 的内部核心像元
A_edge：距离保护区边界 0–1 km 的内部边缘像元

主分析建议

使用：

A_core

作为保护区内部韧性代表。

原因是 A_core 可减少边界混合像元、道路、居民点和缓冲区误差影响。

7.2 构建保护区外部 B

对每个保护区构建外部缓冲区：

B1：0–1 km
B2：1–5 km
B3：5–10 km
B4：10–20 km

定义：

[ B_{i,d}={p:p \in buffer_{i,d},\ p \notin PA,\ p为稳定自然植被像元} ]

其中 (d) 表示距离带。

外部像元筛选规则

每个 B 区像元必须满足：

不是任何保护区内部像元；
是稳定自然植被；
不是农田、城市、水体、裸地；
不是土地覆盖明显变化像元；
最近的保护区是当前 PA_i；
不位于多个保护区缓冲区重叠区，或按最近保护区归属。

7.3 构建反事实区 C

C 区是最重要的对照区。它不是简单的“远处区域”，而是：

远离保护区、但环境条件与保护区外部缓冲区相似的非保护区稳定自然植被像元。

定义：

[ C_i={p:p \notin PA,\ Distance(p,nearestPA)>D,\ p为稳定自然植被像元} ]

其中 (D) 是远离保护区的距离阈值。

敏感性阈值

D = 20 km
D = 50 km

8. 反事实匹配

8.1 为什么必须做匹配

保护区不是随机分布的，往往位于高海拔、低人口密度、低开发强度或生态敏感区。如果直接比较保护区附近和远处区域，可能把环境背景差异误认为保护区效应。

Cumming 的论文也使用匹配方法控制局地生物物理条件和保护区选址偏差，并用反事实区域估计溢出效应。

8.2 匹配对象

对每个保护区 (PA_i) 和每个距离带 (d)，单独匹配。

处理组

[ T=1: p \in B_{i,d} ]

即保护区外部某一距离带的稳定自然植被像元。

对照组

[ T=0: p \in C_i ]

即远离保护区的候选反事实像元。

8.3 匹配变量

建议匹配变量分为 5 类。

类型	变量
气候	年均温、年降水、干旱指数、降水季节性
地形	海拔、坡度、坡向、地形起伏度
土壤	土壤有机碳、土壤质地、土壤水分、土壤深度
初始植被状态	2000–2002 年平均 kNDVI、kNDVI 季节振幅
人类压力	距道路距离、距居民点距离、人口密度、夜间灯光、距耕地距离

不要用于匹配的变量

不要把最终结果变量用于匹配：

不要用 R
不要用 AR(1)
不要用 2000–2020 全期平均 kNDVI 趋势

否则可能把需要解释的差异提前控制掉。

8.4 匹配方法

推荐使用两步匹配。

第一步：精确分层

先要求 B 和 C 属于相同或相近类别：

同一生态区
同一主导植被类型
同一气候区

如果样本不足，可以放宽为：

同一生态区 + 同一植被大类

第二步：距离匹配

对连续变量做标准化：

[ Z=\frac{X-\bar{X}}{SD} ]

然后计算 B 像元和 C 像元之间的环境距离：

[ Dist(p,q)=\sqrt{\sum (Z_p-Z_q)^2} ]

其中：

(p)：B 区像元；
(q)：候选 C 区像元；
(Z)：标准化后的匹配变量。

为每个 B 像元选择最相似的 (K) 个 C 像元。

8.5 匹配质量检验

对每个匹配变量计算标准化均差：

[ SMD=\frac{\bar{X}_B-\bar{X}_C}{SD} ]

判断标准：

| (|SMD|) | 质量 | |---:|---| | < 0.1 | 可接受 | | < 0.05 | 较好 | | < 0.01 | 非常好 |

保留规则

如果所有主要变量 |SMD| < 0.1，保留该保护区—距离带组合；
如果部分变量 |SMD| ≥ 0.1，重新匹配或扩大候选 C 区；
如果仍不合格，剔除该组合。

9. 计算保护区内外韧性差异

9.1 计算保护区内部韧性

对每个保护区：

[ R_{in,i}=median(R_p), \quad p \in A_i ]

建议同时计算：

mean
median
standard deviation
25% 分位数
75% 分位数
像元数

主文使用中位数，补充材料报告均值。

9.2 计算外部缓冲区韧性

对每个保护区和每个距离带：

[ R_{out,i,d}=median(R_p), \quad p \in B_{i,d} ]

其中：

d = 0–1 km
d = 1–5 km
d = 5–10 km
d = 10–20 km

9.3 计算内外差异

[ \Delta R_{in-out,i,d}=R_{in,i}-R_{out,i,d} ]

解释：

(\Delta R_{in-out})	含义
> 0	保护区内部韧性高于外部
< 0	外部韧性高于保护区内部
≈ 0	内外韧性相近

9.4 输出保护区级结果表

建议生成：

PA_resilience_inner_outer.csv

字段包括：

字段	含义
PA_ID	保护区编号
PA_name	保护区名称
PA_level	保护层级
PA_type	保护区类型
Province	省份
Ecozone	生态区
Veg_type	主导植被类型
Climate_zone	气候区
Area_km2	面积
R_in	内部韧性
R_out_0_1	0–1 km 外部韧性
R_out_1_5	1–5 km 外部韧性
R_out_5_10	5–10 km 外部韧性
R_out_10_20	10–20 km 外部韧性
DeltaR_0_1	内部 - 0–1 km
DeltaR_1_5	内部 - 1–5 km
DeltaR_5_10	内部 - 5–10 km
DeltaR_10_20	内部 - 10–20 km
N_in	内部像元数
N_out_0_1	0–1 km 像元数
N_out_1_5	1–5 km 像元数
N_out_5_10	5–10 km 像元数
N_out_10_20	10–20 km 像元数

10. 计算外部韧性溢出或泄漏

10.1 计算匹配反事实区韧性

对每个保护区和距离带，计算匹配后的 C 区韧性：

[ R_{control,i,d}=mean(R_q), \quad q \in C_{matched,i,d} ]

如果匹配方法产生权重，则使用加权平均：

[ R_{control,i,d}=\sum w_qR_q ]

其中：

(w_q)：匹配权重；
(R_q)：匹配对照像元韧性。

10.2 计算韧性溢出效应

[ Spillover_{R,i,d}=R_{out,i,d}-R_{control,i,d} ]

解释：

(Spillover_R)	含义
> 0	保护区外部近邻区韧性高于匹配反事实区，可能存在正向韧性溢出
< 0	保护区外部近邻区韧性低于匹配反事实区，可能存在韧性泄漏或负向边缘效应
≈ 0	没有明显外部韧性效应

10.3 建立 A–B–C 三对比指标

借鉴 Cumming 论文的三空间单元对比逻辑，你的韧性研究建议计算以下三个指标。该论文的 Fig. 2 使用 A、B、C 三组样本区分正向溢出、负向溢出和无溢出，并指出 B vs C 是溢出幅度的核心对比，但严格确认还要看 A vs B。

Contrast 1：内部 vs 外部

[ C1_{i,d}=R_{in,i}-R_{out,i,d} ]

表示保护区内部与外部近邻区是否相似。

Contrast 2：外部 vs 反事实

[ C2_{i,d}=R_{out,i,d}-R_{control,i,d} ]

这就是主溢出指标：

[ Spillover_R=C2 ]

Contrast 3：内部 vs 反事实

[ C3_{i,d}=R_{in,i}-R_{control,i,d} ]

表示保护区内部是否高于相似环境背景下的非保护区自然植被。

11. 溢出、泄漏和无效应分类

11.1 设置阈值

因为 (R=-AR(1))，其理论范围大致在 -1 到 1 之间。建议设置一个简单阈值：

[ \delta=0.05 ]

即：

差异绝对值小于 0.05，认为生态意义较弱；
差异大于 0.05，认为有较明确差异。

敏感性分析

同时测试：

δ = 0.02
δ = 0.05
δ = 0.10

11.2 正向韧性溢出

如果：

[ C2_{i,d}>\delta ]

则认为外部近邻区相对于反事实区韧性更高。

更严格的正向溢出要求：

[ C2_{i,d}>\delta ]

且：

[ C3_{i,d}>\delta ]

且：

[ |C1_{i,d}|<\delta ]

解释：

保护区内部韧性高于反事实区；
保护区外部近邻区也高于反事实区；
保护区外部近邻区与保护区内部相似；
因此可判断为较严格的正向韧性溢出。

11.3 韧性泄漏或负向边缘效应

如果：

[ C2_{i,d}<-\delta ]

则认为外部近邻区韧性低于匹配反事实区。

如果同时：

[ C3_{i,d}>\delta ]

且：

[ C1_{i,d}>\delta ]

说明：

保护区内部韧性较高；
但保护区外部近邻区韧性较低；
可能存在边界外人为压力集中、资源利用转移、道路干扰、旅游开发或管理断裂。

11.4 无明显外部效应

如果：

[ |C2_{i,d}| \leq \delta ]

则认为没有明显韧性溢出或泄漏。

11.5 保护区内部有效但无外部溢出

如果：

[ C3_{i,d}>\delta ]

且：

[ |C2_{i,d}| \leq \delta ]

说明：

保护区内部韧性高于相似非保护区背景；
但这种优势没有扩展到外部缓冲区。

12. 距离衰减分析

12.1 构建距离序列

每个保护区都有四个距离带的溢出效应：

Spillover_R_0_1
Spillover_R_1_5
Spillover_R_5_10
Spillover_R_10_20

为每个距离带设置中点：

距离带	中点
0–1 km	0.5 km
1–5 km	3 km
5–10 km	7.5 km
10–20 km	15 km

12.2 计算简单距离衰减斜率

对每个保护区拟合：

[ Spillover_R=a+bD ]

其中：

(D)：距离带中点；
(b)：距离衰减斜率。

解释：

(b)	含义
< 0	离保护区越远，正向溢出越弱
> 0	离保护区越远，韧性越高，近边界可能存在负效应
≈ 0	溢出效应随距离变化不明显

12.3 全国距离衰减曲线

按保护层级、生态区、植被类型分别计算平均溢出：

[ \overline{Spillover}{d}=mean(Spillover{R,i,d}) ]

绘制：

横轴：距离带
纵轴：Spillover_R
分组：保护层级 / 生态区 / 植被类型 / 气候区

13. 全国格局分析

13.1 按保护层级统计

分组计算：

[ \overline{R}_{in} ]

[ \overline{R}_{out,d} ]

[ \overline{\Delta R}_{in-out,d} ]

[ \overline{Spillover}_{R,d} ]

分组包括：

国家公园
国家级自然保护区
省级自然保护区
地方级自然保护区
自然公园
其他保护地

13.2 按生态区统计

每个生态区统计：

保护区数量
平均 R_in
平均 R_out
平均 DeltaR
平均 Spillover_R
正向溢出比例
负向泄漏比例
无效应比例

正向溢出比例：

[ P_{positive}=\frac{N(Spillover_R>\delta)}{N} ]

负向泄漏比例：

[ P_{negative}=\frac{N(Spillover_R<-\delta)}{N} ]

无效应比例：

[ P_{none}=\frac{N(|Spillover_R|\leq \delta)}{N} ]

13.3 按植被类型统计

分组包括：

森林
灌丛
草地
高寒草甸
荒漠草地
稀疏植被

重点比较：

哪类植被内部韧性最高？
哪类植被最容易出现正向溢出？
哪类植被最容易出现边界外韧性泄漏？
草地和森林的距离衰减是否不同？

13.4 按气候区统计

分组包括：

湿润区
半湿润区
半干旱区
干旱区
高寒区

重点判断：

干旱区保护区是否更容易出现韧性溢出？
湿润区森林保护区是否主要表现为内部优势？
高寒区保护区内外是否差异较小？

14. 驱动因子分析

14.1 构建保护区级驱动因子表

每个保护区—距离带一行。

输出文件：

PA_spillover_driver_table.csv

字段包括：

字段	含义
PA_ID	保护区编号
Distance_band	距离带
Spillover_R	韧性溢出效应
DeltaR	内外差异
R_in	内部韧性
R_out	外部韧性
PA_level	保护层级
PA_type	保护区类型
Area_km2	面积
Year	建立年份
Veg_type	植被类型
Ecozone	生态区
Climate_zone	气候区
MAT	年均温
MAP	年降水
AI	干旱指数
Elevation	海拔
Slope	坡度
Soil	土壤变量
Road_dist	距道路距离
Settlement_dist	距居民点距离
Nightlight	夜间灯光
Population	人口密度
Cropland_ratio_20km	周边农田比例
Built_ratio_20km	周边建设用地比例
NDVI_initial	初始 kNDVI
kNDVI_trend	kNDVI 长期趋势

14.2 主模型：RF / XGBoost + SHAP

响应变量

主响应变量：

[ Y=Spillover_R ]

也可以分别建模：

Y = DeltaR
Y = R_in
Y = R_out

预测变量

包括：

保护层级
保护区面积
建立年份
植被类型
生态区
气候区
年均温
年降水
干旱指数
海拔
坡度
土壤变量
夜间灯光
人口密度
道路距离
居民点距离
周边农田比例
周边建设用地比例

操作步骤

读取 PA_spillover_driver_table.csv。
删除缺失严重变量。
类别变量做 one-hot 编码。
连续变量标准化。
按保护区 ID 划分训练集和测试集，避免同一保护区不同距离带同时进入训练和测试。
训练 RF 或 XGBoost。
使用交叉验证选择参数。
计算模型性能：
- (R^2)
- RMSE
- MAE
计算 SHAP 值。
输出变量重要性和 SHAP 依赖图。

模型评价公式

[ RMSE=\sqrt{mean((Y_{obs}-Y_{pred})^2)} ]

[ MAE=mean(|Y_{obs}-Y_{pred}|) ]

14.3 解释模型：GAMM

GAMM 用于解释非线性关系，并控制保护区重复观测。

解释重点

降水是否存在阈值？
干旱指数是否调节溢出效应？
人类压力升高是否导致 Spillover_R 由正转负？
不同保护层级是否仍然显著？

14.4 机制模型：SEM

SEM 用于表达假设机制。

简化路径公式

[ HumanPressure = Climate + Terrain + PA_level ]

[ R_{out}=HumanPressure + Climate + Terrain + PA_level ]

[ Spillover_R=R_{out}-R_{control} ]

实际 SEM 可设置为：

PA_level, Area → HumanPressure
Climate, Terrain → R_in, R_out
HumanPressure → R_out
R_in, R_out, R_control → Spillover_R

14.5 空间异质性：MGWR 或滑动窗口

MGWR 响应变量

[ Y=Spillover_R ]

解释变量

人类压力
降水
干旱指数
海拔
保护区面积
保护层级
周边农田比例
周边建设用地比例

目标

判断不同地区驱动因子的作用方向和强度是否不同。

例如：

在东部人口密集区，人类压力可能主导负向泄漏；
在西北干旱区，降水和干旱指数可能主导韧性；
在青藏高原，海拔和温度限制可能更重要。

15. 统计检验

15.1 内外差异是否显著

以保护区为单位，使用配对检验：

[ R_{in,i} \quad vs. \quad R_{out,i,d} ]

如果数据近似正态：

配对 t 检验

如果不正态：

Wilcoxon 符号秩检验

15.2 不同保护层级是否不同

响应变量：

DeltaR
Spillover_R

检验方法：

Kruskal-Wallis 检验
Dunn 事后检验

或使用混合效应模型：

[ Spillover_R=PA_level+DistanceBand+VegType+ClimateZone+u_{PA} ]

15.3 溢出比例是否不同

例如比较不同保护层级的正向溢出比例：

[ P_{positive}=\frac{N(Spillover_R>\delta)}{N} ]

可使用：

卡方检验
二项 logistic 回归

logistic 回归形式：

[ Positive=PA_level+VegType+ClimateZone+HumanPressure ]

其中：

Positive = 1，如果 Spillover_R > δ
Positive = 0，否则

16. 不确定性估计

16.1 像元重采样

对每个保护区和每个距离带：

从 B 区像元中有放回抽样；
从匹配 C 区像元中有放回抽样；
重复 1000 次；
每次计算 Spillover_R；
取 2.5% 和 97.5% 分位数作为 95% CI。

16.2 空间块 Bootstrap

因为像元存在空间自相关，建议使用空间块而非单像元重采样。

操作步骤

将全国划分为 5 km × 5 km 或 10 km × 10 km 网格。
每个像元归入一个空间块。
Bootstrap 时抽样空间块。
重新计算 (R_{in})、(R_{out})、(Spillover_R)。

16.3 置信区间判定

若：

[ CI_{95%}(Spillover_R)>0 ]

则认为正向溢出较稳健。

若：

[ CI_{95%}(Spillover_R)<0 ]

则认为负向泄漏较稳健。

若置信区间跨 0，则认为不确定。

17. 敏感性分析

至少做 8 类敏感性分析。

17.1 韧性指标敏感性

比较：

R = -AR(1)
R_alt = 1 - AR(1)
AR(1) 原值

主文使用：

[ R=-AR(1) ]

补充材料报告其他指标。

17.2 平滑方法敏感性

比较：

未平滑
SG 窗口 5
SG 窗口 7

17.3 稳定植被掩膜敏感性

比较：

严格稳定自然植被
80% 年份稳定自然植被
90% 年份稳定自然植被

17.4 反事实距离阈值敏感性

比较 C 区定义：

远离所有保护区 >20 km
远离所有保护区 >30 km
远离所有保护区 >50 km

17.5 外部缓冲区敏感性

比较：

0–1 km
0.5–1 km
1–5 km
5–10 km
10–20 km

尤其检查 0–1 km 是否受边界误差影响。

17.6 匹配方法敏感性

比较：

最近邻匹配
1:3 匹配
1:5 匹配
全匹配
倾向得分匹配
环境距离匹配

17.7 阈值敏感性

比较：

[ \delta=0.02 ]

[ \delta=0.05 ]

[ \delta=0.10 ]

17.8 保护区重叠处理敏感性

比较：

重叠缓冲区剔除
最近保护区归属
保护区复合体合并

18. 结果图件设计

图 1：技术路线图

展示：

kNDVI 预处理 → 韧性计算 → A/B/C 空间单元 → 匹配 → 内外差异 → 溢出效应 → 驱动因子

图 2：中国植被韧性空间分布图

显示全国稳定自然植被像元的：

[ R=-AR(1) ]

图 3：保护区内部韧性分布图

每个保护区用：

[ R_{in} ]

着色。

图 4：保护区内外韧性差异图

每个保护区用：

[ \Delta R_{in-out} ]

着色。

可分别绘制：

0–1 km
1–5 km
5–10 km
10–20 km

图 5：韧性溢出/泄漏空间图

每个保护区或保护区边界外缓冲区用：

[ Spillover_R ]

着色。

颜色建议：

正值：正向韧性溢出
负值：韧性泄漏
接近 0：无明显效应

图 6：不同保护层级箱线图

展示：

R_in
DeltaR
Spillover_R

分组：

国家公园
国家级自然保护区
省级自然保护区
地方级自然保护区
自然公园

图 7：距离衰减曲线

横轴：

0.5 km
3 km
7.5 km
15 km

纵轴：

[ Spillover_R ]

分组：

保护层级
植被类型
气候区
生态区

图 8：驱动因子 SHAP 图

包括：

变量重要性条形图
SHAP beeswarm 图
关键变量依赖图

图 9：GAMM 非线性响应图

展示：

Spillover_R 对降水的响应
Spillover_R 对干旱指数的响应
Spillover_R 对人类压力的响应
Spillover_R 对保护区面积的响应

图 10：MGWR 空间异质性图

显示不同驱动因子的局部回归系数：

人类压力系数空间分布
降水系数空间分布
保护区面积系数空间分布
道路距离系数空间分布

19. 结果表格设计

表 1：数据来源与预处理

数据	来源	分辨率	时间	用途

表 2：保护区样本统计

保护层级	原始数量	保留数量	剔除数量	平均面积	稳定自然植被比例

表 3：不同保护层级韧性差异

保护层级	(R_{in})	(R_{out,0-1})	(R_{out,1-5})	(\Delta R)	(Spillover_R)

表 4：不同植被类型韧性溢出

植被类型	正向溢出比例	负向泄漏比例	无效应比例	平均 (Spillover_R)

表 5：模型性能

模型	响应变量	(R^2)	RMSE	MAE

表 6：敏感性分析结果

敏感性方案	正向溢出比例	负向泄漏比例	平均 (Spillover_R)	与主结果是否一致

20. 推荐文件结构

project/
│
├── data_raw/
│   ├── kNDVI/
│   ├── protected_areas/
│   ├── landcover/
│   ├── climate/
│   ├── terrain/
│   ├── human_pressure/
│
├── data_processed/
│   ├── kNDVI_monthly_250m/
│   ├── kNDVI_sg_250m/
│   ├── stable_vegetation_mask/
│   ├── resilience/
│   ├── PA_raster/
│   ├── buffers/
│   ├── matched_controls/
│
├── scripts/
│   ├── 01_preprocess_kNDVI.py
│   ├── 02_stable_vegetation_mask.py
│   ├── 03_calculate_resilience.py
│   ├── 04_prepare_PA_buffers.py
│   ├── 05_matching_controls.py
│   ├── 06_calculate_spillover.py
│   ├── 07_statistical_analysis.R
│   ├── 08_driver_RF_XGBoost.py
│   ├── 09_GAMM_SEM_MGWR.R
│
├── results/
│   ├── tables/
│   ├── figures/
│   ├── maps/
│   ├── model_outputs/
│
└── manuscript/

21. 可以直接执行的实验步骤清单

阶段一：数据预处理

1. 下载或准备 2000–2020 年 250 m kNDVI 数据。
2. 统一投影为中国 Albers。
3. 对 kNDVI 进行质量控制。
4. 合成为月尺度 kNDVI。
5. 对月尺度 kNDVI 进行 SG 平滑。
6. 准备 2000–2020 年土地覆盖数据。
7. 剔除农田、城市、水体、裸地等非自然植被。
8. 剔除 2000–2020 年土地覆盖发生明显变化的像元。
9. 得到稳定自然植被掩膜。

阶段二：韧性计算

10. 对每个稳定自然植被像元提取 2000–2020 年月尺度 kNDVI。
11. 计算每个月多年平均值。
12. 用原始序列减去月平均值，得到去季节异常。
13. 对异常序列拟合线性趋势。
14. 提取残差序列。
15. 对残差序列进行 ADF 平稳性检验。
16. 对通过 ADF 检验的像元计算 AR(1)。
17. 计算 R = -AR(1)。
18. 输出全国植被韧性栅格。

阶段三：保护区空间单元构建

19. 清理保护区边界。
20. 处理保护区重叠。
21. 给每个保护区赋予 PA_ID 和保护层级。
22. 栅格化保护区边界。
23. 构建保护区内部 A。
24. 构建内部核心区 A_core。
25. 构建外部缓冲区 B1、B2、B3、B4。
26. 剔除 B 中非稳定自然植被像元。
27. 剔除 B 中位于其他保护区内部的像元。
28. 处理多个保护区缓冲区重叠像元。

阶段四：反事实区构建与匹配

29. 构建远离所有保护区 >30 km 的候选 C 区。
30. 只保留 C 中稳定自然植被像元。
31. 给 B 和 C 像元提取气候、地形、土壤、人类压力和初始 kNDVI 变量。
32. 对每个保护区和每个距离带单独匹配。
33. 先按生态区、植被类型、气候区分层。
34. 在分层内用环境距离或倾向得分匹配。
35. 检查匹配质量 SMD。
36. 剔除匹配质量不合格的保护区—距离带组合。

阶段五：内外差异和溢出效应计算

37. 计算每个保护区 R_in。
38. 计算每个保护区每个距离带 R_out。
39. 计算 DeltaR = R_in - R_out。
40. 计算匹配反事实区 R_control。
41. 计算 Spillover_R = R_out - R_control。
42. 计算 C1 = R_in - R_out。
43. 计算 C2 = R_out - R_control。
44. 计算 C3 = R_in - R_control。
45. 按 δ = 0.05 分类为正向溢出、负向泄漏、无效应等类型。
46. 用 bootstrap 估计 Spillover_R 的置信区间。

阶段六：空间格局分析

47. 绘制全国 R 分布图。
48. 绘制保护区 R_in 分布图。
49. 绘制 DeltaR 分布图。
50. 绘制 Spillover_R 分布图。
51. 按保护层级统计 R_in、R_out、DeltaR、Spillover_R。
52. 按生态区统计正向溢出比例和负向泄漏比例。
53. 按植被类型统计溢出距离衰减。
54. 按气候区比较韧性差异。

阶段七：驱动因子分析

55. 构建保护区—距离带驱动因子表。
56. 使用 RF 或 XGBoost 建模 Spillover_R。
57. 使用 SHAP 解释变量重要性。
58. 使用 GAMM 分析非线性响应。
59. 使用 SEM 检验机制路径。
60. 使用 MGWR 或滑动窗口分析空间异质性。

阶段八：稳健性检验

61. 更换平滑方法。
62. 更换稳定植被定义。
63. 更换 C 区距离阈值。
64. 更换匹配方法。
65. 更换 δ 阈值。
66. 更换保护区重叠处理规则。
67. 比较主结果是否稳定。

22. 论文方法部分可直接使用的表述

22.1 韧性计算表述

本研究基于 2000–2020 年月尺度 250 m kNDVI 时间序列计算植被韧性。首先对 kNDVI 进行质量控制、月尺度合成和 SG 平滑；随后剔除非自然植被、农田、城市、水体以及 2000–2020 年土地覆盖发生明显变化的像元，仅保留长期稳定自然植被。对每个稳定自然植被像元，先去除月尺度季节循环，再去除长期线性趋势，并对残差序列进行 ADF 平稳性检验。通过检验的像元计算残差序列的一阶自相关系数 (AR(1))，并定义 (R=-AR(1)) 作为植被韧性指标。该指标数值越大，表示植被异常状态持续性越弱、恢复速度越快、韧性越高。

22.2 A–B–C 空间设计表述

为识别保护区内外植被韧性差异及外部韧性溢出效应，本研究借鉴保护区溢出效应研究中的 A–B–C 反事实框架，将每个保护区划分为保护区内部稳定自然植被区 A、保护区外部不同距离缓冲区 B，以及远离保护区但环境条件相似的非保护区反事实区 C。外部缓冲区包括 0–1、1–5、5–10 和 10–20 km。反事实区 C 由远离所有保护区至少 30 km 的稳定自然植被像元构成，并通过生态区、植被类型、气候区分层以及气候、地形、土壤、人类压力和初始 kNDVI 等变量匹配获得。

22.3 溢出效应表述

对每个保护区及其每个外部缓冲区，本研究计算三类差异：(C1=R_{in}-R_{out})、(C2=R_{out}-R_{control})、(C3=R_{in}-R_{control})。其中 (C2) 被定义为外部韧性溢出效应，即 (Spillover_R=R_{out}-R_{control})。当 (Spillover_R>0) 时，表示保护区外部近邻区韧性高于匹配反事实区，可能存在正向韧性溢出；当 (Spillover_R<0) 时，表示保护区外部近邻区韧性低于匹配反事实区，可能存在韧性泄漏或负向边缘效应。为避免将微弱差异过度解释，本研究以 (\delta=0.05) 作为主要生态意义阈值，并使用 (\delta=0.02) 和 (\delta=0.10) 进行敏感性分析。

23. 最终核心公式汇总

kNDVI

[ kNDVI=\tanh(NDVI^2) ]

去季节异常

[ A_t=kNDVI_t-Season_m ]

去趋势残差

[ A_t=a+bt+\varepsilon_t ]

一阶自相关

[ AR(1)=cor(\varepsilon_t,\varepsilon_{t-1}) ]

植被韧性

[ R=-AR(1) ]

保护区内部韧性

[ R_{in}=median(R_A) ]

保护区外部韧性

[ R_{out}=median(R_B) ]

内外差异

[ \Delta R_{in-out}=R_{in}-R_{out} ]

反事实区韧性

[ R_{control}=mean(R_C) ]

韧性溢出效应

[ Spillover_R=R_{out}-R_{control} ]

A–B–C 三对比

[ C1=R_{in}-R_{out} ]

[ C2=R_{out}-R_{control} ]

[ C3=R_{in}-R_{control} ]

距离衰减

[ Spillover_R=a+bD ]

24. 最推荐的主实验设定

项目	主设定
时间范围	2000–2020
时间尺度	月尺度
空间分辨率	250 m
植被指数	kNDVI
平滑方法	SG 滤波，窗口 5 或 7
韧性指标	(R=-AR(1))
稳定植被定义	2000–2020 年长期稳定自然植被
内部区	保护区内距离边界 >1 km 的稳定自然植被
外部区	0–1、1–5、5–10、10–20 km
反事实区	远离所有保护区 >30 km
匹配变量	气候、地形、土壤、人类压力、初始 kNDVI
匹配质量	(	SMD	<0.1)
溢出指标	(Spillover_R=R_{out}-R_{control})
主阈值	(\delta=0.05)
主驱动模型	RF/XGBoost + SHAP
解释模型	GAMM
机制模型	SEM
空间异质性	MGWR 或滑动窗口

25. 最终论文逻辑

你的文章可以形成如下逻辑链：

长期稳定自然植被 kNDVI 时间序列
        ↓
去季节、去趋势、平稳性检验
        ↓
计算 AR(1) 和 R = -AR(1)
        ↓
构建保护区内部 A、外部缓冲区 B、匹配反事实区 C
        ↓
计算 R_in、R_out、R_control
        ↓
分析 ΔR_in-out：保护区内外韧性差异
        ↓
分析 Spillover_R：保护区外部韧性溢出或泄漏
        ↓
按保护层级、生态区、植被类型、气候区统计空间格局
        ↓
用 RF/XGBoost + SHAP、GAMM、SEM、MGWR 识别驱动机制
        ↓
提出保护区外围治理、生态廊道建设和分区管理建议

中国不同层次保护区内外植被韧性差异分布格局及其驱动因子：实验完整流程

0. 研究目标与总体思路

1. 实验总体框架

1.1 空间框架

1.2 核心指标

1.3 三类关键差异

保护区内外差异

外部韧性溢出或泄漏

保护区内部相对于反事实背景的差异

2. 数据准备

2.1 必备数据

3. 数据预处理

3.1 建立统一空间基准

操作步骤

输出文件

3.2 kNDVI 构建

操作步骤

3.3 质量控制

建议规则

3.4 月尺度合成

推荐公式

说明

3.5 时间序列平滑

操作步骤

推荐参数

敏感性分析

4. 稳定自然植被像元筛选

4.1 剔除非自然植被像元

4.2 剔除土地覆盖变化像元

规则 1：严格稳定规则

规则 2：宽松稳定规则

推荐主分析

推荐敏感性分析

4.3 输出稳定自然植被掩膜

5. 植被韧性计算

5.1 构建每个像元的月尺度序列

5.2 去季节性

5.3 去趋势

5.4 平稳性检验

保留规则

输出

5.5 计算 AR(1)

简单公式

5.6 计算植被韧性

输出文件

6. 保护区数据处理

6.1 保护区属性整理

6.2 处理保护区重叠

推荐主方案：层级优先

推荐敏感性方案：保护区复合体

6.3 剔除不适合分析的保护区

推荐最小样本量

7. 构建保护区内外空间单元

7.1 构建保护区内部 A

主分析建议

7.2 构建保护区外部 B

外部像元筛选规则

推荐主方案

推荐敏感性方案

7.3 构建反事实区 C

推荐主阈值

敏感性阈值

8. 反事实匹配

8.1 为什么必须做匹配

8.2 匹配对象

处理组

对照组

8.3 匹配变量

不要用于匹配的变量

8.4 匹配方法

第一步：精确分层

第二步：距离匹配

推荐参数

8.5 匹配质量检验

保留规则

9. 计算保护区内外韧性差异

9.1 计算保护区内部韧性

9.2 计算外部缓冲区韧性

9.3 计算内外差异

9.4 输出保护区级结果表