地下水依赖性生态系统图暴露了全球旱地保护需求

2025-06-23 17:04来源:本站

  数据处理和建模是在Google Earth Engine(GEE)中进行的,Google Earth Engine(GEE)是一个应用程序界面,可访问大型公开数据集和机器学习算法,该算法可以在最近的Fast52中几乎不可能跨大型空间和时间尺度进行复杂的计算。

  使用Köppen-Geiger气候类别的30个弧度(大约1公里)的分辨率鉴定出旱地区域:干旱和半干旱(B型)和三种温带气候类型,具有独特的干燥夏季(C型)53(type c)53(4850万km2)。使用环境系统研究所(ESRI)掩盖了农业和城市地区,大约是10 m的全球土地使用和土地覆盖地图,这些土地覆盖率来自深度学习模型和2017 - 2020年Sentinel-2 Imagery54。农业土地内存在的地下水依赖性植被的孤立斑块可能被归类为农田,随后掩盖了模型范围。海洋和内陆海洋使用哥白尼全球土地服务动态土地覆盖地图以100 m的分辨率(CGLS-LC100)掩盖,该地图基于2015 - 2019年前哨图像55。大约1 km空间分辨率的全球深度 - 地面水(DTG)数据被用来通过掩盖距陆地表面30 m超过30 m的像素来定义模型范围(扩展数据图3),这超出了大多数phreatpophy植被的根区域超出了植物的根部。由于DTG数据集包含发生开放水域的数据差距,因此我们为在ESRI数据集中识别为开放水的像素的DTG值为0。接下来,使用1.5像素焦点均值窗口平滑DTG层,以使用周围的像素值插入任何剩余的,隔离的“无数据”像素。小窗口大小用于最大程度地减少平滑性对表面高度变化较大的区域中DTG值的影响。在视觉检查中,其余的“无数据”差距似乎围绕着使用土地覆盖数据识别的水源。假设在这些区域中,DTG是浅的,并且其余的像素也被分配为零的DTG值。分析中只包括小于或等于30米的DTG像素以映射GDE。应用了这些各种空间口罩后, 总模型范围为2320万公里。

  培训和验证GDE数据(扩展数据图1和扩展数据表1)源自在2016年Landfire 2016 Remap Remap Remap参考数据库(LFRDB)57,澳大利亚地下水依赖于地下水的生态系统ATLAS58和Sprototopen DataSet59的公共版本中。在澳大利亚的GDE地图集中,排除了来自喀斯特的地下GDE,其余的水生和陆地GDE数据被视为GDE,如果被归类为“已知的GDE(从区域研究),并且如果被归类为“非GDE”,如果将其归类为“较低的潜在GDE-from gde-from Regional Indoriation Indoriation Leation”。基于专家和文献综述,根据物种和位置将基于地面的植被数据库存和Sprotopen数据集归类为GDE或非GDE数据(补充表4)。对于LFRDB数据集,phreatophytes是从美国西部四个州分类的:亚利桑那州,加利福尼亚,内华达州和俄勒冈州。如果两个或多个州之间达成共识,即参考数据库中的特定植物物种是phreatophyte,则将其归类为GDE。当未确定植物物种在三个或多个状态下未鉴定为植物植物时,确定了非GDE点。其他非GDE训练点是通过在ESRI 10 m土地使用和土地覆盖地图中随机采样贫瘠地区(n = 10,000点)创建的。由于我们的模型依赖于基于卫星的热和光谱数据,因此我们故意选择了训练数据,预测变量和区域,这些变量和区域可以轻松地绘制生态系统,显示地下水的表面表达式。因此,我们的GDE图不会反映在地下系统或寒冷或潮湿环境中的GDE。

  如下所示,使用11个基于观测,基于模型和遥感数据的组合的组合,使用11个预测变量在全球映射GDE。

  首先,使用Landsat 8卫星平台的集合2中大约30 m的表面反射数据开发了基于卫星的指数。所有卫星图像均以GEE进行处理。gee中的Landsat 8数据包含经过大气校正的多光谱图像60,并包含带有云掩码信息(“ QA_Pixel”)的质量评估频段,可供用户识别云和无云的像素。分析中未包括云覆盖率超过20%的Landsat场景,以最大程度地减少对GDE的错误分类。对于云覆盖率小于或等于20%的场景,使用CFMASK算法61,62,62,63,64掩盖了云,雪和/或冰和云阴影。计算了四个基于卫星的植被和水指数:(1)标准化差异植被指数,绿色的量度;(2)归一化的差异水分指数,一种植物叶叶植物中水的度量,(3)归一化差水指数,开放水的量度和(4)改良的土壤调节植被指数68,绿色的度量,使土壤亮度对植被信号的影响最小化(补充表5)。对于这些指数,使用多年(2015-2020)卫星图像(夏末和秋季秋末和初期)使用多年(2015-2020)卫星图像中开发了两个指标,以在随机森林模型中用作预测因子。选择干旱季节卫星图像,因为GDE可以更容易地与非GDE区分开,因为GDES对地下水的依赖使他们能够在季节后期保持植被的活力,当时地表水和降水量稀少15,69。干旱季节定义为9月1日至9月30日在北半球,并于1月1日至3月31日在南半球。每个指数开发的两个指标是(1)年度干旱季节平均水平,(2) 平均干旱季节变化的多年变异系数是衡量年际变化的量度。具有两个指标的四个指数产生了八个预测变量。鉴于植被覆盖较高的像素的变化将比具有较低植被覆盖的像素的像素更高,因此选择的变异系数被计算为标准偏差与平均值的比率,以提供更公平的变异性。

  其次,在2003 - 2016年期间,可获得植被蒸腾数据的年度ETAP的比率,作为预测变量,以表明地下水依赖性,其中年度植被消耗用水量超过降水量。这种超出(即ETAP大于1)表明,地下水可能会满足植物水的需求,而不是浸润的降水量。使用来自Penman-Monteith Leunith Leuning蒸发V2(PML_V2)Product 70,71和1/24°分辨率沉淀数据的500 m分辨率植被蒸腾数据在GEE中计算出降水比。

  第三,复合地形指数(也称为地形湿度指数)数据区分了山脊和山谷形式,并用来表明由于地形位置而没有考虑气候因子的地形位置,土壤中土壤饱和的可能性73。

  第四,使用点(1)中描述的LANDSAT数据集开发了环境LST空间异常数据集,以识别相对于周围环境的异常凉爽或温暖的位置,这是GDES的预期属性。表面温度质量评估带(“ ST_QA”)表明表面温度带文件中给出的温度的不确定性用于消除不确定性大于5°C的像素。空间异常数据集是通过计算给定焦点像素与周围270、2,700和5,400平方米的所有像素的平均LST之间LST的差异来得出的。然后将三个差异进行平均以生成多刻度结果74。从那里开始计算年度平均夏季和/或早秋季(秋季)时期的5年平均值(2015-2020)。在应用算法之前,将开放水地覆盖类型掩盖以消除其对空间异常计算的影响。

  创建了11个预测变量中每个变量中每个的分布图,以将训练数据(n = 34,454点)与模型范围内随机生成的全局点进行比较(n = 32,954点)。使用重叠软件包75在R统计软件中计算重叠统计,其中零的统计值表示两个样本的分布之间没有重叠,一个统计值的统计值代表一个完整的重叠(即相同的数据集)。

  我们根据预测变量在GEE中使用随机森林算法以及上面介绍的训练和验证数据确定了GDE的可能存在。随机森林算法是一个统计模型,它训练由模型校准数据和预测变量的随机子集填充的分类和回归树模型的集合76。随机森林中的树木是通过“包装方法”创建的,该方法通过替换来绘制属性数据的随机子集(即预测变量的选择),从而导致一些样品要选择几次,而另一些则从未选择(偏离率分数)。“装袋方法”和属性采样都有助于确保每个决策树彼此独立,这有助于最大程度地减少在从树的合奏中获取多数决定时,在随机森林模型中的过度拟合77。之所以选择随机森林建模,是因为它在计算上是有效的,不太可能过度合适,并且可以处理许多预测因素78,79。该模型在34,454点的水生特征和已知依赖地下水的植被类型的位置进行了训练(扩展数据表1和扩展数据图1)。数据分为80到20,用于培训和测试集。使用了高参数调整(扩展数据图8),导致该模型包含40棵树(数字),每次拆分5个变量(变量分布),两个最小叶子种群(Minlefefpopulation),0.7袋(BagFraction)(BagFraction)和3,010个最大节点数(maxnodes)。脱机误差估计为0.18。随机森林模型的输出包括一个“软”概率类(扩展数据图6)在随机森林模型中使用概率模式(setOutputputmode“多重方法”)在0到100%之间变化,而“硬”概率类别导致二元GDE(1)和非GDE(1)和非GDE(1)和非GDE(2) 通过使用动态阈值分析来识别最准确的软概率GDE分类来获得的分类(图1)。

  进行了区域交叉验证测试,以进一步评估在没有训练数据的情况下将模型推入区域的程度。这是通过使用(1)世界银行从非洲萨赫勒地区提供的(1)新的培训数据和(2)省略我们来自西澳大利亚州和美国新墨西哥州新墨西哥州的培训数据来测试这些地区的培训数据的新培训数据来实现的。使用西澳大利亚州和新墨西哥州的交叉验证训练分别使用了高参数调整,因为这些交叉验证测试使用了主要模型培训和验证数据的子集,而SAHEL交叉验证测试使用了主要模型的培训和验证数据。重要的是要注意,来自SAHEL的GDE数据不是经过接地的数据,主要源自文献综述,这要求我们在Polygon特征和线缓冲区中随机生成点,这很可能在该数据集中引入了一些不确定性。因此,SAHEL数据未纳入随机森林分类器,仅用作为模型之外的验证。西澳大利亚州交叉验证测试(补充图2)的高参数调节导致该模型包含70棵树(数字frees),每个分裂的两个变量(variabblespersplit)(一个最小叶子种群),最小叶子种群(最低叶子),0.9袋(Bagfraction)和3,010最大NODES(MAXNODES)(MAXNODES)(MAXNODES)。新墨西哥交叉验证测试的高参数调整(补充图3),导致该模型包含40棵树(数字frees),每次拆分6个变量(variabblespersplit)(variablespersplit),一个最小叶子种群(最低叶子种群(人口),0.7袋(Bagfraction)(Bagfraction)(Bagfraction)和3,010 Nodes(Maxnodes)(Maxnodes)(Maxnodes)(Maxnodes)。

  在不同的分辨率上进行了事后分析,以最佳匹配数据集的基本分辨率与GDE地图的比较。因此,尽管这项研究中开发的核心GDE图的分辨率为1个分辨率(赤道的大约30 m网格),但我们还计算并提供了30个弧度(约1 km),5个Arcminute(大约10 km)和30 Arcminute Arcminute ancminute(约1 km)的GDE面积密度。GDE面积密度在每个分辨率下得出:(1)每个网格电池分析的面积和(2)总网格细胞面积。我们预计,这些摘要数据集(数据可用性部分)将对通常在这些决议中运作的更广泛的科学和从业者社区感兴趣。

  GRACE-based groundwater storage trends were derived using terrestrial water storage anomalies from NASA Jet Propulsion Laboratory Level-3 Release 6 v.2 gridded mascon data (0.5°, roughly 56 km at equator)80, and the soil moisture, canopy storage and snow water equivalent time series were obtained from Global Land Data Assimilation System v.2.1 (GLDAS-2.1) Noah81 and Variable Infiltration Capacity(VIC)82个地表模型。通过取出土壤水分,冠层水存储和雪水等效异常来计算地下水储存异常,该陆地储物储存异常基于建模的水位平衡83,在该储物水平上83,在该储存中,最终的地下水存储垂直整合浅层和深层的地下水资源84。这项研究中报道的地下水储存趋势对应于2002年4月至4月2022年的时间范围。

  这种方法的局限性是缺乏地表水异常的表示,目前在现有的全球时间序列数据产品中尚不可用。但是,与地下水存储中的大规模趋势相比,地表储水趋势通常很小,而在主储层86中填充中有一个显着的例外。该方法提供的地下水储存趋势不会覆盖整个陆地地面,因为区域包含冰川在上述方法中不考虑其趋势的冰川,它们就会被掩盖。这种掩盖降低了地下水存储趋势数据集的空间范围,这意味着在这些被掩盖的区域中存在大约110万km2的映射GDE。按照我们的事后分析协议,我们的分析将GDE面积密度与地下水存储趋势进行比较,以30座弧度进行,以匹配地下水存储趋势数据的分辨率。

  为了提供GDE区域密度与地下水储存趋势之间关系的区域摘要,我们在全球范围内绘制GDE区域密度与地下水储存趋势之间的关系,并计算出选择淡水生态区的面积平均值87。我们选择了淡水生态区作为分析单位,因为它们基于全球淡水物种的分布和组成,并提供了空间模板,可用于告知大规模保护计划工作。

  为了量化全球GDE保护的范围,我们将映射的GDE范围与保护区(WDPA)88的世界数据库进行了比较,并将其与使用GDE保护实施可持续水政策的管辖区进行了比较。WDPA是保护区最全面的全球数据集。WDPA包含受保护区域范围的空间显式多边形表示,以及多边形扩展的点。尽管点数据大约对应于WDPA89中所有条目的9%,但我们不考虑这些区域,因此需要对保护区域的空间形状进行假设。具有可持续水政策的司法管辖区包括欧盟,南非,澳大利亚和加利福尼亚(美国)。我们通过将上述司法管辖区的WDPA和范围栅格化,并将这些范围与基本GDE分类图进行了比较,从而评估了GDES在1 Arcsecond分辨率下的保护状态。我们还以图4中绘制的30(约1 km)分辨率进行了比较。

  随机森林是一种固有的统计,而不是确定性的,基于过程的方法,它依靠训练数据和预测变量来预测结果。像大多数模型一样,不确定性可以从输入变量和培训数据中嵌入模型中。通过使用随机的森林模型预测全球GDE的可能发生,我们最终模型输出中有三个主要不确定性来源:(1)预测变量:我们的模型使用11个预测变量,这些变量在整个域中具有完整的覆盖率。这些预测变量中的每一个都有不同的空间和时间分辨率(补充表6),但每个都代表了我们全局模型的每个变量的最佳可用数据集。在我们的建模方法的本地应用程序中,可以将嵌入在每个预测器变量数据集中的不确定性最小化,在我们的建模方法的本地应用程序中,可以将更高的分辨率和本地验证的数据集代替这些较大的全局数据集。(2)培训和验证数据:有关GDE的存在和不存在的数据仅限于特定的地理位置,并且由于缺乏对许多司法管辖区的GDES的认识,因此具有变化的时间分辨率(这是本研究的主要动机)。缺乏全球一致的基础真相数据集以及对区域专家意见的依赖,无法识别GDE与非GDE植被是可以改善更本地化的应用程序的另一个因素。(3)模型外推:尽管我们已经调整了超参数,但在每个预测变量和执行的区域交叉验证测试中,在模型范围内检查了训练数据的分布,但可能发生了一些模型外推误差。但是,我们的分析表明,其中许多错误可能低估了全球GDE的发生,而不是高估。这意味着,尽管可能有名为非GDE的像素,但可能会有功能(例如, 在我们的建模范围内,山地通道,森林支架,小弹簧),反之亦然。GDE对地下水的依赖在时间和空间上,甚至在同一物种上也有所不同,具体取决于其他水源的可用性以及季节性和年际气候变化15。因此,我们的GDE地图的目的是将其用作基于本地数据的更精致,局部映射工作的优先级的起点,并且伴随着使用原位方法进行验证研究,包括当地的地下水监测。尽管我们的随机森林模型可能可以在较冷,潮湿的环境中进行修改,例如使用比Landsat具有更高时间频率的前哨图像来避免在最终地图中避免使用云的像素和扫描线,但是我们随机森林图的应用可能不适用于地下gdes。地下GDE映射将需要其他映射方法,例如基于含水层映射的原位和干扰方法。对GDE和脆弱性动态的未来工作将受益于整合本地和/或国家研究人员和从业人员的观点和参与,以进一步完善特定环境特定的互连和含义。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。