陆地生态系统功能的三个主要轴

2025-06-24 12:19来源:本站

  本研究中使用的数据属于FluxNet Lathuile9和FluxNet2015 Tier 1和Tier 2 DataSets10,它们构成了CO2,水蒸气和能量通量测量的全球网络。当两个数据集中存在该站点时,我们合并了两个FluxNet版本,并保留了数据版本的FluxNet2015(最新且具有强大的质量检查)。去除农田,以避免在分析中包括大量管理的地点(例如,受精和灌溉)。

  所使用的地点涵盖了各种各样的气候区(从热带到地中海再到北极)和植被类型(湿地,灌木丛,草原,稀树草原,稀树草原,常绿和落叶林)。应该注意的是,热带森林在FluxNet数据库中的代表性不足(扩展数据图1、3)。

  在以下情况下,排除了地点:(i)关于降水或辐射的数据,没有可用或完全缝隙;(ii)由于测量数据的可用性较低,功能性能的计算失败了(请参阅“ FluxNet中生态系统函数的计算”);(iii)通量在时间序列中显示出明显的不连续性,表明仪器设置发生了变化(例如,超声波器计量仪或气体计分析仪的高度变化)。

  选定的最终地点数量为203(1,484个现场年)。地理分布显示在扩展数据图1中,气候空间中的分布在扩展数据中显示,并且在扩展数据中报告了每个气候类别的地点的比例。

  For each site, we downloaded the following variables at half-hourly temporal resolution: (i) gross primary productivity (GPP, μmol CO2 m–2 s–1) derived from the night-time flux partitioning26 (GPP_NT_VUT_50 in FLUXNET 2015 and GPP_f in LaThuile), (ii) net ecosystem exchange (NEE, μmol CO2 m–2 s–1) measurements使用年摩擦速度(U*,M s -1)阈值过滤(Fluxnet 2015中的Nee_vut_50; lathuile中的nee);(iii)潜热(LE,W M -2)通量,这些通量转化为蒸散液(ET,MM);(iv)明智的热量(H,W M -2)通量;(v)气温(Tair,°C);(vi)蒸气压力不足(VPD,HPA);(vii)全球短波传入辐射(Swin,W M -2);VIII)净辐射(RN,W M -2);(ix)地面热通量(g,w m -2);(x)摩擦速度u*(m s -1);和(XI)风速(U,M S -1)。对于能量通量(H,LE),我们选择了未校正能量平衡闭合的通量,以确保两个磁通数据集之间的一致性(在lathuile数据集能量通量中未纠正)。

  根据先前的报告27,计算累积土壤水指数(CSWI,MM)作为水的量度。用蒸腾估计算法(TEA)28计算蒸腾估计值(T,MM)的半小时值。茶已显示出对模型模拟和独立的SAP流量数据的表现良好。

  对于101个地点,对生态系统量表叶含量(n%,GN 100 g -1)计算为在生长季节高峰时采样或从文献中收集的叶面n%的社区加权平均水平。29,30,31,32。其他站点的叶面n%来自FluxNet生物辅助数据管理(BADM)产品和/或由现场主要研究人员提供的(补充表1,扩展数据图1)。应当指出的是,这种n%数据的汇编可能会遭受从叶子到涡流协方差足迹的缩放,采样策略(包括沿垂直冠层剖面的位置),物种选择和采样时间的不确定性。大约30%的数据来自协调的工作,将这些不确定性最小化29,30,而对于其他我们收集了n%数据,这些数据代表了Eddy协方差足迹31,32。

  Maximum leaf area index (LAImax, m2 m−2) and maximum canopy height (Hc, m) were also collected for 153 and 199 sites, respectively, from the literature32,33, the BADM product, and/or site principal investigators.

  Earth observation retrievals of above-ground biomass (AGB, tons of dry matter per hectare (t DM ha−1)) were extracted from the GlobBiomass dataset34 at its original resolution (grid cell 100 × 100 m) for each site location. All the grid cells in a 300 × 300 m and 500 × 500 m window around each location were selected to estimate the median and 95th percentiles of AGB for each site. The median of AGB was selected to avoid the contribution of potential outliers to the expected value of AGB. The analysis further explored the contribution of higher percentiles in the local variation of AGB as previous studies have highlighted the contribution of older and larger trees in uneven stand age plots to ecosystem functioning35. According to the evaluation against AGB measured at 71 FLUXNET sites (Extended Data Fig. 10), we decided to use the product with median AGB values extracted from the 500 × 500 m window.

  A total of 94 sites have all the data on vegetation structure (N%, LAImax, Hc, and AGB).

  The list of sites is reported in Supplementary Table 1 along with the plant functional type (PFT), Köppen-Geiger classification, coordinates, and when available N%, LAImax, Hc and AGB.

  In this study we did not make use of satellite information, with the exception of the AGB data product. Future studies will benefit from new missions such as the ECOsystem Spaceborne Thermal Radiometer Experiment on Space Station (ECOSTRESS), the fluorescence explorer (FLEX), hyperspectral, and radar and laser detection and ranging (LiDAR) missions (for example, Global Ecosystem Dynamics Investigation (GEDI)), to characterize a multivariate space of structural and functional properties.

  从半小时的数据开始,我们在每个站点计算了下面列出的每个生态系统功能的单个值。对于我们使用的功能属性的计算,除非另有说明,否则在FluxNet数据集中使用了优质的数据:质量标志0(测量数据)和1(良好的差距填充数据)。

  使用光合活性辐射作为驱动辐射,在光饱和下进行GPP,而2,000μmolM -2 s -1作为饱和光。GPPSAT代表生态系统规模的最大光合二氧化碳co2 outtake15,30,36。通过将双曲线光响应曲线与5天的移动窗口拟合,并在移动窗口的中心分配30,37,从半小时的数据估算了GPPSAT。对于每个站点,从GPPSAT估计值中提取了第90个百分位数。

  这是在生长季节(即每天的GPP高于GPP振幅的30%时)计算为半小时净生态系统生产(NEP = -NEE)的第90个百分点。该度量代表生态系统的最大净二氧化碳吸收。

  在参考温度为15°C下的基础生态系统呼吸是从夜间测量中得出的26。每日基础生态系统呼吸(RBD)是通过在五天移动窗口上拟合Arrhenius型方程的来得出的,并通过保持对温度参数(E0)的敏感性如夜间分配算法26,38中固定的敏感性。RBD在整个季节都不同,因为它受生产力短期变化的影响33,39,物候40和水应激41。对于每个站点,计算了RBD(RB)和第95个百分位数(RBMAX)的平均值。使用ReddyProc R套件V.1.2.2(参考文献38)进行计算。

  这项研究中定义的ACUE是生态系统隔离光合作用39的碳的效率。ACUE表明呼吸碳在一个季节内相对于同化碳的比例。先前的报告6表明,除了场地扰动史之外,还可以通过气候或常规场地特征来解释ACUE的变异性几乎无法解释。每日ACUE(ACUED)定义为Acued = 1-(RBD/GPPD),其中GPPD为每日平均GPP,RBD得出如上所述。对于每个站点,将ACUE计算为中位数。

  WUE的各种指标如下:气孔斜率或坡度系数(G1),潜在的水利用效率(UWUE)以及基于蒸腾作用(WUET)的水利用效率。如先前的研究11,42所示,使用了这三个指标是因为它们是互补的。

  这是植物碳吸收水的边缘碳成本。G1是派生前面的最佳气孔模型的关键参数43。G1与叶级WUE成反比。在叶片水平上,使用非线性回归计算G1,可以解释为在气孔电导和净CO2同化之间的斜率,对VPD和CO2浓度进行标准化43。先前的Report42显示了在生态系统量表上使用G1的潜力,其中气孔电导被表面电导(GS)代替,而GPP净同化。该方法是在Bigleaf R Package44中实现的。在以下情况下计算公制:(i)传入的短波辐射(SWIN)大于200 W M -2;(ii)当有降水数据可用时,在最后24 H45中没有降水事件;(iii)在生长季节:每日GPP> 30%的季节性振幅44。

  根据先前的方法46计算基础WUE。Uwue是一种水利用效率的度量,在Canopy Scale44上与G1负相关:44:

  使用适用于G1计算的相同过滤计算了UWUE。为每个站点计算了半小时保留的Uwue值的中值,并用作功能属性。

  计算基于蒸腾(T)的WUE,以减少土壤蒸发产生的混杂作用11,28:

  其中t是通过先前的研究28和GPP中开发的蒸腾估计算法(TEA)计算的平均年度蒸腾作品是平均年度GPP。

  在计算空气动力电导(GA)后,通过反转Penman – Monteith方程来计算表面电导(GS)。

  在文献中GA(M S – 1)的不同配方中,我们选择在这里使用冠层(准层)边界层电导的计算进行传热,从经验到基于物理的范围(例如,参考文献47)。其他研究48,49提出了GA,水平风速(U)与摩擦速度之间的经验关系,U*:

  通过反转Penman – Monteith方程来计算GS(M s -1):

  其中δ是饱和蒸气压曲线的斜率(kPa k -1),ρ是空气密度(kg m -3),CP是空气的比热(J K -1 kg -1),γ是心理常数(kpa k -1),kpa k -1),vpd(kpa),rn(kpa),rn(rn(kpa),rn(rn(rn),(w m -2),并将数据集中的0设置为0。如果不可用,则G还将G设置为0。

  GS代表植被和土壤与水蒸气转移的合并电导率。为了通过清晰的生理解释保留值,我们像为G1的计算一样过滤了数据。

  对于每个站点,计算半小时GS的第90个百分位数,并保留为每个位点(GSMAX)的最大表面电导率。使用BigLeaf R Package44计算GS。

  该度量表示在生长季节中计算为ET的第95个百分点,并使用在G1计算中使用相同的过滤后保留的数据。

  EF是LE与可用能量之间的比率,此处计算为H+LE的总和(参考文献50)。为了计算EF,我们使用了与G1相同的过滤策略。我们首先计算平均白天EF。然后,我们将每个站点的EF计算为白天EF的生长季节平均值。我们还通过计算平均白天EF(EFAMPL)分布的四分位间距来计算生长季节EF的振幅。

  在生态系统功能的多元空间上进行了PCA。每个变量(生态系统功能属性,EFP)均使用Z变形(即减去其平均值然后除以其标准偏差)进行标准化。从PCA结果中,我们提取了每个组件的解释方差和EFP的负载,表明每个变量对组件的贡献。我们使用R软件包FactoMiner51中实现的函数PCA()执行了PCA。

  我们在非线性方法上使用PCA证明是合理的,因为它是一种探索技术,非常适合对本研究中使用的数据量的分析,而应用于此类数据的其他非线性方法将被过度参数化。出于同样的原因,PCA用于以前关于叶片和植物特征的全球光谱以及磁通量1,3,52的工作。

  为了测试PCA维度的重要性,我们使用了先前描述的方法53。我们使用了R软件包ADE4(参考文献54),并评估了保留PCA的重要组件的数量,以最大程度地减少信息的冗余和信息丢失(补充信息2)。我们使用自举特征向量方法55的组合和使用Dimensions56的数量选择的阈值来测试PCA载荷的重要性(补充信息2)。

  使用随机森林(RF)分析来识别植被结构和气候变量,这些变量对重要的主要主要成分的可变性有最大的作用,这些成分已通过PCA分析确定(请参阅“主要成分分析”)。在主要文本中,我们将此分析的结果称为“预测变量重要性”,以将其与下面描述的“因果变量重要性”区分开。

  使用以下预测变量进行了分析:作为结构变量,n%(GN 100 g -1),LAIMAX(M2 M -2),AGB(T DM HA -1)和HC(M);作为气候变量,平均年度降水(P,MM),生长季节期间的平均VPD(VPD,HPA),平均短波辐射(SWIN,W M -2),平均气温(TAIR,°C);以及累积的土壤水指数(CSWI, - ),作为现场水的指标。

  我们使用变量的部分依赖性来评估单个预测因子与响应变量之间的关系(即PC1,PC2和PC3)。

  部分依赖性分析的结果可用于确定单个变量对响应的影响,而没有其他变量的影响。使用PDP R软件包57计算部分依赖函数。

  计算部分依赖关系仅限于其训练值凸面内的值,以减少解释数据范围之外的部分依赖图(推断)。

  我们已经使用非线性回归量化了主要成分对不同结构和气候变量的依赖性。只有当回归模型实际上是因果回归模型时,才能通过因果解释此类依赖性(有关正式定义,请参见补充信息3),如果有隐藏的混杂因素,则可能并非如此。要查看回归模型是否允许有因果解释,我们使用不变的因果预测58。该方法研究了回归模型在数据中不同的异质性模式(由不同的环境(即原始数据集的子集)编码)中是否稳定。理由是,如果反应变量的完整因果机制描述了一个因果模型,则对于环境的变化,如果后者不直接影响响应变量13,59,则应该是不变的。其他非因果模型也可能是不变的,但是非不变模型不能被视为因果关系。

  如何选择环境是必须满足以下标准的建模选择。首先,应该可以将每个数据点分配给一个环境。其次,环境应在数据中诱导异质性,以便例如预测变量在环境之间具有不同的分布。第三,尽管响应的分布仍可能在环境之间发生变化,但环境不得直接影响响应变量。第三个标准可以通过专家知识来验证,并被认为可以进行我们的分析。另外,如果违反它,则通常没有集合是不变的58,可以从数据中检测到。

  在我们的分析中,我们将每个数据点(即每个站点)分配给两个环境之一(原始数据集的两个子集):第一个包括北美,欧洲或亚洲的森林遗址;第二个包括来自南美,非洲或大洋洲的非森林和森林生态系统,以及来自北美,欧洲或亚洲的非森林生态系统(有关详细信息,请参见补充信息3.1.3.1)。我们的选择满足了该方法的假设,即两个环境之间的预测因子的分布是不同的(即它们在数据中诱导异质性;请参见补充图3.1)。太小或太均匀的环境没有提供任何证据,以反对整个协变量是一组因果预测因素的候选者。除了这里提出的环境外,其他选择会产生一致的结果(补充信息3.2.1,补充图3.4)。

  对于每个预测因子的每个子集,我们测试相应的回归模型是否不变(在每个环境中产生相同的模型)。尽管许多模型被拒绝并被认为是非不变的,但完整的模型(具有所有九个预测因子并在预测性变量分析中使用)被接受为不变性,建立了整个协变量,作为一组直接因果预测变量的合理候选者。我们同时使用了RF(R60中的RandomForest软件包)和广义添加剂模型,GAM61(MGCV Package62中的MGCV Package62)来适合模型。两种方法都会取得可比的结果,但RF:GAM的平均性能更高,与PC1的RF相比,结果稍好,而对于PC2和PC3 RF,RF的效果稍好,则显示出更好的模型性能(补充表3.1,补充信息3.2.2)。因此,在主要文本中,我们仅显示了RF的结果(PC1除外)。

  如果确实,考虑的回归模型是因果关系,那么这使我们能够做出几个陈述。首先,我们可以通过测试拟合模型中各个预测因子的统计显着性来测试因果效应的存在。其次,我们可以使用拟合模型的响应曲线来定义具有因果解释的可变重要性度量。在主要文本中,我们将此变量的重要性称为“因果变量重要性”。有关详细信息,请参见补充信息3.1.2。更正式地,我们考虑了所有协变量(AGB,HC,Laimax,n%,Tair,Tair,VPD,Swin,Cswi和P)的联合干预措施下预测变量(主要组件)的期望值,并立即定义了重要性,我们量化了这种预期价值依赖于不同的协方差。我们将相同的分析应用于植被结构和气候协变量组(请参阅补充信息3.1.2.3,3.2.3中的“ groupwise差异重要性”)。

  补充信息3中描述了该方法论和结果的详细信息,我们还提供了有关环境变量选择以及用于测试不变性的统计测试的更多详细信息。基于不变性方法的概述如图3.1所示。

  我们运行了两种广泛使用的陆地表面模型:汉堡(JSBACH)的生物圈大气耦合方案(OCN)和Jena方案:

  动态的全球植被模型OCN是始终来自Orchidee Land表面模型的耦合陆碳和氮循环的模型。它在半小时的时间尺度上运行,并模拟昼夜碳,热和水交换以及氮痕量气体排放,这共同影响叶片面积指数,叶面氮,植被结构和生长的每日变化。该模型的主要目的是分析养分循环对土地 - 气候相互作用建模的长期(年际至际)的影响64,65。该模型可以在观察到的气象参数驱动或与全球循环模型耦合的情况下离线运行。

  JSBACH v.3是MPI地球系统模型66,67的陆地表面模型。该模型在半小时的时间步骤中运行,并模拟了与大气的动量,热,水和碳的昼夜净交换。假设PFT特异性设置的最大叶子面积指数和一组调节叶子面积指数的季节性过程的叶子面积和光合作用能力的每日变化源于预后方案。碳池是预后的,允许模拟净土地 - 大气碳交换的季节性过程。

  我们选择了OCN和JSBACH,因为它们是具有不同结构的广泛使用的陆地表面模型。JSBACH是用于研究地球系统Model67中土地和大气过程偶联的陆生能量,水和碳交换的简约表示。OCN也来自陆地表面模型Orchidee68,但它包括对植物生理学的更全面的表示,包括C和N Cycling63的紧密耦合的详细表示。这两种模型均有助于全球碳Project69的年度全球碳预算,并且与许多全球基准相比,性能良好。OCN在几种模型合成中进一步使用,这些模型综合,重点是变化N沉积与CO2受精之间的相互作用70,71,72。OCN和JSBACH均可在半小时的时间尺度上运行,并模拟净和总碳交换,水和能量通量,因此非常适合使用Eddy协方差数据来提取生态系统功能性能。

  模型是由半小时的气象变量(短波和长波向下通量,空气温度和湿度,降水,风速和大气二氧化碳浓度)驱动的。OCN是由N沉积字段驱动的73。根据现场观察,规定了植被类型,土壤质地和植物可用的水,但未使用其他特定于现场的参数化。两种模型在其生态系统储藏储存和生物地球化学池方面均均衡,通过在可用的现场年份反复循环。我们添加了随机噪声(平均等于0,标准偏差为5%的通量值),以模拟模型模拟模拟的通量,以模拟涡流协方差观测的随机噪声。不加噪声进行的额外测试仅显示对功能特性和生态系统功能空间的计算的边际影响。

  我们使用了48个通量网站的JSBACH和OCN模型的运行(补充表1)。对观察结果评估了模拟通量,以评估所选地点的模型的性能。从模型输出和每个站点中,我们使用上述相同的方法得出了生态系统函数。然后在三个数据集(FluxNet,OCN和JSBACH)上进行PCA分析,并仅限于用于运行模型的48个站点。我们仅在可用的参数化和高质量强迫的信息的站点子集上运行了模型。但是,不同的生态系统功能从模型结构和气候条件中出现。因此,即使使用较小的站点,我们也可以通过比较FluxNet的PCA结果和模型运行来评估模型是否重现陆生生态系统功能的关键维度。

  有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

左文资讯声明:未经许可,不得转载。