用弹性信号瞬时跟踪地震生长

2025-06-24 05:58来源:本站

  我们在用经验噪声增强的合成数据数据库上训练PEGSNET。对于数据库中的每个示例,每个站点位置的三组分波形如下。

  事件源位置是从两个不同深度(20和30 km)下从俯冲俯冲几何模型中提取的1,400个可能的位置随机挑选的。给定纬度,经度和深度,罢工和倾角由俯冲几何形状和耙子确定,从平均值= 90°,标准偏差为10°的正态分布中随机提取。事件最终MW是从最小= 5.5且最大= 10.0的均匀分布中得出的。我们故意选择不使用Gutenberg -Richter分布进行MW来避免在训练过程中采样偏差,通过该模型可以更好地估计一定程度的值,仅仅是因为它们在培训数据库中更为代表。最后,从MW开始,我们计算标量矩。

  给定M0,使用先前的工作5中描述的STF模型计算出伪经验STF,该模型包括乘法误差项,对于MW> 7.0的地震有效。总之,

  和:

  其中从平均值为零的高斯分布中绘制ε,标准偏差为0.15,n(t)是零平均值的高斯噪声时间序列的时间组成部分,而σ是n(t)的标准偏差。一词ε解释了给定M0的STF持续时间的可变性,而N(t)模拟了实际STFS5中观察到的噪声特征。在扩展数据中显示了不同幅度值的最终STF的示例图1。

  使用选定的源参数和STF,我们使用以前的工作14中描述的正常模式方法来计算源源周围约20°的空间域中的三组分合成波形。与相应的合成事件的STF相卷积,并乘以标量矩,以获得在每个站点在1 Hz采样的合成痕迹。最后,在2.0 MHz(Butterworth,两个电线杆,因果关系)和30.0 MHz(Butterworth,Butterworth,六杆,因果关系)之间进行痕迹过滤。最终的地震图长700秒以事件起源时间为中心。

  噪声数据库包括两个非连续时间间隔的259天的三成分波形:2011年1月至2011年10月(不包括2011年3月),2014年1月至2014年4月之间。这些间隔已被选为样品变量(季节性)噪声条件。我们注意到,噪声数据库跨越的时间范围与用于真实数据案例的任何地震没有重叠(扩展数据图10A)。我们首先将每日记录分为1小时的痕迹,然后应用有限的预处理,删除仪器响应,平均值和线性趋势,转换为加速度,并从20到1 Hz删除原始痕迹。最后,使用应用于合成地震图的相同带通滤波器(请参阅上一步)并存储。请注意,没有对所选噪声的水平和特征进行先验假设。相反,我们包括在指定周期范围内连续地震记录中发现的所有真实噪声条件。这是因为原则上,我们希望该模型能够在广泛的噪声条件下良好地概括。

  从上一步中描述的噪声数据库中,通过随机选择起始时间点提取噪声(长700 s)的实现。在此过程中,我们确保在培训,验证和测试集中使用不同的噪声数据。为了保持整个地震网络的噪声的空间连贯性,用于给定事件的所有站点都使用相同的时间间隔。然后将所选噪声轨迹添加到相应的加速度地震图中,以生成PEGSNET的最终输入数据。如果对于给定事件的选定时间窗口中的一个或多个站点,噪声数据不可用,我们通过将相应的最终跟踪振幅(噪声和钉)设置为输入数据中的零来丢弃这些站点。

  在被喂入PEGSNET之前,我们首先根据位置经度为每个示例的输入波形排序。我们发现这种方法是有效的,但是我们注意到,在深度学习中以有意义的方式连接站波形的问题是研究的活跃领域35。然后,根据给定事件的每个站点的理论P波到达时间(TP),我们将地震图的振幅设置为t≥TP的零。请注意,PEGSNET不会执行自身的P波波触发。相反,它依赖于理论的P波到达。在实时场景中,任何现有的P-波触发算法(是否基于机器学习)都可以用于在相应的站点设置开关,然后将数据传递给PEGSNET。

  为了限制非常嘈杂的迹线的影响并抑制高幅度(可能与背景区域地震性有关),我们使用±10 nm s -2的阈值进一步剪切了所得痕迹。根据计算出的无噪声合成数据库中发现的MW = 10地震的最大PEGS振幅选择该阈值。幅度最终通过10 nm s -2缩放,以促进优化器的收敛,同时,以保留有关跨地震网络的PEGS辐射模式的相对幅度的信息。最后,为了模拟缺少的数据和/或有问题的传感器,我们将每个事件的站点随机静音5%,将其设置为相应轨迹的振幅为零。

  卷积神经网络(CNN)起源于Neocognitron42,一旦发现反向传播过程43可用于计算有关网络权重的目标函数的梯度。CNN是神经网络的一种正规化形式,即它们所代表的功能空间更简单,它们比完全连接的神经网络更有效率。44。Deep CNN带来了计算机视觉的革命,并且在几乎每种最新的方法中都扮演着与Images识别和检测有关的任务45,46。在地球科学中,机器学习对数据驱动的发现有很强的潜力,发现以前未知的信号和隐藏在大量嘈杂的数据中的物理过程47,48。

  但是,我们注意到,我们选择的深度学习模型对古典机器学习模型提供了一个吸引人的框架,可以直接处理原始地震图。结果,此选择使我们能够探索一个不受构建先验功能的限制的较大功能空间,这是将经典机器学习模型应用于地震图数据的要求。

  深度学习在地震学中的成功应用提供了新的工具来推动小型地震信号的检测极限31,32和地震源参数的表征(幅度和位置)33,34,35,带有EEWS应用程序29,36,37。我们提出了一个深度学习模型PEGSNET,该模型受过训练,可以估算地震位置并在P波到达之前从PEGS数据中跟踪时间相关的幅度MW(T)。

  PEGSNET是一个深CNN,它结合了卷积层和完全连接的层序列(扩展数据图2A)。网络的输入是大小的多渠道图像(M,N,C),其中M为315(对应于以1 Hz采样的315-S长的痕迹),N是站点(74),C是使用的地震图组件的数量(三:三:东,北和垂直)。网络的输出是三个值,对应于矩幅度(MW),纬度(φ)和经度(λ),其中MW与时间有关。从数据中描述了用于从数据中学习MW(T)的培训策略。

  模型的第一部分(CNN)由八个卷积块组成。每个块由一个卷积层制成,具有一个整流的线性单元(Relu)激活函数,然后是辍学层。每个卷积层中的过滤器数量从32(块1-5)增加到64个(6-7块)到128(块8),以逐步提取输入数据的更详细的特征。每个卷积层使用固定的内核大小为3×3。我们使用空间辍学率,固定速率为4%,以减少训练组的过度拟合。从第4块开始添加最大池层,以将输入特征的总体维度降低4倍。然后将CNN的输出扁平并馈送到两个尺寸512的密集层的序列,而256具有Relu激活功能和标准脱落的速度为4%。完全连接的层执行高级推理,并将学习的功能映射到所需的输出。输出层由三个神经元组成,这些神经元通过双曲线切线激活函数(TANH)进行回归。下面详细讨论了MW(T),φ和λ的标记策略。网络中参数的总数为1,479,427。

  该模型的目的是跟踪给定地震从原点时间演变而来的时刻。已经制定了一种特定的学习策略来解决此任务(扩展数据图2)。

  标签。标签是φ,λ和时间依赖的MW。φ,λ简单地对应于每个事件的真实值。MW(T)是每个事件的STF的时间集成。如下一部分所述,该模型是通过随机扰动输入地震图的结尾时间来训练的,因此在给定的结束时间中,输入数据与当时的MW(t)值相关联。为了在输出层中强制执行TANH激活函数的作用,我们进一步扩展了所有标签,以通过min/max归一化落入[-1,1]间隔。

  学习时间依赖的力矩释放。为了让PEGSNET学习MW(T),我们在训练过程中随机扰动输入数据的启动时间(扩展数据图2C)。每次从数据集中提取一个示例时,从-315和0(s)之间的均匀分布中随机绘制一个值(T1)。T1是相对于地震起源时间(T0)的时间,与该示例所选地震图的起始时间相对应。在实践中,从数据库中的700秒长的地震图(以T0为中心),我们从T1到T2 = T1+315 S提取痕迹:对于T1 = -315 S,提取的痕迹在T0结束;对于T1 = 0 s,轨迹从T0开始,然后结束315 s。一旦选择了T1的值,将MW(T2)的值分配为此示例的相应标签(扩展数据图2D)。这使模型能够随着时间的推移而发展数据中的模式。

  训练。按照70/20/10的策略,完整的数据库(500,000个合成地震示例)分为培训(350,000)验证(100,000)和测试(50,000)。通过使用ADAM算法的默认参数(β1= 0.9和β2= 0.999)和0.001的学习速率,使用将网络培训了200个时期(使用尺寸512的批次)在设置的训练中进行了训练(使用尺寸512)。在每个时期结束时,对模型进行了测试,以评估学习性能并避免过度拟合的验证集(图2B)。学习后,选择了验证集上达到最佳性能(最低损失值)的模型作为最终模型。然后对最终模型进行测试集(因此,PEGSNET在训练过程中从未见过的数据)来评估其最终性能。

  一旦对PEGSNET进行了训练,就可以在实时场景中估算MW(T)。我们通过以下步骤评估了测试集上PEGSNET的潜伏期性能(扩展数据图4)。对于测试集中的每个示例,我们通过数据将一个315-S长的窗口[T1,T2 = T1+315 S]滑动,时间步长为1 s。启动窗口在地震起源时间T0(T2 = T0和T1 = T0 - 315 s)结束,最后窗口始于地震原点时间(T2 = T0+315 S和T1 = T0)。我们让PEGSNET在每个时间步骤预测MW(T2),从而逐步重建STF。PEGSNET进行的每个MW(T)估计仅在过去315 s中使用信息。也将相同的过程应用于真实数据(图3和扩展数据图10),以模拟数据的播放,就好像它们被实时馈送到PEGSNET一样。

  我们通过使用上述相同的数据库来研究PEGSNET的性能,但在输入数据中不包括噪声。无噪声合成数据的训练和测试提供了PEGSNET性能的上限。尽管该实验代表了现实世界应用程序几乎不可能的方案,但结果可以揭示我们模型或输入数据中的固有局限性。扩展数据图6a显示了测试集的精度图。如预期的那样,该模型能够以高精度和类似性能确定事件的最终MW,而不管事件的实际MW如何,除了早期。为了更详细地查看延迟性能,扩展数据图6b显示了残差的密度图作为整个无噪声测试集的时间的函数。误差大部分限制在±0.1之内,但在起源后的前10-15 s中相对较高。我们将这一观察结果与两个因素的组合联系起来:首先,在起源后的前15秒内,在地震网络中的很少的站点中,预计非常小的PEG幅度将部分归因于直接术语和引起的术语之间的取消效果。这可能会导致一个情况,即输入图像中很少有信息,并且模型最终可以预测这些早期标签的平均值。其次,地震网络几何形状可能不是在此时间窗口中记录PEG振幅的最佳选择。最后,我们注意到,在嘈杂的数据库中获得的结果观察到类似的行为(图2A,b),但延迟较高(30-40 s)。这突出了噪声在降低PEGSNET最佳性能中的作用。

  实际数据的预处理步骤紧密遵循以前工作中详细介绍的过程7。对于每个电台和每个组件:

  1。选择使用美国地质调查量(USGS)目录的源位置计算出的理论TP结尾的1 h长原始地震图(扩展数据);

  2。删除平均值;

  3。删除仪器响应并获得加速信号;

  4。低通30.0 MHz(Butterworth,六杆,因果关系);

  5。降至1 Hz;

  6。高通2.0 MHz(Butterworth,两极,因果);

  7。夹至±10 nm s -2,并按相同的值缩放;

  8。带有T≥TP的零的PAD,并选择以T0为中心的700 s长的痕量。

  此过程与用于生成合成数据库的过程相同,除了这里需要首先在p波到达时切割痕迹,以避免在仪器响应去除过程中p-波污染PEG。

  为了加快我们的测试过程(请参阅“测试策略”方法),将数据预处理一次,然后在每个时间步骤中将数据切成pegsnet的输入。在我们的模型的在线版本中,这是不可行的,因为每次流入新数据时都需要应用所有预处理步骤。我们模拟了Tohoku-oki数据上实时工作流程的条件,以评估潜在的差异,并在结果步骤中使用简化的工作流程进行简化的工作流程:在每个时间步骤中,我们在上述时间步骤中使用1-H-H-H-n-h-h-g-n-h-n-h-h-n-h-h-n-h-h-n-h-h-l-g-l-l-l-n-h--h-则要划分。我们发现,使用两个工作流获得的所得PEGSNET预测基本上是无法区分的(扩展数据图11)。

  我们在2003年1月以来发生的MW≥7的所有俯冲地震(距Megathrust 40公里以内的浸水机制)上测试了PEGSNET(距Megathrust 40 km之内),而无需考虑余震(扩展数据图10)。其中,2003 MW = 8.2北海道地震处于PEGSNET较低灵敏度极限8.3的边缘。对于此事件,PEGSNET在大约两分钟后估算了最终的MW(扩展数据图10b),这与以前在测试集中观察到的事件相似的事件一致(图2A)。但是,鉴于此事件的预期准确性和较高的错误,我们认为这些预测的可靠性降低了。对于较低的磁性事件,PEGSNET预测会趋向于6.5的噪声基线或永远不会超过其较低的灵敏度极限,证实来自MW <8.0地震的PEG与噪声基本上没有区别(扩展数据图10C – F)。深度学习降噪技术可去除噪声50可能会成功增强PEGSNET性能,并将成为未来工作的主题。

左文资讯声明:未经许可,不得转载。