2025-06-22 22:35来源:本站
We applied phylowave to four viral and bacterial pathogens: SARS-CoV-2 (n = 3,129 global whole-genome sequences), H3N2 (n = 1,476 global haemagglutinin (HA) sequences), B. pertussis (n = 1,248 whole-genome sequences from France) and M. tuberculosis (n = 998 whole-genome sequences from Samara,俄罗斯20)(图1B – E和扩展数据图3和4)。我们发现,对于每种病原体,Teylowave产生了具有明显适应性差异的谱系的证据,这是由具有离散指数动力学的遗传相关菌株的亚群证明的(图1B – E)。依次采用每种病原体,我们将谱系分配与现有的谱系定义进行了比较。
我们计算了调整后的RAND指数(ARI),以测量分类之间的一致性,考虑到随机群集21(图2和扩展数据图5)。1的ARI值对应于与先前定义的谱系的完美一致性,而如果随机分配簇,则预期值为0。我们发现,在病原体中,一致性水平很高(ARI范围为0.62–0.94)。例如,先前定义的SARS-COV-2变体(Alpha(B.1.1.7; 20i),Beta(B.1.351; 20H),Gamma(P.1。*; 20J),Delta(B.1.617.2/Ay。。次变量紧密匹配的天线层定义的谱系22,23(图2A和扩展数据图5)。FastBaps14(v.1.0.8)和treStructure15产生的谱系与这些预定义的谱系不一致(补充图3)。全局H3N2进化枝的现有定义也与Teylowave谱系紧密匹配(例如3C.3A,3C.2A3和3C.2A1B.1B),偶尔在出现的确切节点(例如3C,3C,3C.2和3C.3)中偶尔出现差异。Thylowave还确定了先前定义的百日咳枝枝(ARI = 0.63),其中包括由百日咳毒素(PTXP)和Fimbriae 3 Gene(FIM3)7的等位基因的变化所定义的。此外,TheroWave鉴定出三个额外的B.百日咳谱系,具有清晰的不同指数动态(图1D,粉红色,红色和紫色谱系),这些谱系先前尚未鉴定出来。最后,我们回收了结核分枝杆菌数据集中的已知谱系和sublineages(ARI = 0.92)20,24,25。
在整个病原体中,在数据集中的任何时间达到的最大患病率通常不到5%(例如,TheroWave在数据集中的任何时间达到5%)(例如,SARS-COV-2的ETA/B.1.525,MU/B.1.621和EU1的SARS-COV-2,SARS-COV-2,SARS-COV-2,H3N2和Central Asisian Indian Indian M. M. M. Tuber和East Andian M. M. Tubercissias Cavess 1* clades and Callades 1*当Thylowave可以识别离散谱系的确切限制将取决于潜在的患病率,采样水平和适应性差异。例如,我们通过大陆复制SARS-COV-2分析,我们获得了与先前确定的感兴趣的变体相匹配的天线谱系,这些变体主要包含在这些大陆上,并且在使用全球数据集时我们没有识别出我们在非洲的ETA/B.1.525(例如在非洲,MU/B.1.525),MU/B.1.621在Americas和Eu1 in Corecor and eu 1.627,28,28(28)这些发现表明,即使用于定义谱系的各种算法并不包括适合度作为度量标准的各种算法,即使先前识别离散谱系的尝试通常会导致具有不同适合度的谱系分类。
接下来,我们使用我们的逻辑增长模型估算了每个血统的适应性。尽管研究了整个病原体的趋势显着不同(图3A – D和补充图4-7),但这个简单的模型能够捕获每种病原体的谱系动力学。我们发现,每个新兴谱系的潜在适应性是非无效的,与确定具有真正不同水平的适应性的谱系一致(扩展数据图7)。我们进一步计算了每个人群中每个血统的实时适应性。尽管我们的模型估计了每个谱系的恒定适应性参数,但它们的实际适应性通过时间取决于当时其他谱系在循环。对于SARS-COV-2,我们发现对应于Omicron XBB1.5的谱系1具有最大的实时适应性,其次是谱系5和7,对应于Omicron Ba.5和Ba.1(图3E和扩展数据图7)。H3N2谱系的适应性在整个人群中更均匀,谱系在出现后平均持续3.9年29,30(图3F和扩展数据图7)。对于百日咳芽孢杆菌,我们的结果与先前的研究3相一致,并指出在1998年在法国31中实施了新的细胞疫苗后,出现了三个谱系(标记为1、2和3)(图3G和扩展数据图7)。这三个谱系具有所有百日咳菌株的最高适应性,指向新疫苗的谱系动力学上的免疫压力。结核分枝杆菌谱系适应性是探索的四种病原体中最稳定的,反映了其长期以来的种群。唯一的例外是谱系1和2的最新出现20(图3H和扩展数据图7)。这些血统在人群中急剧上升,每年相对适合度为1.0057(95%可靠间隔1.0055–1.0060)和1.00087(95%可信间隔1.00077-1.00098),谱系1和2。