2025-06-23 07:22来源:本站
我们使用全基因组shot弹枪方法对FV菌株7600和FOL应变4287(补充表1)进行了测序,并使用Arachne组装了序列(表1,参考文献6)。脚手架的染色体水平排序是通过将组件锚定在FV的遗传图上(参考文献7)或FOL的光学图(补充信息A和补充表2)来实现。我们预测了FOL和FV基因,并使用手动和自动注释的组合(补充信息B)重新注册了FG基因组的新组装。FOL基因组(60兆巴)比其最紧密相关的物种(42 MB)大约44%,比FG(36 MB)大65%,导致FOL中的蛋白质编码基因更多(表1)。
三个镰刀菌基因组的相关性得以产生大规模的明确比对(补充图1-3),并以很高的置信度(方法,补充信息C)确定直系同源基因集。平均而言,FOL和FV直系同源物显示91%的核苷酸序列身份,并且两者与FG对应物具有85%的身份(补充图4)。在这三个基因组中发现了超过9,000个保守的同步直系同源物。与其他子囊结构基因组相比,这些三种直系同源物对预测的转录因子(P = 2.6×10-6),裂解酶(P = 0.001)和跨膜转运蛋白(p = 7×10-9)(补充信息C和补充tables 3-8),与FG相关的结果。
镰刀菌种类产生多种二级代谢产物,包括对人类和其他哺乳动物毒性的霉菌毒素8。在这三个基因组中,我们确定了46个二级代谢产物生物合成(SMB)基因簇。微阵列分析证实了18 FG中的14个和16个FV SMB基因簇中的14个基因的共表达。在14个FG中,有10个FG中的10个FV共表达的SMB基因簇是新颖的(补充信息D,补充图5和补充表9以及在线材料),强调了未表征的二级代谢物对真菌生物学的潜在影响。
FOL的基因组组装有15个染色体,FV组件11和FG组件仅4个(表1)。FG中的染色体数量较少是相对于FV和FO染色体融合的结果,而FG匹配中的融合位点先前描述了高多样性区域(补充图3,参考文献5)。三个镰刀菌基因组之间的全球比较表明,FOL的基因组领土的增加是由于主要存在于多余的染色体中的其他独特序列。FOL中的同步区域覆盖了FG的大约80%,超过90%的FV基因组(补充信息E和补充表10),称为基因组的“核心”。除端粒型区域外,FV组件(41.1 Mb)中的所有11个映射染色体对应于FOL(41.8 MB)的15个染色体中的11个。除了一个染色体易位事件和一些局部重排(图2A)外,FOL和FV之间的基因的共线级一直保持在这些染色体中。
FOL的独特序列是指定为FOL谱系特异性(FOR LS)区域的大量组装(40%),以将其与保守的核心基因组区分开。LS区域包括四个整个染色体(染色体3、6、14和15),1和2染色体的一部分(分别为脚手架27和支架31),以及大多数未固定在光学图上的小脚手架(图2B)。总体而言,LS区域涵盖了19 MB,几乎占了所有较大的FOL基因组大小。
值得注意的是,LS区包含FOL基因组中可识别可识别的转座元素(TES)的74%以上,包括所有DNA转座子的95%(图2B,补充图6和补充表11)。与FV和FG基因组中的重复序列和最小TE的含量低相反(表1和补充表11),大约28%的整个FOR基因组被确定为重复序列(方法)(方法),包括许多恢复元素(包括许多循环元素(类似于copia和Gypsy的ltr retrotransposs),核定的核定元素,核定元素,核定元素(核定元素),并介绍了核定元素(核)(核)(核)(DNA转座子(TC1-Mariner,类似帽子,突变器和螨虫)(补充信息E.3)以及几个大的分段重复。染色体内和两个染色体间节段重复,总计7 Mb,导致某些区域的三个或什至四倍的重复(这些区域总体上,这些区域共享99%的序列身份(补充图7),表示最近重复发生。
FOR LS区域中只有20%的预测基因可以根据已知蛋白质同源性进行功能分类。对于功能类别的“分泌效应子和毒力因子”,“转录因子”和“涉及信号转导的蛋白质”的功能类别,这些基因显着富集(p <0.0001),但在房屋保存功能(补充信息E和补充表12-18)的基因中缺乏。在具有致病性相关的预测功能的基因中,有已知的效应蛋白(见下文)以及坏死和乙烯诱导的肽9,以及预计可降级或修饰植物或真菌细胞壁(补充信息E和补充表14、15)的各种分泌酶。值得注意的是,这些酶中的许多是在番茄根感染的早期阶段表达的(补充表15、16和补充图8)。脂质代谢和脂质衍生的次级信使的基因扩展表明,脂质信号传导在真菌致病性中的重要作用(补充图9和补充表13,17)。与FTF1有关的转录因子序列的家族,该基因在氧气孢子菌F. f. oxysporum f的早期阶段专门转录。sp。execealli(补充信息E和补充表4;参考文献10)也被扩展。
最近发表的F. solani11的基因组是一种更具分歧的物种,使我们能够将比较分析扩展到更大的进化框架(图1)。尽管“核心”基因组在所有四个测序的镰刀菌种类中都充分保守,但在FS中也没有LS区域(补充图2)。此外,FS的三个LS染色体不同于基因组核心11和LS区域。总之,四个镰刀菌种中的每个物种都具有高度同步的核心基因组,而FOL和FS的LS染色体都与与宿主 - 病原体相互作用有关的重复序列和基因不同。
考虑了FOL基因组中LS区域起源的三个可能的解释:(1)在四种镰刀菌物种的最后一个共同祖先中存在LS区域,但随后在垂直传播期间有选择地且独立地丢失了FV,FV和FS谱系;(2)LS区域源于核心谱系内的重复和差异。(3)通过水平转移获得LS区域。为了区分这些假设,我们比较了FOR LS区域的基因的序列特征与夫妻核心区域中基因的序列特征和其他丝状真菌中的基因。如果FOL LS基因在其他镰刀菌种类或FOL核心区域的旁系同源物中具有清晰的直系同源物,则将分别使用垂直传播或复制,并以发散假设进行重复。我们发现,尽管核心区域中有90%的FOR基因在其他两个镰刀菌基因组中具有同源物,但在FOL LS区域上约有50%的基因缺乏FV或FG中的同源物(1×10-20)。此外,与FOL和FG直系同源物相比,核心区域的FOL和FV直系同源物之间的序列差异较小(图3A),与物种系统发育一致。相比之下,在其他镰刀菌种类中具有同源物的LS基因与FV和FG基因均大致相同(图3B),表明LS基因的系统发育史与基因组核心区域的基因不同。
密码子使用表和密码子适应指数(CAI)分析均表明,与FV基因组中的保守基因和基因相比,LS编码基因均表现出明显的密码子使用(补充信息E.5,补充图10和补充表19),进一步支持了其独特的进化起源。观察到氨基酸GLN,Cys,Ala,Gly,Val,Glu和Thr的最显着差异,并且在FOL LS基因中偏爱G和C而不是A和T(补充表20)。这种GC偏置也反映在其第三个密码子位置的GC含量稍高(补充图11)中。
在NCBI蛋白组中具有同源物的1,285种LS编码蛋白中,几乎所有(93%)对其他伴随的comycete真菌的爆炸量最高(补充图12),表明fol LS区域是真菌起源的。系统发育分析基于362个蛋白的串联取样,这些蛋白在七个选定的子囊菌基因组中共享同源物,包括四个测序的镰刀菌基因组,Magnaporthe grisea12,neurospora crassa13和neurospora crassa13和aspergillus nidulans14,它们的基本属于Fg for for for for for for for for for for and for and for and for and for and for and for and for and fusal for and for and for and for and for and。(图3C,补充表21)。综上所述,我们得出的结论是,从另一个镰刀菌物种中的水平获取是对For LS地区起源的最简约的解释。
F. oxysporum被认为是一种物种复合物,由许多不同的无性谱系组成,这些谱系可能对不同的宿主或非致病性具有致病性。通过Illumina测序FO菌株FO5176(一种拟南芥15的病原体)和EST(表达的序列TAG)序列,从具有不同宿主特异性的FO菌株之间的序列序列有很大差异。sp。Vasinfectum16,一种棉的病原体(补充信息E.2)。尽管FOL和FO5176共享序列之间的总序列差异不到2%(补充图13A),但对于FOL LS区域的大多数序列,FO5176中没有对应物。(补充图13b)。同样,FOV EST序列16对FOL基因组具有很高的核苷酸序列身份(平均99%),但仅与FOL的核心区域相匹配(补充信息E.2)。FO内的大规模基因组多态性也通过菌株之间的核型差异(补充图14)17可以明显看出。以前,在真菌nectria haematococca18和替代品替代品中,已经报道了赋予宿主特异性毒力的小,多态和有条件的可支配染色体。在非病原F. oxysporum分离株(补充图14)中,小(<2.3 Mb)和可变染色体不存在,这表明FOR LS染色体也可能特别参与致病性适应性。
有充分的文献证明,在将番茄Xylem System20,21定居期间分泌小蛋白质,其中至少两种,Six1(AVR3)和Six3(AVR2)(AVR2)参与了毒力功能22,23。有趣的是,这些蛋白质的基因以及植物分泌的氧化还原酶(ORX1)20中的基因位于14号染色体上,是LS LS染色体之一。这些基因均在引起番茄枯萎的菌株中保守,但通常不存在其他菌株24。基因组数据使基于先前获得的质谱数据的数据,可以鉴定出14号染色体上的三个额外小蛋白中的三个小型基因(染色体蛋白),称为Six5,Six6和Six7(补充表22)。这七个基因一起可以用作标记,以识别固定在14号染色体(补充表23和补充图15)的三个超脑(SC 22、36和51)中的每个基因。
鉴于实验发现和计算证据的综合,我们提出LS染色体14可能是FOL对番茄的致病性,并且其菌株之间的迁移率可以解释其在番茄枯萎病原体中的存在,其中包括几种克隆谱系,其中包括几种在FO物种中多型物种复合物中的多态性,但在其他线虫中不存在。24。为了检验这些假设,我们研究了是否可以转移14染色体,以及转移是否会在不同的FO菌株之间转移致病性,并使用14号染色体上的植物分泌蛋白中的基因作为标记。FOL007是能够引起番茄枯萎的菌株,分别与非致病分离株(FO-47)共同孵育,另外两种对瓜(FOM)或香蕉(FOC)(foc)的菌株分别与其他两种菌株共孵育。将对Zeocin(BLE)抗性的基因插入接近SIX1的抗性,作为选择以从供体应变转移到FO-47,FOM或FOC的标记。接收菌株用随机插入基因组的湿霉素耐药基因(HYG)转化。每个受体菌株选择了三种独立的抗霉素转化体。分离出不同菌株的微细化症,并在琼脂板上以1:1的比例混合。孵育6-8天后出现在这些板上的孢子,以抗zeocin和hygromycin的耐药性。用FOM和FO-47回收了双重抗药性菌落,但不使用FOC作为受体,以大约0.1至10万孢子的频率(补充表24)。
致病性测定表明,与FO-47(称为FO-47+)共同孵育的FOL 007衍生出的双重抗性菌株已经获得了将番茄感染到各种程度的能力(图4A,B)。相比之下,源自与FOM的FOL 007衍生出的双重抗药性菌株能够感染番茄。所有FO-47+菌株均包含14个FOL染色体的大部分,如PCR扩增七个基因标记物所证明(图4C,补充图15和补充信息F)。亲本菌株以及测序的菌株FOL4287都有不同的核型。这使我们能够用染色体电泳确定FOL007的整个染色体14染色体是否被转移到FO-47+菌株中。所有FO-47+菌株的核型都与FO-47相同,除了存在一个或两个附加的小染色体(图4D)。所有FO-47+菌株中存在的染色体(图4D,箭头1)被证实是FOL 007的14染色体,该染色体是基于其大小和使用SIX6探针的南部杂交(图4E)的(图4E)。有趣的是,导致最高水平的疾病(图4a,b)的两种双重抗药性菌株(FO-47+ 1C和FO-47+ 2a)具有第二个额外的染色体,大小对应于供体菌株中最小的染色体(图4D,图4D,箭头编号2)。
为了严格评估14号染色体以外的其他遗传物质是否可能已从FOL007转移到FO-47+菌株中,我们开发了PCR引物,以扩增FOL007但没有FO-47的29个染色体特异性标记。这些标记物(每个染色体的平均两个)用于筛选FO-47+菌株的存在,以在FOL 007衍生的基因组区域的存在下(补充信息F.4和补充图16)。所有FO-47+菌株均显示出具有14个染色体标记(补充图17),但没有位于任何核心染色体上的FOL007标记,证实核心染色体未转移。Interestingly, the two Fo-47+ strains (1C and 2A) that have the second small chromosome and caused more disease symptoms were also positive for an additional Fol007 marker (Supplementary Fig. 17), associated with a large duplicated LS region in Fol4287: scaffold 18 (1.3 Mb on chromosome 3) and scaffold 21 (1.0 Mb on chromosome 6) (Fig. 2c).在散布在该区域上的遗传标记,用另外9个引物对确认了菌株和2a的大部分或全部支架序列18/21的存在(数据未显示,请参见补充表25a,b对于引物序列)(图4d)。
综上所述,我们得出的结论是,FO-47+菌株对番茄的致病性可以特别归因于获得FOL染色体14的获取,该染色体包含所有已知基因,用于植物分泌的蛋白质中的小基因。此外,其他LS染色体上的基因可能会进一步增强毒力,如含有FOL 007的额外LS染色体的两种菌株所证明的那样。在FOL007背景中,我们没有找到具有FO-47标记的FO-47染色体的双重抗药性菌株。同样,与FO-47共孵育时,FOL007的随机标记转换剂不会引起任何抗药菌落(数据未显示)。这表明菌株之间的转移可能仅限于某些染色体,可能由各种因素决定,包括染色体的大小和TE含量。它们的转移倾向得到了以下事实的支持:FOL007中最小的LS染色体转移到FO-47中,而没有在九种情况下的两种情况下被选为耐药性。