全球海洋微生物组的生物合成潜力

2025-06-24 18:16来源:本站

  包括主要海洋测量和时间序列研究的宏基因组数据集,包括足够的测序深度,以最大程度地覆盖整个海洋盆地,深度层和时间的全球海洋微生物群落的覆盖范围。这些数据集(补充表1和图1)包括来自Tara Ocean收集的样品的宏基因组(病毒 - 富含病毒,n = 190;和质子核酸酯富集,n = 180)12,22,生物地球群,探险(n = 480)(n = 480),夏威夷海洋时代(HAWAIIAN OELIAS TIMESIISE),n = 68)(蝙蝠,n = 62)21和Malaspina Expedition(n = 58)23。通过bbmap(v.38.71)删除从读取中的测序适配器,删除映射到质量控制序列(PHIX基因组)的读取,并使用质量低质量读取的读取,使用映射到质量控制序列(PHIX基因组),并使用参数= 20,maxns = 20,最大质量= 45。读取或如果指定,合并的质量控制的读取(bbmerge.sh minoverlap = 16)。在将质量控制的读数(bbnorm.sh target = 40,mindepth = 0)进行标准化之前,在将它们与metaspades组装在一起之前(v.3.11.1或v.3.12(如果需要))53。最终按长度(≥1kb)过滤所得的脚手架重叠群(以下脚手架)。

  The 1,038 metagenomic samples were grouped into several sets and, for each sample set, the quality-controlled metagenomic reads from all samples were individually mapped against the scaffolds of each sample, resulting in the following numbers of pairwise readset to scaffold mappings: Tara Oceans virus-enriched (190 × 190), prokaryote-enriched (180 × 180),生物地球,热和蝙蝠(610×610)和Malaspina(58×58)。使用Burrows-wheeler-Aligner(BWA)(V.0.7.17-R1188)54进行映射,允许读取在辅助站点(带有-a标志)上映射。对齐对准至少为45个碱基,身份≥97%,覆盖≥80%的读取顺序。使用JGI_SUMMARIZE_BAM_CONTIG_DEPTHS metaBAT2(v.2.12.1)55处理所得的BAM文件,以提供每个脚手架内和样本之间的覆盖范围。最终,通过在所有样品上运行metabat2的参数(Mincontig 2000)和 - 最大限额500,以提高灵敏度。我们使用了metabat2代替集成式套件方法,因为它被证明是独立基准中表现最好的单个Binner56中表现最好的单个Binner,并且发现比其他常规Binners57快10至50倍。为了测试丰度相关的影响,元基因组的随机选择子样本(来自两个Tara Ocean数据集的10个,10个来自生物地点的10个,每个时间序列中的5个,Malaspina的5个)仅使用样本内覆盖信息(补充信息)。

  在下游分析中包括其他(外部)基因组,即来自Gorg DataSet20的Tara Oceans DataSet26的子集的830个手动策划的MAG,以及1,707个分离株的5,287个SAG,以及Marardbases(Mardb V.4)的1,707个分离株和682个SAG。对于MARDB数据集,如果样本类型匹配以下正则表达式,则根据可用元数据选择基因组:“ [s | s] Ingle。

  使用CheckM(V.1.0.13)和Anvi’o(V.5.5.5.0)58,59的“谱系工作流”评估每个元基因组箱和外部基因组的质量。如果CheckM或Anvi’o报告的完整性/完成≥50%,污染/冗余性≤10%,则将宏基因组箱和外部基因组保留进行下游分析。然后将这些指标汇总为平均完整性(MCPL)和平均污染值(MCTN)值,以根据社区标准对基因组质量进行分类60:高质量:MCPL≥90%和MCTN≤5%;良好的质量:MCPL≥70%和MCTN≤10%;中等质量:MCPL≥50%和MCTN≤10%;公平质量:MCPL≤90%或MCTN≥10%。过滤的基因组进一步归因于质量评分(Q和Q'),如下所示:Q = MCPL - 5×MCTN;Q'= MCPL - 5×MCTN+MCTN×(应变异质性)/100+0.5×log [N50](如DREP61实现)。

  为了允许在不同的数据资源和基因组类型之间进行比较分析(MAG,SAGS和REFS),使用DREP(v.2.5.4)61的整个基因组平均核苷酸同一性(ANI)进行了全套34,799个基因组,以95%的ANI thershold28,62(-con)0.1000-con 0-con 0-con 0-con 0.con 0.con 0.2.5.4)。单拷贝标记基因使用Speci63,提供基因组的物种水平聚类。根据每个DREP群集定义的最高质量评分(Q')选择代表性基因组,这被认为是物种成员的代理。

  为了估计映射速率,使用BWA中包含的34,799个基因组绘制了所有1,038个元基因组读数集(v.0.7.17.17 -R1188,-a)。将质量控制的读取以单端模式映射,并过滤所得的比对以保持长度≥45bp的比对,并且身份≥95%。按样本映射率是过滤后仍保留的读取百分比除以质量控制的读数的总数。使用相同的方法,将1,038个宏基因组中的每一个都降低至500万个插入片段(扩展数据图1C),并将其映射到OMD和所有GEM16中的Gorg下垂。从海水中回收的GEM Catalogue16中的MAG数量是根据对元基因组来源的关键字查询确定的,选择了海水样品(例如,与海洋沉积物相对)。具体来说,我们选择了“水生”作为“生态系统_CATAGERY”,“海洋”作为“生态系统_TYPE”,然后将“深海”,“海洋海洋”,“海洋海洋”,“ Pelagic Marine”,“海洋海洋”,“海水”,“海水”,“海洋”,“海洋”,“ Seawater”,“ Seper Speewater”,“ Seper Spericated Seapeater”。这导致了5,903个MAG(734个高质量),分布在1,823个OTU(这里,物种)上。

  使用GTDB-TK(v.1.0.2)64对原核基因组进行分类注释,其默认参数针对GTDB R89 Release13。ANVI’O根据域的预测和完成≥50%和冗余≤10%来鉴定真核基因组。物种的分类注释被定义为其代表性基因组之一。除了真核生物(148个MAG)外,每个基因组都通过首先使用Prokka(v.1.14.5)65调用完整基因(与“古细菌”或“细菌”参数”为适当指定为适当指定的完整基因,在其他基因组中也报告了非编码基因和CRISPR区域。通过使用FetchMGS(V.1.2)66鉴定通用的单拷贝标记基因(USCMGS)来注释预测的基因,该基因基于Emapper(v.2.0.1)67分配了基于Eggnog(V.5.50)68的直系同源群体(v.2.0.1)68,并针对KEGG DATAbase(Release Database(Release Database)进行查询(Release 2020-2020-02-102-10)69。最后一步是使用钻石(V.0.9.30)70将蛋白质与KEGG数据库对齐,并具有查询和主题覆盖范围≥70%。根据NCBI原核生物基因组注释Pipeline71,基于比特孔的最大预期比特孔的≥50%(参考本身)进一步过滤结果。该基因序列还用作输入,用于使用抗施加剂(V.5.1.0)72在基因组中识别BGC,默认参数和不同的群集爆炸打开。所有基因组和注释均与上下文元数据一起汇编成OMD,可以在线获得(https://microbiomics.io/ocean/)。

  与以前描述的方法相似12,22,我们从OMD的细菌和古细菌基因组中聚集了5660万个蛋白质编码基因,使用CD-HIT(v.4.8.1)73至1770万基因群集,较短基因的覆盖率为95%,较短基因的覆盖率为90%。最长的序列被选为每个基因簇的代表基因。然后将1,038个宏基因组映射到具有BWA(-a)的> 1770万个集群代表,并将所得的BAM文件过滤以仅保留≥95%和≥45个基碱基百分比身份的比对。长度归一化的基因丰度是通过最佳独特对准的首先计数插入物来计算得出的,然后对于模棱两可的映射插入物,将分数计数添加到各个目标基因与其独特的插入丰度成比例。

  扩展OMD中的基因组(与“ Ca. eudorpoomaciaceae”的其他MAG进行增强,请参见下文)中添加到宏基因组分析工具Motus74的数据库(v.2.5.1)中,以生成扩展的MOTUS参考数据库。仅保留了十个USCMG中至少六个的基因组(23,528个基因组)。数据库的扩展产生了4,494个其他物种级别的簇。使用Motus的默认参数(v.2)进行了1,038个宏基因组的分析。根据MOTU曲线,未检测到644个MOTU簇内的989个基因组(95%的REF,5%的下垂和99.9%的MARDB)。这反映了MARDB基因组的各种其他海洋分离源(未检测到的大多数基因组与从例如沉积物,海洋宿主分离的生物有关)。为了在这项研究中关注开阔的海洋环境,如果未检测到或未包括在本研究中建立的扩展MOTU数据库中,我们将它们排除在下游分析之外。

  将OMD中的MAG,下垂和REF的所有BGC与在所有元基因组支架(Antismash V.5.0,默认参数)中识别的BGC(见上文)结合使用,并用大型(v.1.1)处理(v.1.1)的特征(PFAM域)提取75。根据这些功能,我们分别使用0.2和0.8距离阈值计算了BGC之间的全面余弦距离,并将其聚类为GCF和GCC。这些阈值是对先前与欧几里得距离距离的阈值的适应,从而减轻了原始大型聚类策略(补充信息)的某些偏见。

  随后对BGC进行了过滤,仅保留了在脚手架上编码≥5kb上的bgc,以降低以前完成的破碎风险,而排除了在1,038个巨元中未检测到的MardB Refs和SAGS(请参见上文)。这导致了由OMD基因组编码的39,055 bgc,并在元基因组片段上鉴定出14,106个(即未归纳为MAGS)。这些“元基因组” BGC用于估计数据库未捕获的海洋微生物组生物合成潜力的比例(补充信息)。每个BGC的功能是基于预测的产品类型,如大型Scape76所定义的预测产品类型所定义的。为了防止定量分析中的采样偏差(GCC/GCF,GCF和GCC距离的分类学和功能组成与参考数据库以及GCF宏基因组丰度),39,055 bgc仅通过将最长的bgc bgc/bgc rede缩放为每种gcf,均一以17.68的速度来重复。

  GCC和GCFS的新颖性是根据与计算预测数据库(Big-Fam中的RefSeq数据库的距离)进行估计的29,并经过实验验证(Mibig 2.0)30 BGC。对于17,689个代表性BGC中的每一个,我们选择了与各个数据库的最小余弦距离。然后根据适当地将这些最小距离(平均)平均(平均)平均(平均值)。如果数据库的距离高于0.2,则认为GCF是新颖的,这对应于(平均)GCF和参考之间的完全分离。对于GCC,我们选择了0.4,是GCF定义阈值的两倍,以捕获参考的远程关系。

  BGC的宏基因组丰度估计为其生物合成基因的中位数(由Antismash定义),可从基因级谱获得。随后将每个GCF或GCC的宏基因组丰度计算为其代表性BGC的总和(在17,689中)。随后使用每个样品的MOTU计数将这些丰度分布量化,这也解释了测序工作22,74(扩展数据图1D)。GCF或GCC的患病率是计算为> 0的样品的百分比。

  根据归一化的GCF轮廓计算样品之间的欧几里得距离。这些距离使用UMAP77在尺寸上降低,并将所得嵌入用于使用HDBSCAN78的无监督密度聚类。通过最大化累积群集成员身份概率来确定群集的最佳最小点(以及HDBSCAN使用的簇数)。测试了这些群集的识别簇(以及这些簇的随机平衡子样本,以说明方差置换多变量分析(PermanOva)中的偏差(使用Pertaneova)针对非还原欧几里得距离的显着性。样品的平均基因组大小是根据MOTU的相对丰度和成员基因组的估计基因组大小计算的。具体而言,每个MOTU的平均基因组大小估计为完整性校正尺寸的平均值(例如,其成员基因组的75%完整基因组的校正大小为4 Mb为4 Mb(过滤后平均完整性为≥70%的基因组过滤后)。然后,根据样品,将平均基因组大小计算为相对丰度加权MOTU基因组大小的总和。

  OMD中基因组编码的BGC的过滤集(在≥5kb的脚手架中,排除了1,038个宏基因组中未检测到的Mardb Refs和SAG,同时在GTDB细菌和天主树上显示了gtdb phylogengengengengengengogengengengengengengengengengengengengengengengengengengengengengengengengogengengengengogengengengengengengengengengengengengengengengengengengengengengengengengengecneal of the the Press of the of gnyom of Genome of genome of genogenem of genyom。我们首先使用该物种中大多数BGC作为代表性的大多数BGC使用基因组来减少数据。为了进行可视化,代表进一步沿着树上进行了归纳,同样,对于每个集合进化枝,含有最多BGC的基因组被选为代表性。通过计算这些BGC中编码的产品类型的香农多样性指数,进一步分析了富含BGC的物种(至少一个具有> 15 BGC的基因组)。如果所有预测的产品类型相同,则化学杂种和其他复杂的BGC(如抗抗菌所预测)被认为是来自相同的产品类型(例如它们在簇中的顺序(例如,蛋白蛋白蛋白蛋白蛋白 - 霉素杂种杂交杂种都与细菌蛋白 - 蛋白质 - 蛋白酶H植物相同)。

  剩余的DNA(估计为6 ng)来自样品Malaspina MP1648,对应于BioSample SAMN05421555,并匹配简短读取Illumina imlumina iclimina impragenomic读取集SRR3962772,用于使用超级pacbio测序方案,以生成> 20 gb hifi kebio keb hifib hifib hifi kebio thebio smr smr thebioGDNA样品扩增试剂盒(100-980-000)和SMRTBELL Express模板准备套件2.0(100-938-900)。简而言之,其余的DNA使用Covaris(G-Tube,52104)进行修复和纯化(ProNex珠)。然后将纯化的DNA在最终纯化步骤(PRONEX珠子)和续集II平台上进行测序,然后在续集II平台上进行纯化的DNA库准备,放大,纯化,纯化(ProNex珠)和尺寸选择(> 6 kb,蓝色Pippin)。

  重建前两个‘ca。Eremiobacterota'MAGS,我们确定了六个额外的ANI> 99%(其中包含在图3中)最初是根据污染估计来滤除的(后来被确定为基因重复,请参见下文)。我们还回收了被确定为'ca的垃圾箱。来自不同的研究23的eremiobacterota’,并将其与我们研究的八个MAG一起用作元基因组读取的二核映射(500万读)的参考,用于使用BWA(v.0.7.17.17-r1188,-a,-a,-a)的633个真核生物 - 富含(>0.8μm)的样品。根据富集的特定映射(在95%的比对身份和80%的读取覆盖范围过滤之后),选择了10个宏基因组(预期覆盖范围,≥5倍)进行组装和49个额外的元基因组(预期覆盖范围,≥1×)用于丰度相关。使用与上述相同的参数,对这些样品进行了任何汇合,并附加了10个'Ca。回收了Eremiobactero的魔术。这16个MAG(不包括数据库中的两个)将扩展OMD中的基因组总数提高到34,815。根据其基因组相似性和GTDB放置,将MAG分配给分类等级。在同一家族中,使用DREP使用DREP将18个MAG逐渐消失,分为5种(Anis内部的Anis内部> 99%)和3属属(内部Anis内的ANIS范围在85%至94%之间)79。物种代表是根据完整性,污染和N50手动选择的。拟议的命名提供在补充信息中。

  评估‘ca的完整性和污染。Eremiobacterota的Mags,除了CheckM和Anvi'o使用的谱系和特定于域的单拷贝标记基因集外,我们还评估了USCMG的存在。系统发育重建(见下文)证实了40个USCMG中2个重复的鉴定,以排除任何潜在的污染(根据这40个标记基因,这将与5%相对应)。对五'Ca的代表性杂志的进一步检查。通过使用ANVI'O Interactive界面59,Eremiobacterota的物种根据丰度相关和序列组成(补充信息)证实了这些重建基因组中污染物的较低率。

  对于系统基因分析,我们选择了五个'Ca的代表性MAG。eudorpemociaceae’物种,全部'ca。GTDB(R89)13可提供的Eremiobacterota的基因组和其他门的代表(包括UBP13,Armatimonadota,Patescibacteria,dormibibacterota,chloroflexota,cyloroflexota,cyanobacteria,cyanobacteria,cyanobacteria,cyanobacteria,statibacteria and Planctomcetota and Planctomycetota)。如前所述,对所有这些基因组进行了注释,以提取单拷贝标记基因和注释BGC。根据上述完整性和污染标准,保留了GTDB基因组。使用ANVI'O系统基因组学工作流进行系统基因分析59。这棵树是用iqtree(v.2.0.3)(默认参数和-bb 1000)80在39(肌肉,v.3.8.1551)上构建的39个由ANVI'O鉴定的串联核糖体蛋白中的81个,并至少在基于基于基于基于基于基础的位置的位置,并使用了基于50%的位置。树拓扑。使用相同的工具和参数构建了40个USCMG的单个树。

  我们使用特征(V.1.1.2)和默认参数(表型,从核苷酸)83来预测一般微生物性状。我们根据先前开发的掠食性索引84研究了潜在的掠食性生活方式,该指数依赖于基因组的蛋白质编码基因含量。具体而言,我们使用钻石将蛋白质从基因组与Orthomcl数据库(v.4)85进行比较,使用参数 - 对可能的 - 敏感 - ID 25- Query-cover 70-主题覆盖的70-TOP 20,并计算与抗掠食性和非预性标记基因相匹配的基因。指数是掠夺性标记和非鉴定标记的数量之间的差异。作为额外的控制,我们还分析了'ca的基因组。Entotheonella的因子TSY118基于其与'ca相似的特征。eudorpemrobium’(大基因组大小和生物合成潜力)。我们进一步测试了掠食性和非辅助标记基因与'ca的生物合成潜力之间的潜在联系。eudorpemocyrobiaceae’,并发现最多一个基因(从任何一种类型的基因,即标记基因的掠食性/不介导性)与BGC重叠,这表明BGC不会混淆掠食性信号。对基因组进行了特定研究的基因组的其他注释,使用TXSSCAN(V.1.0.2)进行无序的复制子86进行了pili和鞭毛。

  转录组分析是通过将来自Tara Oceans原核 - 和真核生物富含的分数的623个元转录组绘制的22,40,87(使用BWA,V.0.7.17-R1188,-a FLAG)的623个元转录组。eudorpemociaceae的基因组。在80%的读取覆盖范围和95%的身份过滤后,使用featurecounts(v.2.0.1)88(使用参数farmaturecounts -primary -o -o -o -fraction -fraction -fraction -fraction -t cds,tRNA -F gtf -g id -p -p)处理BAM文件。将所得的轮廓标准化为基因长度和MOTU标记基因丰富度(中值长度归一化的插入计数,插入数为> 0)和log2-Transformed22,74,以获得每个基因的相对人均每个基因表达水平,这也说明了测序工作中样本间差异的相对差异。这种比率可以通过减轻相对丰度数据的组成性问题来进行比较分析。仅考虑10个MOTU标记基因中的5个样品进行进一步分析,以确保检测到大量的基因组。

  'ca的归一化转录谱。E. taraoceanii’是使用UMAP减少尺寸的,所得的表示用于使用HDBSCAN(请参见上文)来识别表达状态的无监督聚类。在原始(非还原)距离空间中,Permanova测试了已确定的簇之间差异的重要性。这些状态之间的差异表达在基因组(见上文)和6个官能团中的201个KEGG途径中进行了测试,即来自TXSSCAN的BGC,分泌系统和鞭毛基因,来自Prokka和Prokka以及来自Prokka的降解酶(蛋白酶和肽酶),来自Prokka,捕食性和非养育标记。对于每个样本,我们计算了每个类别的中值表达(请注意,BGC表达本身是该BGC的生物合成基因的中值表达),并在不同状态下测试了显着性(FDR校正后的Kruskal – Wallis检验)。

  合成基因是从Genscript购买的,并从Microsynth订购了PCR引物。来自Thermo Fisher科学的渗入聚合酶用于DNA扩增。核蛋白质粒和核蛋白凝胶以及来自Macherey-Nagel的PCR清理套件用于纯化DNA。限制性酶和T4 DNA连接酶购自新英格兰生物群。除了异丙基-β-1-1-硫代乙型丙糖苷(IPTG)(Biosynth)和1,4-二硫代硫醇(DTT,Applichem)外,化学药品是从Sigma-Aldrich购买的,除了未能进一步纯化。从Applichem购买了抗生素氯霉素(CM),Spectinomycin二羟基氯化物(SM),氨苄青霉素(AMP),庆大霉素(GT)和Carbenicillin(CBN)。中型成分Bacto pryptone和Bacto酵母提取物购自BD Biosciences。测序级胰蛋白酶购自Promega。

  从Antismash预测的'Ca的类型材料中,从BGC 75.1中提取基因序列。E. Malaspinii’(补充信息)。

  EMBA基因(locus,mala_sAMN05422137_metaG-SCAFFOLD_127-GENE_5),EMBM(locus,Mala_SAMN05422137_metaG-SCAFFOLD_127-GENE_4)和EMBAM(包括基因间区域)的表达(包括Interizing insimitization-insimization-inimization-inimization insmization insp and insp cyp57)(包括AMPR)(包括Ampr)(大肠杆菌。将基因EMBA与BAMHI和HINDIII切割位点亚克隆到Pacycduet-1(CMR)和PCDFDUET-1(SMR)的第一个多个克隆位点(MCS1)中。将基因EMBM和EMBMOPT(优化的密码子)与BAMHI和Hindiii一起在PCDFDUET-1(SMR)的MCS1中,以及在PCDFDUET-1(SMR)的第二个多重克隆位点(MCS2)和Prsfduet-1(kanr)和Ndei/XHOI。将AMBAM盒子与BAMHI和Hindiii切割位置一起被亚克隆到PCDFDUET1(SMR)中。Gene Orf3/Embi(位置,MALA_SAMN05422137_metaG-SCAFFOLD_127-GENE_3)是由用primers Embi_oe_f_ndei和Embi_oe_oe_r_xhoi构建的使用相同的限制酶消化(补充表6)。根据制造商(新英格兰Biolabs)程序进行限制酶消化和连接。

  上面产生的所有构建体均被引入化学胜任的大肠杆菌DH5α中,并通过适当的抗生素选择将其镀到LB琼脂上。从单个菌落中纯化质粒,并使用测序引物进行测序以验证适当插入基因的插入(补充表6)。通过Gibson组装将EMBA和AMBAN基因在修饰的PLMB509M(GTR)载体中进行了亚克隆,并通过Gibson组装进行了高甲硝基乙烯的表达。补充表6中提供了Gibson组装底漆启动emba_f_plmb,EMBA_R_PLMB,PLMB_F_EMBA和PLMB_R_EMBA的列表。NHIS6-EMBAM-PLMB509M进入大肠杆菌SM10进行共轭。

  将化学能力的大肠杆菌BL21(DE3)引入到PCDFDUET-1-EMBA(MCS1)和PCDFDUET-1-EMBM(MCS1)中。使用相同的条件来表达两种末端HIS6标签蛋白。从单个菌落中制备了过夜培养物,并用来接种(1%,v/v)TB培养基(2×200 mL),中含有spectinomycin(50 mg mL -1)的1 L型混乱的Erlenmeyer烧瓶。将细胞在37°C的200 rpm下生长,直到600 nm(OD600)的光密度约为1.0,在冰浴上冷却20分钟,并以0.5 mM IPTG诱导。将培养物进一步在16°C,180 rpm的18-20 h中孵育,然后通过离心(8,000g 20分钟)收集并冷冻。

  使用两种蛋白质的相同过程,在4°C下进行了NHIS6-EMBA和NHIS6-EMBM的纯化。将细胞颗粒重悬于5 mL G -1的裂解缓冲液中(50 mM Tris,300 mM NaCl,5 mM咪唑,10%甘油,pH 7.8)。悬浮液用溶菌酶(1 mg mL -1),DNase I(10 U ML -1)和蛋白酶抑制剂鸡尾酒(0.2%,V/V)补充,并在37°C搅拌30分钟。在冰浴中冷却悬浮液15分钟后,通过超声处理(30%的振幅,10秒开/关周期,总共3分钟)裂解细胞,并通过离心(27,000g持续30分钟)获得澄清的裂解物。将上清液加载到4 ml的Ni-NTA琼脂糖树脂上,该树脂在薄条纯化柱中用裂解缓冲液平衡。The resin was washed with 10 column volumes (CV) of lysis buffer, 3 CV of wash buffer (50 mM Tris, 300 mM NaCl, 40 mM imidazole, 10% glycerol, pH 7.8) and finally eluted with 3 CV of elution buffer (50 mM Tris, 300 mM NaCl, 250 mM imidazole, 10% glycerol, pH  7.8) in 1.5 ml分数。通过SDS-PAGE,合并并浓缩自旋浓度器,并以适当的分子量截止分析洗脱部分。使用PD Minitrap G25柱进行缓冲,用G25缓冲液(50 mM TRIS,300 mM NaCl,10%甘油,pH 8.0)对NHIS6-EMBA和NHIS6-EMBM进行缓冲。通过测量280 nm纯化的蛋白的吸光度,并使用分子质量的计算值和每种蛋白质的灭绝系数来确定缓冲蛋白的浓度。

  对酶促反应参数的广泛筛选,包括温度,时间,酶和底物浓度,缓冲pH和盐度,导致了以下最佳启动环境设置:将EMBA添加到玻璃小瓶中,以最终浓度为200 mm。将2 mM的MGCL2和2 mM的腺苷5'-三磷酸(ATP)的最终浓度添加到反应中。在营业额实验中,未添加EMBM以控制反应,并将其添加到10 mM的最终浓度中。将酶促反应在37°C下搅拌72小时,并每24小时补充2 mM ATP的反应混合物。反应量表范围从100μL,用于分析目的到3 mL进行隔离。

  用胰蛋白酶和LAHT150将修饰的EMBA用于MS分析和产品隔离90。通过将反应混合物与2x胰蛋白酶缓冲液(50 mM Tris,5 mm CaCl2,pH 8.0)稀释,添加1:20胰蛋白酶:EMBA:EMBA并在37°C中孵育过夜。通过以1:10的比例将LAHT150添加到EMBA,并在室温下孵育过夜,以进行小型反应或24小时,以使大于1 mL的反应进行孵育,从而进行LAHT150裂解。

  使用具有现象层C18-E反相柱(2 g糖浆)的固相提取(SPE)纯化大规模酶促反应。首先将吸附剂用24 mL MeOH洗涤,并用24 mL H2O(+0.1%甲酸)平衡。将蛋白水解反应加载到吸附剂上,然后用24 mL H2O(+0.1%甲酸)洗涤。用24 mL的1:1 MECN:H2O(+0.1%甲酸)和12 mL MECN(+0.1%甲酸)洗脱肽产物。将洗脱馏分合并,在日内瓦克浓缩剂上干燥,并在-20°C下储存。

  筛选了EMBA,EMBM和ORF3的各种大肠杆菌共表达条件(补充表6)。通常,通过上述构建体的不同组合对化学胜任的BL21(DE3)或调谐器(DE3)进行转化,并在LB平板上选择适当的抗生素。从单个菌落中制备了隔夜培养物,并使用1%(v/v)的培养物接种了200 mL培养基(TB,LB,XPPM)91,并补充了在1 L上令人沮丧的Erlenmeyer烧瓶中补充适当的抗生素选择。细胞在37°C,200 rpm生长,直到OD600约为1.2。对于低温生长,随后将培养物冷却20分钟,用0.5 mM IPTG诱导,并在180 rpm的16°C下孵育。孵育时间从24小时到7天不等。高温生长以0.5 mM IPTG的最终浓度诱导,而无需冷却,并在37°C下孵育200 rpm,从6小时到16小时。通过离心(8,000克20分钟)收集培养物,如上所述冷冻和纯化。如上一节中所述,与胰蛋白酶或LAHT150进行蛋白水解反应进行了MS分析。

  根据已发表的程序89实现了使用NHIS6-EMBA-PLMB509M和NHIS6-EMBAM-PLMB509M的AerodeNitrificans DSMZ 15089和NHIS6-EMBAM-PLMB509M的转换。培养条件遵循先前描述的方法89的适应。如上所述收集,存储和纯化培养物。胰蛋白酶消化用于MS分析。

  通过EMBA和EMBM共表达获得的磷酸化肽中间体以100μL尺度提交给β-脱缆条件。G25缓冲液中的EMBA(200μm)用作完整的蛋白质,也可以用作胰蛋白酶脱离产物。用1 M NaOH将溶液的pH调节至pH 13,并在37°C下进行4小时,以提供含脱氢的丁烯(DHB)的产物。DHB的衍生化是通过在反应中添加50 mM DTT的最终浓度来进行的。在MS分析之前,用HCl(水溶液)将溶液的pH调节。

  通过用laht150蛋白溶质的EMBA进行了通过体外酶促反应获得的磷酸化肽中间体的β-脱肽,如上所述,并使用SPE纯化。将EMBA(0.6 mmol)重悬于3 mL H2O中,并用1 M NaOH将溶液的pH调节至14。该反应在37°C下搅拌48小时,随后用HCl中和至pH 7(aq。)。如上所述进行SPE纯化。

  HPLC–HR-MS and MS/MS analyses were performed on a Thermo Scientific Dionex UltiMate 3000 UHPLC coupled to a Thermo Scientific Q Exactive mass spectrometer using heated electrospray ionization in positive ion mode with a Phenomenex Kinetex 2.6 μm XB-C18 100 Å (150 × 4.6 mm) column.柱温度设置为50°C,流速为0.5 mL min -1。在注射之前将样品离心,并在15分钟内用15-55%MECN(+0.1%甲酸)梯度洗脱靶肽。以70,000的分辨率(AGC目标,1×106;最大值,100 ms)进行全MS,并以17,500的分辨率进行平行反应监测(AGC目标,2×105;最大值,100 ms;隔离窗口为2.0 m/z)。

  2D [13C,1H]具有多重编辑的HSQC光谱在自然13C丰度中记录在〜4 mM全长EMBA的溶液中,并以未修饰和修改的形式记录。在配备有TCI冷冻预防片的Bruker Avneo 600 MHz光谱仪上,在25°C下记录了光谱。使用了以下光谱参数:在16 ppm的光谱宽度下为2,048个复合点,在直接1H尺寸为4.7 ppm,在间接13C尺寸中以42 ppm为中心的光谱宽度为80 ppm的光谱宽度为512个复合点。使用了40张扫描,每光谱的测量时间为24小时。

  大肠杆菌DSM 1103,金黄色葡萄球菌SSP。金银ATCC 29213,铜绿假单胞菌DSM 1117,ACINETOBACTER BAUMANII DSM 30007,肠球菌DSM 2570,Rhodococcus sp。L233,Aquimarina sp。Aq135, Rheinheimera aquimaris B26, Vibrio spartinae (salt marsh isolate), Pseudoalteromonas rubra DSM 6842, Saccharomyces cerevisiae W301-1A and Pichia pastoris (Komagataella phaffii) NRR Y-11430 were tested for antimicrobial activity with the dehydrated peptide fromBGC 75.1。根据2003年的临床和实验标准研究所(CLSI)的指南,使用微统计方法进行了生物活性测定。

  E. coli,S。金黄色葡萄球菌,baumanii和铜绿假单胞菌过夜培养物在37°C的LB中生长。P. Rubra,R。Aquimaris(37°C),V。Spartinae(30°C),P。Rubra和Aquimarina sp。AQ135(24°C)在括号中指示的各自的生长温度最佳中培养在海洋汤中。Rhodococcus sp。L233在24°C的R2A培养基中培养。在28°C的YPD培养基中培养了酿酒酵母和P. p. p. castoris。补充表6中提供了菌株,生长条件和分类法的概述。

  微生物种子培养物是通过对每种菌株的5 mL培养基进行渗透并以200 rpm孵化的过夜摇动来启动的。然后将每种培养物用各自的生长培养基稀释至无菌96孔板中的每孔80μl的初始OD600,每孔(每株一个菌株测试)。在重复项中进行了测定,并具有适当的对照,包括溶剂(水)对照和阳性对照,由两种不同的宽光谱抗生素(氯霉素和氨苄青霉素)组成,最终浓度为50 µm。环己酰亚胺和苯诺基被用作酿酒酵母和P. p. p. castoris的阳性对照。

  测试了使用水作为溶剂的两个终浓度的肽:50μm和25μm。然后,对96孔板进行了排除并在室温下孵育而不会发抖。在以下时间点进行10 s搅拌后确定OD600:2 h,4 h,6 h,8 h,18 h,18 h,21 h,24 h和48 h。

  使用中性粒细胞弹性酶抑制剂筛选试剂盒(Mak213,Sigma-Aldrich)和组织蛋白酶B抑制剂筛选试剂盒(Mak200,Sigma-Aldrich),对中性粒细胞抑制剂筛查试剂盒(Mak213,Sigma-Aldrich)和组织蛋白酶B抑制剂筛选试剂盒(Mak213,Sigma-Aldrich)进行抑制测定。根据制造商的协议进行测定。使用微孔读取器光谱荧光仪(Tecan Infinite M200 Pro)测量荧光,并在Prism 9中处理数据以计算IC50值。

  用胰蛋白酶和胰凝乳蛋白酶抑制测定在96孔微滴定板中(黑色,透明底部)进行。在每个孔中,在50 mM Tris,pH 8缓冲液(测定缓冲液)中,不同浓度肽的25 mL储备溶液(测定缓冲液);2毫升酶储备溶液(Chymotrypsin,V1062,Promega,1 nm终浓度;胰蛋白酶,V5111,Promega,3 nm终浓度);加入48 mL蛋白酶缓冲液(40 mM Tris,10 mM CaCl2,pH 8)。苯基甲基磺酰基氟化物用作阳性对照。将板在室温下孵育10分钟。随后,23 mL的测定缓冲液和2 mL的500 mM底物溶液(Chymotrypsin:Sup-Ala-Ala-Ala-Pro-Phe-AMC,3114-V,Peptanova; peptanova; peptanova; bocile-lu-gly-gly-gly-gly-gly-arg-arg-amc,3094-v,peptanova添加了dmsso)通过测量在微孔读取器光谱荧光仪(Tecan Infinite M200 Pro)中测量水解产物(LEX = 342 nm,LEM = 440)的荧光发射(LEX = 342 nm,LEM = 440),在37°C下测量酶活性1小时。在Prism 9中处理数据以计算IC50值。

  测试了对HeLa细胞的抑制作用,用于磷酸化,化学脱水和对照(未修饰)肽75.1的形式。将库存的HELA细胞重悬于10 mL Hepes缓冲的高葡萄糖Dulbecco的改良鹰培养基(DMEM)中,并补充了谷氨酸(Gibco)。该培养基还含有10%的胎牛血清和50 mg ML -1庆大霉素。将细胞在1,000克和室温下离心5分钟。将培养基丢弃,并将细胞重悬于10 mL新鲜培养基中。将细胞放入培养皿中,并在37°C下孵育3-4天。仅当60-80%的表面被细胞覆盖时,才在显微镜下检查细胞,并进一步处理。将培养基从培养瓶中取出,并用10 mL磷酸盐缓冲盐水(PBS)洗涤细胞。将PBS丢弃,并用2 ml胰蛋白酶-EDTA溶液处理细胞。当细胞分离时,添加10 mL培养基,并在1,000g和室温下离心5分钟。丢弃上清液,并添加10毫升新鲜培养基。然后,将2 mL的细胞悬浮液放入含有10 ml培养基的新鲜培养瓶中。对足够健康的细胞毒性测定的细胞进行计数,并将每个ML溶液稀释至10,000个细胞。然后,每孔充满200μl细胞悬浮液。将所有板在37°C下孵育过夜。外井未用于测定。将100μM的磷酸化,化学脱水和对照形式(未修饰)形式的肽75.1(DMSO中2μl1.25mM库存溶液)的起始浓度添加到B巷井中。阿霉素在1 mg mL -1处用作阳性对照,DMSO用作阴性对照。总共将50μl的车道B转移到泳道C中并混合,并重复该转移到相邻的车道直至泳道G。然后将板孵育3天。然后,50μl的3-(4,5-二甲基噻唑-2-基)-2,5-二苯基四唑溴化物(MTT) (水中1 mg ml -1)添加到所有井中,并在37°C下孵育3小时。将上清液丢弃,并将150μl二甲基亚氧化二甲基亚氧化物(DMSO)添加到所有井中。在570 nm处测量吸光度,并使用R中的“ DRC”软件包计算了IC50。

  'ca的类型材料的基因。MALA_SAMN054222137_metaG-SCAFFOLD_4上的反施加预测的BGC 3.1(1区)中的E. malaspinii(补充信息),包括NHIS-EREA(Gene_139)(Gene_139),EREI,EREI,EREI(gene_140),EREM(Gene_141),ERE__141和ERED(Gene_141)和ERED(Gene_141)和ERED(Gene_141)和ERED(Gene_141)如补充表5中所述,在大肠杆菌中表达的补充表5中所述,将密码子优化并订购为合成构建体。使用补充表5中列出的引物进一步通过吉布森组装来进一步亚克隆。所有生成的构建体均被引入化学胜任的大肠杆菌DH5α中,并在LB琼脂上镀上,并在LB琼脂上进行了适当的抗生素选择。从单个菌落中纯化质粒,并使用Sanger测序来验证适当插入基因的插入(补充表5)。

  NHIS-EREAD,NHIS-EREAIMD,NHIS-EREADB和NHIS-EREAIMDB与M. eyodenitrificans核糖体结合位点(Ttaggagagagagtgcggg)代替基因间区域,Gibson由Gibson组装在修改后的PLMBBB509M(GTR)中。引入大肠杆菌DH5α,分离质粒并通过测序验证正确的克隆,然后将所有构建体引入大肠杆菌SM10中,以共轭为高甲硝基烯二烯。如前所述进行共轭89。

  用补充表5中列出的所有构建体转化化学胜任的大肠杆菌BL21(DE3)细胞。从单个菌落中制备了过夜培养物,并用于接种(1%,v/v)TB培养基(1×50 mL)在250 mL造成的Erlenmeyer燃烧中,并补充了适当的抗体。在37°C,200 rpm下生长细胞,直到OD600约为0.8-1.2,并以1 mM IPTG的最终浓度诱导。按照每个实验指定,在16°C,180 rpm的培养物中进一步孵育16 h,24 h或48 h,随后通过离心(6,000g持续15分钟)收集并冷冻。

  为了纯化高杆菌的纯化,从冰箱库存接种了20毫升的养分肉汤中的20毫升前培养物,并在30°C下生长过夜。然后,使用1%(v/v)培养物接种了具有适当的抗生素的20 ml TB开胃培养物。然后,使用1%(v/v)的起动培养物在1升非冰球埃伦梅尔瓶中接种200 mL。将细胞在30°C,180 rpm下生长,直到OD600约为0.8-1.2,并以0.2% - 阿拉伯糖的最终浓度诱导。按照每个实验的指定,将培养物进一步在30°C,180 rpm,24 h,48 h或72 h中孵育,然后通过离心(6,000g持续15分钟)收集并冷冻。

  对于蛋白质纯化,将细胞颗粒重悬于5 mL G -1的裂解缓冲液(50 mM Tris,300 mM NaCl,5 mM咪唑,10%甘油,pH 8.0)中。通过超声处理(30%的振幅,10 s开/关周期,总共3分钟)裂解细胞,并通过离心(27,000g持续45分钟)获得澄清的裂解物。将上清液加载到1 ml的Ni-NTA琼脂糖树脂上,该树脂在薄条纯化柱中用裂解缓冲液平衡。将树脂用10柱体积(CV)洗涤,裂解缓冲液,3 CV洗涤缓冲液(50 mm Tris,300 mM NaCl,40 mm咪唑,10%甘油,pH 7.8),最后用3 cV的洗脱缓冲液(50 mm Tris,300 mm Nacl,Nacl,250 mmmmmmimidazole,10%imidazole,10%glyazole,50 mm tris)洗脱。通过Amicon Ultra-4 10K自旋滤器设备(Millipore Sigma),通过SDS-PAGE分析洗脱部分,合并和缓冲液分离为SGT缓冲液(50 mm Tris,300 mM NaCl,10%甘油,pH 8.0)。使用旋转的布拉德福德试剂(Carl Roth)确定旋转,缓冲蛋白的浓度。

  对于LAHT150消化,以1:10的比例与72 µL大约200 µm的玻璃MS MS小瓶入口处以1:10的比率与72 µL的旋转浓缩蛋白的72 µL添加20 µm的浓度为20 µm的纯化LAHT150(参考90)。将摘要在室温下孵育过夜,并在大约16小时后通过HPLC-HR-MS和MS/MS进行分析。

  对于蛋白酶K消化物,将16μL洗脱与20μl蛋白酶K缓冲液(100 mM Tris,4 mM CaCl2,PH 8.0)和4μL蛋白酶K(2 mg ML -1)混合。在PCR管(50°C下12小时)中进行蛋白水解裂解,并在大约16小时后通过HPLC-HR-MS和MS/MS进行分析。

  如先前所述92,93进行了高级Marfey的分析。在Marfey分析之前,将500 µg成熟的NHIS-erea前体肽在110°C的6 M HCl中水解16小时。将混合物干燥在Speedvac浓缩器中,并使用400 µL水洗涤两次。将干燥的样品溶解在75 µL水,25 µl 1 N NaHCO3和125 µLNα-(2,4-二硝基-5-氟苯基) - 谷氨酸(丙酮中4 mg mL-1)中,并在45°C的45°C加热1 h。用25 µl 1 N HCl中和反应,并用250 µL乙腈/水(1:1)稀释。将样品转移到HPLC瓶中,然后使用HPLC-HR-MS分析。与以上所述的方式相比,通过质量和保留时间来验证氨基酸。

  分析HPLC – HR-MS样品(5–20 µL注射)在配备有Kinetex C18现象的Dionex Ultimate 3000 RS UHPLC上分离,并加热至50°C。根据以下方法(溶剂A,H2O+0.1%FA;溶剂B,ACN+0.1%FA;流速:1 ml min -1):30%B时2分钟;2–9分钟从30%到100%b;100%b时9-10分钟;10–10.1分钟从100%到30%B,10.1-14分钟,为30%。

  将HPLC耦合到Thermo Scientific Q Stripive杂种杂种四极核质谱仪中,使用加热的电喷雾电离以阳性离子模式(喷射电压,3,500 V;毛细管温度,268.75°C; 268.75°C;探头加热器温度,350°C; S-Lens; S-LENS级,70)。以70,000的分辨率检测到完整的MS(AGC目标,1×106;最大值,100 ms)。

  在酶促测定之前,将25毫克的市售SAM(Sigma-Aldrich)溶解为1 mL,并在五部分(每股200 µl)中注射,以对配备半敏化1260 HPLC进行额外纯化,配备了半级别RP(4 m,80Å,250Å,250Å,250×10 mmmmmmmmmmmmmmmmmmmmmmmm)的列。使用以下方法(溶剂A,2.5 mM乙酸铵;溶剂B,75%MEOH;流速为2.5 ml min -1):15%B时2分钟进行HPLC分离。2–7分钟从15%到30%b;7–10分钟从30%到100%b;100%b时10–16分钟;16-17分钟从100%到15%b;17-22分钟为15%。

  纯化过程在260 nm处进行监测。山姆在6-8分钟的宽峰中洗脱,并在冰上的猎鹰管中收集,在液氮中收集后立即闪烁,然后冻干。相关的杂质后来从色谱柱洗脱并被丢弃。将冻干的纯SAM溶解在20 mM HCl中,并将等分为100 mM储备溶液,该溶液存储在-80°C下,直到进一步使用。

  SAM(0.5 mm),1 µM 5'-甲基硫代腺苷核苷酶(MTAN),50 µM表达NHIS-EREA前体,30 mM MGCL2和5 µM EREM溶解在SGT缓冲液中(50 mm Tris,300 mm NACCER,10%glll,10%glyl,ph 8.0 rs),in Incper ob ph 8.0 a小瓶插入在37°C的一夜之间。然后,将5 µM LAHT添加到体外测定中,并在室温下孵育2小时,然后通过HPLC – HR-MS/MS分析。

  13C-SAM (0.5 mM), 1 µM MTAN, 50 µM epimerized Nhis-EreA precursor, 30 mM MgCl2 and 5 µM EreM were dissolved in SGT buffer (50 mM Tris, 300 mM NaCl, 10% glycerol, pH 8.0) to a total volume of 100 µl and incubated in glass MS vial inserts overnight at 37 °C.然后,第二天将5 µM LAHT添加到体外测定中,并在室温下孵育2小时,然后通过HPLC – HR-MS/MS分析。

  13CH3-甲硫代(5毫米),10毫米腺苷 - 三磷酸,100 mm KCl,30 mm MgCl2,1 µm mtAN,11 µm Sam Synthase,40 µM表达NHIS-EREA的NHIS-EREA前体和40 µm EREM在50 mM tris中分解了ph 8.0°MM,并注入8.0摄氏度500毫米。管在37°C下过夜。然后,将50 µL的D2O添加到测定混合物中,并转移到NMR管中。质子和HSQC光谱在配备有冷冻探针的Bruker 600 MHz NMR光谱仪上进行。为了确定附着在13C标记碳的质子的位置,还记录了另外1H NMR的参数,可以使碳和质子脱钩。这些参数会导致附着在13C标记的碳中的各个质子分裂。

  (NH4)2FESO4(800 µM)与SGT缓冲液(50 mM Tris,300 mM NaCl,10%甘油,pH 8.0)中的50 µM EREI在冰上孵育20分钟。然后,加入1 mm 2-氧化甲酸酯和1毫米二硫代硫醇,并在冰上再孵育20分钟。添加了含量的NHIS-EREA前体(5 µM)以产生100 µL的总体积,并将反应混合物在Eppendorf管中孵育20分钟,在30°C下孵育20分钟。通过将测定混合物在95°C煮沸10分钟来淬灭反应。将LAHT(5 µM)添加到体外测定中,并在室温下在使用HPLC-HR-MS/MS分析之前在室温下孵育2小时。

  合成了位置定向诱变的引物(补充表5),并用于从EREAD-PET DUET(AMPR)放大模板DNA。使用PCR扩增,KLD处理和富集来完成诱变,并转化为大肠杆菌DH5α以通过测序分离质粒和正确克隆的验证。由于核心序列的高度重复性,在定位诱变期间还产生了截短的核心变体,并测试了EREM修饰(补充表5)。

  将大肠杆菌BL21(DE3)细胞与NHIS-EREA在Pacycduet-1中共转化,并在PCDFBAD/MYC-HIS A中进行涂在含有氯基苯甲固醇(25μgml-1)的LB琼脂上,并在LB琼脂上镀上,并在37°C中添加了20小时(100μgml-1)和37°C colown和Growon coloniese和Growon coloniese。这些菌落用于用氯霉素(25μgml -1)和氨苄青霉素(100μgml -1)接种20 mL lb,并将培养物生长过夜。第二天,用150μL并以37°C,250 rpm至1.6-2的OD600接种了四个单独的50 ml猎鹰管,含有TB培养基,(15 mL),氯霉素(25μgml -1)和氨苄青霉素(100μgml -1)。将培养物在冰上冷却30分钟,用IPTG(0.1 mm终浓度)诱导,并在16°C下摇动(180 rpm)18小时。将培养物离心(10,000克时10分钟),并去除上清液。然后用TB培养基(1×15 mL)洗涤细胞颗粒,以去除任何残留的IPTG。接下来是在D2O中用1 mL TB洗涤两个。将洗涤的细胞沉淀重悬于15 mL TB培养基中的D2O中,其中含有氨苄西林(D2O中的100μgml -1)和-arabinose(D2O中的0.2%W/V),并摇动(在16°C下为180 rpm)持续18小时。将培养物组合并离心(15,000克时30分钟),并将颗粒重悬于每克细胞沉淀中4 mL裂解缓冲液中,并如上所述纯化。对于对照,使用正常的结核培养基遵循相同的步骤。

  自杀矢量PSW8197(参考文献94)被用作基于Aerodenitrificans的Aeroneamide(AER)簇的稳定且无标记的缺失的基础。底漆对AER1F/R和AER2F/R用于在AER群集的上游和下游放大500 bp的同源区域。将所得的DNA产物组装到PCR扩增的PSW8197(PSWAERKO-F/R)中,并使用Gi​​bson组装组装成质粒从所得的集中提取质粒后进行了大肠杆菌SY327电位电池,并在质粒提取后进行了序列验证。

  然后将所得的质粒(PSW8197_AERKO)转化为化学胜任的大肠杆菌ST18供体细胞95,并用50 µg ml-1 kanamycin和5-氨基烯烯丙基酸(由E. Coli ST18)选择。如先前所述,将与M. perionitrificans野生型结合在LB琼脂板上用50 µg ml-1 5-氨基苯甲酸酸,并在37°C下孵育24小时。通过将含有25 µg ML-1卡纳霉素和400 µg mL-1氨苄青霉素的营养琼脂平板上镀板,在30°C下选择并通过PCR(Aerko SEQF/PSWARAC-R)确认。在30°C的5 mL营养汤中非选择性地整合物在30°C的良好汤中生长,并在营养琼脂上镀以0.5%(w/v) - 阿拉滨糖(可诱导可触发的CCDB毒素)和100 µg ML-1氨基链霉素,从而获得成功的colornies,从而导致colornies colonies colonies colonies colonies colonies colonies colonans consections deletions eRetants或wild-wild-type revertants。使用PCR和引物Aerko Seqf/R鉴定出了AER簇的成功缺失突变体,该突变体向侧面用于构建载体的侧翼区域外的基因组上的区域退火。通过测序验证了所得的PCR产物。

  PFAMSCAN分类来自‘ca。E. malaspinii’仅属于FKBM甲基转移酶(PF05050)家族。为了鉴定与天然产物生物合成有关的其他FKBM家庭蛋白,使用MiBig(V.2.0)30中的所有蛋白质编码序列,使用HMMMMMMMEREALT中的HMMER V.3.1B2(HMMER v.3.1B2(HTP),使用了所有蛋白质编码序列(pfam_a中的甲基Transf_21.hmm)来查询所有蛋白质编码序列30参数和-CUT_NC PFAM噪声切断。在Mibig中识别出37个​​特征BGC之内的命中(补充表5),并手动评估了相关的文献,以获取FKBM - 家庭甲基转移酶活性的实验证据。基于最终的自然产物结构,在定义的BGC簇边界之外的FKBM命中排除了八种蛋白质,在生物合成中没有明显的作用(补充表5)。四个FKBM家族成员有实验证据表明O-甲基转移酶活性的活性形式或遗传研究。作者在出版物中记录了总共25种FKBM家庭蛋白,以根据最终的天然产物结构,生物合成逻辑和生物信息学证据具有O-甲基转移酶活性。使用肌肉(v.3.8.1551)81对齐29个FKBM - 家庭蛋白,其中两个参与蛋白蛋白生物合成的外群,POYE,POYE(AFS60641.1)和AERE(AFS60641.1)(AFS60641.1)(AFS60641.1),来自不同的甲基转移蛋白蛋白(PF055)。评估了蛋白质比对,并使用Trimal V.1.2消除了所有包含50%或更多间隙的列。使用iQ-Tree(v.2.0.3)96,将修剪的比对用于系统发育模型选择,并根据使用贝叶斯和Akaike信息标准选择V5+F+R5模型。然后使用iQ-Tree估算使用超快自举近似97的最大样品系统发育,并进行5,000个重采样。用于生物信息学分析的脚本可在GitHub上获得 (https://github.com/serina-robinson/fkbm-bioinformatics)。

  HPLC – HR-MS和MS/MS分析在Thermo Scientific Dionex Ultimate 3000 UHPLC上使用加热电喷雾离子化在正离子模式下与Thermo Scientific Q Stripice Q精确质谱仪结合使用,并使用现象为2.6μmXB-C18 100Å(1500×4.6 mmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmms)。分析HPLC – HR-MS样品(5–20 µL注射)在配备有现象的Kinetex C18(2.6 m,100Å,150×4.6 mm)的Dionex Ultimate 3000 RS UHPLC上分离,并加热至50°C。使用以下标准方法进行HPLC分离:

  方法A:溶剂A:H2O+0.5%FA;溶剂B:1-丙醇+0.5%FA;流速:0.5 mL min -1;20%b时2分钟;2–14分钟从20%到80%b;80%b时14-17分钟;17–17.1分钟从80%到20%B,17.1–20分钟,为20%。

  方法B:溶剂A:H2O+0.1%FA;溶剂B:乙腈+0.1%FA;流速:1.0 mL min -1;2%b时2分钟;2-12分钟从2%到100%b;100%b时为12-16分钟;16–17分钟从100%到2%B,17.1-20分钟,为2%。

  将HPLC耦合到Thermo Scientific Q Stripive杂种杂种四极核质谱仪中,使用加热的电喷雾电离以阳性离子模式(喷射电压,3,500 V;毛细管温度,268.75°C; 268.75°C;探头加热器温度,350°C; S-Lens; S-LENS级,70)。以70,000的分辨率检测到完整的MS(AGC目标:1×106;最大值,100 ms)。MS2碎片以35,000的分辨率进行(AGC目标,2×105;最大值,100 ms,隔离窗口,4.0 m/z)。对于+3电荷状态,归一化碰撞能量为20、25和30。平行反应监测以17,500的分辨率(AGC目标2×105;最大值,200 ms;隔离窗口,1.4 m/z)进行,对于+2和+3电荷状态为18、20和24的归一化碰撞能量。

  无论何时适当,都使用错误的发现率校正对多次测试进行校正。在适当的情况下,如果没有另外指定,则进行统计测试是双面的。

  使用ggplot2(v.3.3.3.0 – v.3.3.5)在R(v.4.0.0.0 – v.4.1.2)中绘制盒子图,并定义如下:底部和顶部铰链对应于第一个和第三四分位数和第三四分位数(25和75个百分位),最高的晶须不到荷兰ies ies ie i i ies ie 1 q.5 ic q res ies(四分位数范围或第一四分位数之间的距离)。底部晶须从底部铰链延伸至最小值,最多为1.5×IQR。除了图1C之外,由于晶须的末端之外的数据点是单独绘制的,这是由于点数和空间约束的数量。

  图1E使用r软件包ISTRISTR(V.1.4.0)98绘制。图2中的树木使用r软件包ggtree(v.3.3.0.901)99绘制。

  有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

左文资讯声明:未经许可,不得转载。