在细菌细胞内的原子细节上可视化翻译动力学

2025-06-22 14:28来源:本站

  先前描述了肺炎支原体培养,样品制备和数据收集2。在经线和M 1.0.7(正式发布为v.1.0.9。)3,54中重新加工了未经处理的本机未经处理,经CM处理和PUM处理的细胞的三个数据集。用Volta相板获取的15个断层图的小数据集使用Warp 1.0.9中的Denoing网络处理,仅用于可视化目的(如图1A所示)。

  按照与以前相同的程序收集了经幻霉素处理的细胞的数据集。简而言之,在暴跌冻结前15-20分钟中,将Spectinomycin(Sigma-Aldrich)以0.4 mg ml-1的最终浓度添加到培养基中。使用Serialem 3.8(参考文献56)配备了以下参数的Titan Krios传输电子显微镜(GATAN),对具有剂量对称方案的倾斜系列收集进行:放大倍率为81,000×,像素尺寸1.053Å,倾斜范围-60°至60°dose-treem dodosy 120 dope the 3°dope,使用了以下参数:放大率为81,000×,像素尺寸为1.053Å,尺寸为1.053Å,尺寸为1.053Å。

  在这项工作中分析了356个未经处理的天然,未经处理的65 cm处理,86个PUM处理和70个SPC处理的细胞断层图。补充表1和3-6中提供了冷冻EM数据收集,改进和验证统计信息的详细信息。

  在经纱1.0.9(参考文献3)中进行了预处理(运动校正,CTF估计,剂量过滤和倾斜系列分类)。对于未经处理的,经CM处理的和PUM处理的数据集,从先前的粒子挑选中采用了核糖体坐标2。For the Spc-treated dataset, template matching was performed in PyTom57, followed by computational classification in RELION 3.0 (refs.58,59 to exclude false positives, without manual cleaning. In total, 109,990 untreated, 21,299 Cm-treated, 23,014 PUM-treated and 13,418 Spc-treated ribosome sub-tomograms were在经线中重建。

  在Relion 3.0中进行了三维(3D)的细化和分类(参考文献58,59)。然后,我们使用软件M(V.1.0.9)执行倾斜系列的多粒子细化,并完善平均MAP3。几何(图像和体积变形)和CTF参数的细化均以连续的方式进行了五个回合。在70年代进行M细化后,我们分别对30s和50s亚基进行了专注的精致,以提高本地地图质量。独立完善的随机半集,局部分辨率估计和后处理之间的傅立叶壳相关性(FSC)计算是在M和Relion中进行的。

  30s和50s亚基的原子模型是使用从我们以前的工作中报告的CM处理的核糖体的重点进行的地图建造的,这些核糖体在我们以前的工作中报告了3,这些核糖体在登录代码EMD-11998和EMD-11999中存放在电子显微镜数据库(EMDB)中。使用Swiss-Model60在线服务器(https://swissmodel.expasy.org/; 2020年4月访问)生成用于肺炎支原体核糖体蛋白的同源模型,并使用枯草芽孢杆菌核糖体(蛋白质数据库(PDB)3J9W)作为模板和43)(ribosom prode and for Ribosom l9)(p.6w)(PDB)。L10(PDB 1ZAV)和S21(PDB 5MMJ)。使用SINA online Server61对RRNA序列(REFSEQ NC_000912)与大肠杆菌RRNA(PDB 4YBB)对齐。ModernA62用于基于对齐方式构建RRNA的同源模型,将PDB 4YBB作为模板。同源模型使用Chimera63刚性化合在低温ET密度中,然后使用Phenix Real Space Repinement64进行迭代改进和COOT65中的手动调整。核糖体蛋白L9,L10和L11仅作为刚体的物体安装在地图中,这是由于局部密度较低的原因。根据聚焦分类,发现存在于核糖体表面上的L9的平坦构象(参见扩展数据图12N),因此在模型中构建。从头建造了核糖体蛋白S6,L22和L29的序列扩展。使用Molprobity66验证了模型。还计算了模型和地图之间的FSC曲线以验证67。

  肺炎支原体中核糖体蛋白的生物信息学序列分析以及与大肠杆菌同源物的比较如下,如下所述:(i)蛋白质序列和REFSEQ基因组注释M.肺炎菌株M129(ATCC 29342)(ATCC 29342)下载。(ii)还用蛋白质序列用蛋白质序列注释,以获得COG(直系同源组的簇)IDS8,68;(iii)对于带注释的核糖体蛋白,从蛋酒数据库中下载了来自代表性细菌物种的相应COG多个序列比对。(iv)由于肺炎支原体M129不在代表性物种中,因此将其蛋白质序列添加到MAFFT Software70的多序列比对中;(v)对于每个COG多个序列比对,每个代表性物种(包括肺炎M. M129)的氨基酸数量存在于N末端之前的位置和大肠杆菌K-112 subStr的C末端位置之后。计算MG1655;(vi)使用NCBI分类树作为基础71,在Itol中说明了ITOL中的N-或C端延伸量长于20个氨基酸的存在;(vii)分析了所有代表性菌株的肺炎支原体中对应于具有N-或C-末端延伸蛋白的所有COG,蛋白质障碍和二级结构。还分析了交联或转座子插入的存在。

  从NCBI下载了肺炎支原体菌株M129(ATCC 29342)的REFSEQ基因组注释和蛋白质序列,用于用于肺炎M.肺炎m129 GCF_000027345.1从https://ftp.ncbi.nlm.nih.gov/genomes/all/gcf/000/027/345/gcf_000027345.1_asm2734v1/(2021年4月21日访问)。文件GCF_000027345.1_ASM2734V1_GENOMIC.GFF用于识别RefSeq注释的核糖体蛋白。文件GCF_000027345.1_ASM2734V1_PROTEIN.FAA具有FASTA格式的蛋白质序列用作在线工具蛋酒蛋白胶合v2的输入,该蛋白蛋白蛋白蛋白蛋白蛋白v2使用预先计算的鸡蛋v5.0 v5.0 clusters and Therymogenies快速正形化分配69,72。Refseq和蛋黄涂层的注释表通过蛋白质ID合并。总共将52个核糖体蛋白注释并映射到51个独特的COGS68。两种蛋白质WP_010874426.1和WP_010874827.1映射到与核糖体蛋白L33相对应的相同的COG0267。从蛋酒v5.0数据库中下载了来自代表性细菌物种的带注释蛋白的多个序列比对。对于肺炎支原体中的51个COG ID映射到核糖体蛋白中,修剪的对齐均从http://eggnogapi5.embl.embl.embl.embl.embl.de/nog_data/text/trimmed_alg/cog/cog_id('cog_id('cog_id''中的'cog_id('cog_id''中的'cog dos sone cog id)。由于肺炎支原体M129不属于进口代表性物种,因此将其序列添加到多个序列比对中。将每种蛋白质的序列保存在单独的FASTA文件中,MAFFT软件v.7.475在每个对齐的添加模式下使用如下:mafft -reorder -Add protein.fasta -auto trimmed_alg_alg_cog.fa> uptive_file(ref。70)。对于COG0627,使用了M.肺炎的蛋白质WP_010874827.1。

  对于每个核糖体齿轮,来自大肠杆菌菌株K-12 substr的蛋白质的氨基酸位置。MG1655作为参考,对于来自代表性物种的每种蛋白质(包括肺炎M. M129),N-末端之前的氨基酸数和大肠杆菌中的C末端位置之后。总共认为,在肺炎支原体中,具有N-或C-末端扩展的11个核糖体蛋白被认为具有扩展(2种具有N末端扩展的蛋白质和9个带有C-末端扩展的蛋白)。在C末端具有17-氨基酸延伸的核糖体蛋白S3(COG0092)也保留了进一步分析。NCBI细菌分类文件new_taxDump.zip从https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/new_taxdump/(版本于2021年4月24日)。文件名为DMP用于将NCBI ID映射到分类名称。从Python v.3.7.7中的文件TaxidLineage.dmp重建树,并使用ETE3 Toolkit v.3.1.2(参考文献73)。将含有NCBI物种ID的蛋白质ID直接映射到NCBI树节点。核糖体蛋白扩展的存在作为表保存,并在r v.3.6.1中使用Table2itol实用程序(https://github.com/mgoeker/table2itol)转换为Itol格式。用itol v.6(参考文献71)可视化树。

  用肺炎支原体延伸的11个核糖体蛋白序列及其在其他物种中的直系同源物的序列进一步分析了蛋白质障碍和二级结构。为了进行无序预测,所有来自多个序列比对文件的蛋白质序列均以FASTA格式保存而没有空白。Python v.3.7.7中的IUPRED2A工具以每个蛋白质序列的输入参数“长”运行。根据扩展区域相对于大肠杆菌的位置,计算了扩展区域的无序氨基酸和无序长度的数量,并将IUPRED2A评分为0.5作为疾病阈值。JPRED预测工具75用于使用JPREDAPI实用程序和JPRED-BIG-BATCH-SUBMISIONS UTISITY用于大量提交(https://github.com/fabianeg.com/fabianegli/jpred-big-batch-batch-subermission)来预测每种蛋白质的二级结构)。扩展区域中的螺旋数是根据扩展区域相对于大肠杆菌蛋白的位置计算的。

  对于在肺炎支原体上延伸的11个核糖体蛋白,根据先前报道的氨基酸交联位置,映射了与同一蛋白或不同蛋白相关的交联位置2。为了分析带有扩展的肺炎核糖体蛋白中的转座子插入,使用了先前出版物的补充材料24。将所有文件串联到“ requenthryData1_fastqins_processed.zip文件夹”(带有扩展名的'.QINS'但不是“ _FW.QINS”或“ _rv.QINS')中,以获得核苷酸插入序列的核苷酸列表。根据REFSEQ注释(GCF_000027345.1_ASM2734V1_GENOMIC.GFF),选择了11个核糖体蛋白中的转座插入位置。核苷酸位置通过计算每个转座子位置和相应基因的起始坐标,并将核苷酸的数量除以三,将核苷酸位置转化为氨基酸位置。将所有数据映射到蛋白质序列以得出扩展数据图3。

  最大可能样式3D分类76在Relion 3.0中进行(参考文献58,59),并在M细化后重新提取的核糖体子图解。使用至少三个层的层次结构和详尽的分类策略(补充讨论)来处理本机未经处理的数据集中的异质性,此处在此处进行了详细描述,并在扩展数据图中进行了说明。4和5。针对所有抗生素处理的数据集采用了类似的程序,并在扩展数据图中详细介绍。9–11。

  在第一层中,将109,990个子图表分为70s,并用全球球形掩码(直径320-Å)分为70 s和50s。24,157个自由50s进一步分为两类,局部球形掩膜重点是核糖体回收因子结合位点。在大量70年代分类之前,通过视觉检查,多体细化和测试分类来评估结构异质性。Classification set-ups were extensively tested, including different masks (global 70S mask, local 30S mask, spherical tRNA path mask, solvent tRNA path mask, spherical EF mask, solvent EF mask), initial references (ribosome average, features-less sphere or none), angular search options (global, local or without alignment) and RELION optimization parameters (class numbers 2–16, T values2–10,迭代25-40,极限分辨率E-Step 5–10Å)。为了避免偏见,我们主要使用带有柔软边缘的球体或其他无特征形状作为面具。涵盖因子(伸长因子和/或TRNA)的局部球形掩模通常提供了比在未经处理的数据中使用较大的掩码时获得的一致和稳定的分类结果。班级的数量高于可以保留在一个分类工作中的不同结构的数量,并将类似的班级分组。

  在第二层中,鉴定出70S核糖体的77,539层被局部掩码进一步分类(扩展数据图4A,掩码I),重点是tRNA路径区域,大致覆盖了A,P和E位点。这导致了四个具有不同trna占领的主要类别:“ p,e','a,p/e','p'和a,p'。在接下来的一轮中,我们可以将“ A,P/E”类进一步分类为“ A*,P/E”和“ A/P,P/E”。此外,对只有一个杂交“ p/e” tRNA的70年代类也被分类。所得的两个类是不可解释的:2,150个颗粒具有昏暗的30s密度,它们的分辨率很差,而1,484个颗粒在P位点附近密度不类似于TRNA。

  在第三层中,进行了局部掩码(扩展数据图4A,掩码II),并在伸长因子和A/T tRNA结合位点周围进行了分类。对于带有“ P,E” TRNA的上一类,进一步的分类导致了1,803个没有额外密度的颗粒,具有EF-G的3,324个颗粒(更新为“ EF-G,AP/P/P,PE/E')和4,634个具有EF-TU•TRNA的颗粒。对于具有部分杂种TRNA的类,获得了具有EF-G的子类。对于仅具有“ p” tRNA的类,将12,464个具有额外EF-TU•tRNA的颗粒分类。

  对于每个分类步骤,进行了至少三个平行的分类作业,具有相同或略有不同的参数(30s掩码或球形EF/tRNA掩码,局部角搜索范围,类,t值)进行比较。选择了最稳定结果的分类作业,并用于对子图表进行分类(扩展数据图5A – G)。分类后,为每个排序的类进行了随后的验证分类运行,以测试新结构是否出现或“错误地”分类。错误分类的颗粒被重新安置到相应的类别,并重复验证运行直至收敛。对于所有分类步骤,都执行了此方法。对于每个最终课程,进行了精炼和后处理。通过新的完善结果进行的进一步分类,因为输入没有生成任何新类。

  为了构建核糖体类的模型,如上所述构建的30S和50S型号用作灵活配件的启动模型。EF-G和EF-TU的同源模型由瑞士模型(https://swissmodel.expasy.org/; 2020年4月访问)分别用PDB结构4V7D和4V5L作为模板。对于tRNA同源性模型,将大肠杆菌核糖体结构(PDB 4V7C)中的tRNA用作模板,并突变为肺炎支原体phe-phe-tRNA(refseq nc_000912)。mRNA和新生肽是使用PDB 3J9W作为模板建造的。核糖体回收因子的同源模型是使用PDB 1EH1作为模板构建的。对于每个类别,首先使用嵌合体将刚性模型固定到密度中,然后使用NAMDINATOR77,78,79进行柔性拟合。如上所述进行验证。

  为了测量30S的身体旋转,首先将所有类别的结构对齐到50S亚基,然后用16S rRNA的核苷酸11附近的枢轴点估算旋转角度。从30S亚基的溶剂侧的角度来看,正数等于逆时针旋转,负数等于顺时针旋转。为了测量30s的头部旋转,所有类结构首先对齐30S主体,然后用轴线在30s颈部附近确定旋转角度。对于这两个旋转,“ A,P”类中的角度定义为0°。为了描述L1动力学,L1茎的质量中心(在23S rRNA的核苷酸2,181附近)与经典E位点中心附近的固定点(根据“ P,E'类”确定,在对齐50s subunit(排除L1 STALK)后测量了L1茎。

  通过将核糖体结构投射到断层图中,通过将核糖体结构投射到层次图中,通过模板匹配以及通过相关细化确定的旋转和旋转来确定核糖体结构,从而实现了核糖体的空间映射。在Euler Anger格式转换后使用TOM Toolbox80进行投影,以四次binning(Voxel size6.8Å)进行。为了计算核糖体浓度,我们首先估算了横向图中覆盖的细胞体积,然后将检测到的核糖体总数除以体积。

  使用MATLAB 2016b中的自定义脚本,对多聚体的检测基于位置和方向信息(扩展数据图12C)。据注意,带注释的多聚体仅指在空间中密切组装的多个,因此可以根据其空间接近度检测到。所有70S核糖体的mRNA进入和退出位点的位置都是根据在关系细节期间确定的旋转和偏移计算的。计算了从一个核糖体的mRNA出口位点(定义为前面的核糖体I)到所有相邻核糖体的mRNA进入位点的距离(如核糖体I+1之后的电势)。使用7 nm的距离阈值来定义两个核糖体是否属于同一多核体。计算和多70核体的计算定义均进行。分配了一个唯一的标识符,并分配了多个多核糖体中所有核糖体的顺序数字。

  在多聚合体内相邻核糖体的相对位置的分布(即,在以下核糖体(i+1)相对于先前的核糖体(i)的位置)在将相对位置向量与相对位置向量进行标准化后,与从相对细化确定的核糖体旋转的旋转进行了分析。以下核糖体与前面核糖体的相对旋转表示为三个欧拉角(XYZ系统中的ψ,θ,φ)。使用MATLAB 2016b中的K均值聚类函数,我们确定了多元体内相邻核糖体的两种主要布置配置。也就是说,以下核糖体如何相对于前面的核糖体旋转(如扩展数据图12f,g)。这两种配置与先前报道的“顶端”(T-T)和“ top-back”(t-b)配置4相同,并且采用了命名。

  为了进一步完善多核糖体 - 透射体界面,使用可容纳两个核糖体的大盒子尺寸提取的子图表进行了分类。在对先前的核糖体(i)上进行了细化后,对没有细化的分类进行了分类,局部掩膜重点是以下核糖体(i+1)。仅在紧密堆积的多个多个(5个Di-ribosom类中的5,083对中)中,只有核糖体对;全部带有“ T-T”的布置,并在中间扩展L9)导致平均密度,两种核糖体都可以很好地溶解。通过上述核糖体模型的刚体拟合和具有扩展构象的L9同源模型(PDB 4V63)生成了所得类的模型。

  为了比较多聚体中的实验伸长态频率与理论频率,比较了多聚核糖体和所有核糖体之间的每个伸长状态的频率分布在356个未处理细胞的频率之间,并在多核糖体和所有核糖体之间进行比较,并通过计算分布中的折叠来计算分布中的折叠。使用MATLAB 2019b中的Ranksum功能,使用双向Wilcoxon – Mann-Whitney测试评估统计显着性。每个核糖体对的理论频率被计算为前面核糖体(I)和以下核糖体(i+1)的核糖体类总频率的乘积。通过总结所有参与多聚体的核糖体的数量,将这些数字除以对的总数,从而计算实验性多元素对频率。通过计算每对倍数变化来比较实验对和理论对频率。

  进行置换分析以测试与理论对相比,实验对发生频率之间差异的重要性。多聚体中的核糖体对序列表示为矩阵,单个多聚体和核糖体位置为列,每个矩阵单元包含代表其伸长状态的核糖体类。将每个核糖体长度超出每个核糖体长度的圆柱分配给NAN(非数字)。所有断层图中的所有多聚体均合并为一个矩阵(总共8,641个多核心组)。为了进行排列分析,在MATLAB 2019b中的randperm函数中,将多个矩阵的所有元素随机洗牌。对于每一行,对元素进行了排序,以便核糖体类位于前列中,然后在改组后在同一行中发生NAN。删除了序列中不到两个核糖体的行。以与实验对频率相同的方式计算了洗牌的核糖对频率。计算每个核糖体对的置换p值是在对频率较小或等于实验观察到的频率除以排列总数的最小值之间的最小值,而一个值则减去该值。使用MATLAB 2019b中的MAFDR函数('BHFDR','true'),使用Benjamini -Hochberg程序调整了置换p值,以使用Benjamini -Hochberg程序进行多个假设测试。

  为了进行多元化距离阈值分析,通过将距离阈值更改为3到10 nm的范围内的距离阈值,从完整的核糖体数据集创建了矩阵。如上所述,在一个核糖体的mRNA出口位点和另一个核糖体的mRNA进入位点之间计算了多核体定义的距离。计算核糖体对的伸长状态的分数计算为原始核糖体集(阈值为7 nm)。对于每个距离阈值和每个核糖体类别,在上一个核糖体的对数与以下核糖体具有该类别的对数之间的对数之间的比率。

  所有四个数据集(356个未处理的细胞,65 cm处理的细胞,70个SPC处理的细胞和86个PUM处理的细胞)在翻译伸长阶段中鉴定的70S核糖体类的分布均用于聚类分析。当每个断层图覆盖一个单元格的大多数时,每个类别中的子图像图可以进一步分开它们所属的细胞。根据未经处理的数据集中最接近的类别,将经过抗生素处理的细胞中的类分配给类标识符。计算了每个单元格中不同类别的百分比,并将这些数字用作聚类分析的输入。使用MATLAB 2016b中的群集函数进行了分层聚类分析。

  在Chimera63和Chimerax81中完成了结构可视化,图形和视频的准备。

  有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

左文资讯声明:未经许可,不得转载。