2025-06-25 06:09来源:本站
如前所述29,制备了四膜核酶RNA(125 kDa,线性L-21 SCAI核酶跨越残基22–409)。在50 mM Na-Hepes pH 8.0中,核酶样品(约25μm,约3 mg ml-1)在90°C下变性3分钟,并冷却至室温10分钟。然后将MGCL2添加到最终浓度10 mm,并将样品在50°C下孵育30分钟。将样品再次冷却至室温10分钟。将三个微晶的体积施加到发光的200-mesh R2/1量子铜网格上。将网格印迹4 s,并在4°C下使用Vitrobot Mark IV(Thermo Fisher Scientific)在液体乙烷中快速冷冻冷冻,并湿度约为100%。使用TALOS ARCTICA冷冻电子显微镜(Thermo Fisher Scientific)筛选网格,以200 kV运行。将网格成像在泰坦krios G3i冷冻电子显微镜(Thermo Fisher Scientific)中以300 kV的速度进行倍倍放大×105,000(对应于每个像素为0.82Å)。使用“更快的获取”通过EPU软件(Thermo Fisher Scientific,v2.7)记录了显微照片,其吞吐量约为每小时420个电影堆栈,其中带有Gatan K3 Summit Direct Direct Electron探测器,其中每个图像由30个单个帧组成,曝光时间为2.5 s,剂量为22.9 e -e -s -s -s -s -1〜22.9 e -s -sous -2Å -2。最后,总共收集了18,365个电影堆栈,散焦范围为-0.5至-2.0μm。
使用MotionCor2(参考文献60)对所有显微照片进行了运动校正,并使用CTFFIND4(参考文献61)确定对比度转移函数(CTF)。使用EMAN2(参考文献62)中的NeuralNet选项对所有粒子进行自动攻击,并手动检查。所产生的盒子颗粒数为3,804,753。然后,将粒子坐标进口到Relion63,在其中进行了三轮2D分类,以删除具有较少分析特征的2D类平均值。将所选的1,823,256个颗粒导入到CryoSparc64以生成依次图,并得出了具有清晰RNA特征的好图。然后,从该地图开始,进行了不均匀的细化65以及局部和全局CTF细化,得出的地图从1,181,331个颗粒分辨率为2.2Å。进一步进行3D变异分析66以对略有不同的构象进行分类,并获得了两个构象。在两个类别的两类不均匀修补后,分别为708,006和473,325个颗粒,分别为2.2Å和2.3Å,获得了最终地图。通过CryoSparc中FSC曲线的0.143标准估算了最终图的引用分辨率。使用CryoSPARC局部分辨率估算使用默认值计算本地分辨率图。在扩展数据表1和扩展数据中查看更多信息图1。
使用Phenix.Auto_Sharpen67进一步处理2.2Å和2.3Å的重建图。半图还磨刀以建模水和离子。在phenix.auto_sharpen中,B_SHARPEN参数反映了锐化的量。对于2.2Å地图,施加的B_SHARPEN为79.23,最终B_ISO为20.00(最初的99.23),对于2.3Å地图,B_SHARPEN为74.07,B_ISO为30.45(初始94.07)。B_ISO表示随着傅立叶空间中频率的增加,振幅降低了速度的速度。从理论上讲,由于颗粒较少,2.3Å映射的较高的B_ISO可以归因于(1)较低的信噪比(SNR),并且/(2)比2.2Å地图中具有更大原子位移的粒子构象。
首先将全长Apo四膜膜核酶(PDB ID:7EZ0)29的原子模型分别刚性地拟合到2.2Å和2.3Å锐化的图中。使用Phenix.Real_Space_refine将所得模型改进到锐化的地图中,并使用默认参数和五个循环68,具有二级结构和几何结构约束。然后将模型进一步完善,并在Chimerax(v1.6.1)68,69,70中使用Isolde进一步改进,从而改善了模型的几何形状和冲突。然后将游泳应用于模型离子和水分子(见下文)。最终模型的质量由Molprobity71和Q Score31评估。在扩展数据表1中总结了地图重建和模型优化的统计数据。所有图形均使用Chimera72和Chimerax70进行。
游泳程序可在GitHub(https://github.com/gregdp/segger(v2.9.7);和脚本(https://github.com/daslab/daslab/daslab/water-cryoem-ribozyme))上获得,并在密度上确定了峰值,并确定了这些峰值,并模拟了这些峰,并确定了这些峰值,mg2+ ion或non not。以前,使用2σ密度阈值,没有Q分数或半映射阈值17的1.34Å地图上游泳。在这项研究中,密度阈值已增加到5σ,并施加了最小Q分数标准,包括在完整地图中的完整和半映射中的Q分数以及结合核苷酸的Q分数,以提高严格度。具体而言,将游泳应用于2.2Å和2.3Å的冷冻EM锐化地图,使用过程中的半映射,并在过程中使用锐化的半映射,并在鸟嘌呤结合位置上放置了额外的鸟嘌呤,随后将其删除,如下:如下:
仅将直接与RNA结合的Mg2+离子建模。可以想象,我们的模型可能遗漏或错误分配了单价离子,例如Na+和Cl-以及通过水与RNA相互作用的MG2+离子(请参阅扩展数据中的讨论图6K-M和9E,F)。
如果在2.2Å和2.3Å型号中都发现了高信心水,我们提到了它们。有共识。共识是通过同时传递两个标准来定义的:可叠加和相同的结合位点,确保我们捕获了空间可叠加且具有相同局部化学环境的水域和MG2+离子。在局部RNA原子对齐后,可叠加的水彼此之间相互1。局部RNA原子都是核苷酸中的沉重原子,其原子含有10Å或更靠近两种水的原子。相同的结合位点定义如下。对于比较一对水中的每条水,获得了一组“接近RNA原子”,即远离水的RNA原子2.5–3.2Å,如果没有RNA原子在3.2Å之内,则会膨胀0.3Å。如果在扩大的距离内发现了相同的近距离原子,则在2.5–3.5Å的其他水中发现了相同的距离,反之亦然,则据说这对水具有相同的结合位点。距离扩大以考虑距离不确定性。例如,如果有一对水域,一个在2.2Å模型中,另一个是2.3Å模型中通过两个标准,则水域被视为共识水,否则,它们是非共识水域。相同的标准用于MG2+离子,近距离粘合剂距离为1.8-2.2Å,扩展的距离为1.8-2.5Å。通过游泳对非传记水和MG2+离子进行建模,但不符合可叠加的非常严格的要求,并结合2.2Å和2.3Å地图中的相同RNA位点。
用共有的水和离子(分别为2.2Å和2.3Å型号的9CBU和9CBW和9CBW沉积在PDB中,分别为所有自动水和离子(分别为2.2Å和2.3Å型号的9cbx和9cby)和不同的模型。仅对于自信的水和离子放置,应使用第一个型号。根据公式B = 150(1- Q)计算报告的B因子(参考文献18)。
这些共识标准被相同使用来评估与以前的X射线和冷冻EM模型的重叠(PDB ID:7EZ0、7EZ2、7R6L,7XD5、7XD6、7XD7、7YG8、7YG8、7YG9、7YGA,7YGA,7YGA,7YGB,7YGB,7YGB,7YGB,8I7N,1GID和1GID,1HR2和1HR2和1HR2和1HR2和1HR2和1HR2当手动检查序列比对时,比较了所有以前的结构。为了比较多个模型(扩展数据图5),将所有模型的水和Mg2+离子组合在一起,包括重叠的水。对于“2.2Å和2.3Å”类别,仅使用共识水和MG2+离子。
对于所有分析和平均,忽略了氢,仅考虑重原子。使用三线性插值计算地图值。通过MAP到模型的原子分辨率,Q分数量化量化的分解性,该度量与轮廓级别无关。所有Q分数计算,包括具有半图的分数,使用命令行工具(https://github.com/gregdp/mapq)中的锐化地图和默认参数计算。通过在每个残留物中的所有重原子中平均而没有大规模加权的平均Q分数计算Q分数。预期的Q分数是使用先前发布的线性关系31计算得出的。两个模型之间的RMSD是在所有重RNA原子的叠加后计算的。使用自定义脚本计算RNA原子的距离。
为了评估游泳标准的严格性,对RNA的溶剂壳中的位置进行了采样,并通过游泳标准评估每个位置。为了抽样位置,一个包含每1.67Å点的RNA的立方体,仅在良好地分辨核苷酸中的RNA重原子(Q> 0.6)中,将点与RNA重原子之间的点保持在1.5-3.5之间。
为了评估游泳模型水在替代地图中的适合状态,它们未在其中建模的地图,在局部对齐RNA(RNA核苷酸10Å之内的RNA核苷酸)之后,将水放在另一个地图中。如上所述,评估了这些职位的游泳标准。
详细信息和输入文件可在GitHub(https://github.com/daslab/water-cryoem-ribozyme)上找到,可以在Stanford Digital存储库(https://doi.org/10.25740/sw275qs6749)中找到仿真文件。原子RNA坐标是从2.2Å模型中取出的。为了确保模拟过程中的RNA折叠稳定性,将20 mg2+离子与特定RNA位点结合在一起,并在模拟的初始条件下被预位。这些是在2.2和2.3Å地图中以较早版本的游泳版本建模的。在模拟过程中,这20个离子中的一些移动,而在整个模拟过程中,有些则保持其位置。由于必须通过分子动力学放置Mg2+离子,但有偏见(即,不是随机采样MG2+离子结合位点),因此没有详细分析分子动力学与冷冻-EM MG2+离子结合位点之间的比较(详细分析)(补充数据,文件3)。添加了75个额外的MG2+和196 Na+以中和系统。对于每个力场的六个模拟,随机添加了这些其他离子,而对于四个模拟,使用库仑电势引导的放置方法“添加”在LEAP74中添加。使用NMG58,76,77,77,78,79,使用了三个力场,使用MMG和ParmBSC0χOL3使用了三个力场。使用内部参数文件对MMG和NMG进行参数化,并放置在TIP4P-D八面体盒中。对于每个独立的模拟,将系统用最陡的下降的500个步骤最小化,然后将500步的共轭梯度下降3次。在RNA上使用了25、20和15 kcal mol -1Å2的谐波约束,分别在第一,第二和第三次最小化上使用。然后将系统在12.5 PS上从0 K加热到100 K,以15 kcal mol -1Å -2的约束来谐波限制RNA。该系统在125 ps上以相同的约束从100 k到310 k进一步加热。所有模拟均在单个图形处理单元(GPU)上运行 使用Amber20计算统一设备体系结构(CUDA)版本的粒子网状分子动力学(PMEMD)80。该系统在RNA原子上的谐波约束30 ns平衡。约束强度从15 kcal mol -1Å -2开始,在前5 ns中每1 ns降低2 kcal mol -1Å2,然后在接下来的5 ns中每1 ns每1 ns降低1 kcal mol -1Å -2,最后将其减少为0.1 kcal mol -1 kcal mol -1Å2ns,对于最终20 ns。使用NPT集合,Berendsen恒温器和Barostat,在310 K和1 Bar上进行生产模拟(无限制)。每200 ps,可以保存快照。所有模拟均运行400 ns。这些模拟使用了2-FS步骤,并使用Shake限制了与氢原子的键长。非键相互作用的截止值为9Å。
用于所有分析的脚本可在GitHub(https://github.com/daslab/water-cryoem-ribozyme)上获得。将模拟自动成像,并使用CPPTRAJ使用所有RNA重原子对齐1-NS框架。对每1 ns采样的快照进行分析;为了减少文件大小,以3.5Å的限制水。使用具有MDanalysis81,82的自定义脚本进一步分析了模拟,包括RMSF和距离计算。在整个计算过程中,OP1和OP2被视为OP,并且忽略了氢。
For assessing the stability of the simulations generally, the RMSD from the 2.2 Å and 2.3 Å model was calculated from all RNA atoms after aligning to the ribozyme core defined as residues 31–42, 46–56, 96–102, 107–112, 116–121, 200–205, 208–214, 262–268, 272–278,307-315-316,318–331和405–406。为了评估二级结构的稳定性,使用Mdanalysis提取了每个框架的PDB形成坐标,并从Rosetta RNA_MOTIF获得了有关碱基配对的信息。分析了该模型的Watson-Crick-Franklan基础对,并使用内部脚本报告了它们所维持的框架的百分比。RibodRaw83用于绘制起始坐标的二级结构图。相互作用是根据存在相互作用的框架百分比手动着色的。
通过使用MDanalysis基于所有RNA重原子对齐,根据模拟对RNA核苷酸的RMSF和B因子的B因子进行计算。每个核苷酸计算是非质量加权平均值以匹配Q分数的平均值,而Q得分不给质量Q分数加权。使用Chimerax Molmap计算分子动力学模拟的图,分辨率为每个模拟的所有帧分辨率为2.2Å。还计算了在这些分子动力学模拟的图中计算的Q分数,而RMSF计算中使用的平均结构以获得“ SIMQ”。
使用所有模拟产生的密度定义了分子动力学结合位点(见下文)。用Segger鉴定出水,Na+和Mg2+离子的分子动力学密度中的峰。将它们过滤以将峰排除在距另一个峰的距离大于1Å的地方,从而选择具有最高密度值的峰。分析了30个模拟的每个帧,以识别水和离子,无论它们是否在结合位点以及它们在每个结合位点的位置。首先,对于每个核苷酸,一个邻域被定义为10Å以内的核苷酸集。其次,将模拟的每个框架局部与这些邻域的每个邻居进行了对齐,从而保存了此局部对齐框架中的水和离子位置。也保存了每帧中每个水和离子的RNA原子集。第三,对于每个框架,所有社区都合并在一起。对于在不止一个社区中存在的水域,坐标是从水或离子最接近邻里中心的社区中选出的。第四,如果每种水在分子动力学峰坐标的2Å之内,则将每个水标记为分子动力学峰,并且与相同的RNA原子结合。
据说分子动力学结合位点,如果它们结合了相同的RNA原子,并且在分子动力学峰位置的2Å之内,则与冷冻EM游泳的水或Mg2+离子重叠。
使用分子动力学结合位点的列表,每个模拟的水占用率定义为在去除RNA偏离任何一个冷冻EM结构3.4Å3.4Å3.4Å3.4的框架之后,该位点中的水与该位点结合的框架的比例。通过取用该结合位点中所有水的对齐坐标并计算该集坐标集的RMSF来计算每个分子动力学结合位点的水RMSF。
使用MDanalysis计算RNA原子粘合剂的摘要统计数据(扩展数据图7),以计算所有RNA重原子与离子或水域之间的距离。离子和水分别使用1.8–2.5Å和2.5–3.5Å的距离切口。仅计数至少10帧(10 ns)的水或Mg2+离子的结合位点。计数mgRNA值(https://csgid.org/metalnas/),仅计数内壳的配位。
对于MG2+离子,将停留时间定义为在该结合位点发现单个MG2+离子的时间,允许1帧跳过。
为了获得分子动力学模拟的溶剂密度,首先,通过获得在2.2Å和2.3Å地图中每个模型水或离子在10Å不超过10Å以内的RNA核苷酸的列表来分离局部目标区域。对于每组核苷酸,将模拟框架对齐在该核苷酸的重原子上,然后使用MDANALALY分析的密度分析分别计算RNA,水,Mg2+离子和Na+离子密度。在每个局部区域的30个模拟中平均这些密度平均。然后,为了将所有区域组合到每个体素的复合图中,将所有中心均在10Å中的子包的密度值平均,并由从子束的中心到其密度正在计算的素的距离的倒数。
为了获得每种核苷酸类型(A,C,G或U)周围的平均密度,计算了将所有核酶核苷酸酶与其各自的参考核碱酶保持一致的转换。然后,对于每种变换,将2.2Å分辨率图(从RNA重原子划分>1.8Å),分子动力学水密度(如上所述平均),并均匀地均匀地跨每种核苷酸类型(A,C,G或U)转换。
为了评估所研究密度的总体一致性,将所有分辨出的RNA原子(Q> 0.6)的2.2Å密度用作参考。比较图为(1)“独立图”,根据2.2Å和2.3Å模型的分辨良好的RNA原子(Q> 0.6)的对齐方式进行转换后的2.3Å图,(2)2.2Å模型MOLMAP在Chimerax在Chimerax中使用2.2Å计算出2.2Å;将水密度添加到MG2+密度加权1.5,(3)用水,Mg2+和Na+密度分别用1.0、1.5和1.3的重量汇总的分子动力学密度,上面描述了密度,(4)“随机映射”,2.2Å映射的所有密度均值均匀的壳壳壳随机壳。通过z得分将密度归一化,然后分离出该区域的体素。互相关系数和相互信息是由Vasishtan和TopF84定义的,使用20个密度箱以获取共同信息。
为了进行溶剂密度的全球比较,将水和离子的建模作为分类任务施放。因此,当密度高于一定阈值时,预测任务将变为预测。对于本研究,2.2Å地图用作参考图。从所有分辨出的RNA原子(Q> 0.6)中的区域1.8. –3.5Å作为数据,将所有高于3σ的体素定义为“阳性”,所有其他体素定义为“负”。比较图如上所述。这些比较图的阈值变化以评估分类精度。精确度(比较图的当前阈值的比较阈值的一部分正确地分类为阳性),召回率(所有阳性的分数的一部分,这些阳性的比较映射的当前阈值高于当前阈值的分类)和虚假阳性率(所有负面效率的分数)在当前的当前比较图上的截止图上的截止图)都计算出各种阈值。从这些值中,绘制了Precision-Recall曲线(PRC)和接收器工作特性(ROC),并计算了曲线下的面积(AUC)。由于类的不平衡(大部分地图都是空的),因此Au-prc是首选的测量。最后,计算了跨阈值的最大MATTHEWS相关系数。
为了进行局部精度测量,2.2Å地图中的密度约为1.8. –3.5Å,使用3σ阈值进行分类,将单个核苷酸用作数据。由于RNA不同区域的实验不确定性方差,因此对AU-PRC进行了归一化以比较跨区域的分子动力学预测的准确性。2.3Å地图Au-prcexp的Au-prc的最低限制归一化是天花板(1),而随机洗牌密度的Au-prc,Au-Prcrandom,是地板(0)。任何具有高实验不确定性的核苷酸(Au-prcexp <0.2)的得分为0。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。