2025-06-24 14:35来源:本站
Ca的基因组中的19个候选SBP基因。P. ubique菌株htcc1062通过搜索TransportDB 2.0数据库59(http://membranetransport.org; 2020年1月22日访问)确定。这些基因之一SAR11_0371被注释为Uniprot中的“可能的跨膜受体”,并显示出一个非典型的预测域结构,该结构由短的SBP样结构域(170个氨基酸)组成(170个氨基酸),然后是一个固定的螺旋结构域和未鉴定的C端子域。此外,基因组上下文分析表明,与CA中的其他ABC SBP基因不同。P. ubique HTCC1062,SAR11_0371未与编码ABC传输系统的膜渗透酶或ATP结合盒组件的基因共定位。因此,SAR11_0371被认为不代表依赖SBP的运输系统的SBP组件,而是被排除在分析之外。我们还试图通过搜索CA中的蛋白质的UniProt数据库来识别其他SBP基因。P. ubique属于PFAM氏族CL0177(PBP; Pariplasmic结合蛋白)和Cl0144(Periplas_bp; Pariplasmic结合蛋白喜欢);但是,此搜索没有返回任何其他候选基因。
每个SBP的蛋白质序列来自CA。P. Ubique HTCC1062从Uniprot数据库中获得。使用SignalP 5.0 Server60预测信号序列并删除。然后对蛋白质序列进行反翻译,并在大肠杆菌中表达密码子优化,并从Twist Bioscience或Integrated DNA Technologies中获得所得基因作为合成DNA。将合成基因克隆到PET-28A(+)表达载体的NDEI/XHOI位点,该基因使用融合内的HD克隆试剂盒(Takara Bio)通过融合克隆(Takara Bio),产生具有N-末端六氢类苯胺标签和螺栓蛋白标签的表达构建体。通过Sanger测序(FASMAC)确认每个表达载体的正确组装。推定的CSID基因SAR11_1354和CA的几种同源物。P. ubique HTCC1062 SBP(补充表8)类似地克隆到PET-28A(+)矢量中,只是从SAR11_1354,SAR11_0266(FUB)或SAR11_1290(SAR324)的SAR11_1354,SAR11_0266(FUB)的构建体中删除了凝血酶标签(SAR324)。补充表9列出了本研究中使用的寡核苷酸和合成基因的序列。
最初在30°C和17°C下在Luria-Bertani(LB)和出色的肉汤(TB)培养基中生长的大肠杆菌BL21(DE3)细胞中测试了蛋白质表达。SAR11_0655在17°C下在LB培养基中显示出最佳的溶解度表达,SAR11_1203在30°C下在TB培养基和7种蛋白质中显示出最佳的溶解度表达(SAR11_0797,SAR11_0807,SAR11_0807,SAR11_0864在17°C的结核培养基中的可溶表达。接下来,对剩余的蛋白质在17°C下的结核病培养基中测试了大肠杆菌混洗的T7细胞(新英格兰生物群)的表达。该菌株表达二硫键异构酶DSBC,可以通过促进二硫键的正确形成来增加细胞质蛋白的可溶性重组表达。在这些条件下实现了SAR11_0769,SAR11_0953,SAR11_1302和SAR11_1336的可溶表达。由于缺乏剩余四种蛋白质的可溶表达(SAR11_0266,SAR11_0271,SAR11_1290和SAR11_1346),我们还测试了每种蛋白质的一两个密切同源物的表达(补充表8)。SAR11_0271来自Ca的同源物。pelagibacter’s sp。HIMB1321(表示为SAR11_0271*)可以在17°C的TB培养基中以shuffle T7细胞的形式表达,而SAR11_1346来自同一物种的SAR11_1346同源物(表示为SAR11_1346*)可以在BL21(DE3)细胞中以17°C中的BL21(DE3)细胞中的可溶性表达。SAR11_0271*和SAR11_1346*分别与CA的相应蛋白质共享91.4%和88.9%的序列身份。P. ubique HTCC1062,结合位点残基完全保守(补充图5),表明同源SBP的功能和特性可能相同。SAR11_0266或SAR11_1290的同源物不能以BL21(DE3)或洗牌T7细胞以可溶形式表达。SAR11_0266和SAR11_1290无HIS6或凝血酶标签的表达也产生了不溶性的蛋白质。
通常通过SDS -PAGE分析评估蛋白质表达,如下所示。通过电穿孔转化的相关表达载体的细胞从冷冻的甘油量扩散到含有0.2%(w/v)葡萄糖和25 µg ml -1 kanamycin的LB琼脂板上,并在30°C孵育过夜。然后将细胞刮成一小撮LB培养基中,并用于在10 ml圆底管中以0.05的启动OD600接种3 mL相关的生长培养基,该培养基在10 ml圆底管中含有25 µg ml -1 kanamycin。将培养物在37°C下以220 rpm的振动孵育,直到OD600达到0.5。将一毫升等分试样转移到清洁圆形管,以及将异丙基β-1-硫代乙型甲酰胺糖苷(IPTG)添加到终浓度为0.5 mm。将诱导的培养物与在17°C的220 rpm摇动过夜或30°C孵育3小时。将每种培养物的500 µL等分试样重悬于裂解缓冲液(20 mM Tris,0.5 m NaCl,1%(v/v)Triton X-100,pH 8.0)中,并在室温下孵育10分钟。将细胞裂解物以21,000g离心5分钟(4°C)。将细胞裂解液的可溶部分转移到包含30 µL的管子纯化Ni-NTA树脂(Roche)的管中,悬浮在500 µL缓冲液A中(8 m尿素,TRIS,0.5 mm NaCl,0.5 m NaCl,pH 8.0),而在500吨的液体液体中则是5000 morly liff的21 mard液体,500 000吨,裂解液的无体液体,500 µlif sylys and lif a rylif a a lif a a lif a rylif in collif Fuffered a a liffered a a liff sellif in Coldered a a liffif。5 min, and then transferred to a tube containing 30 µl Ni-NTA resin suspended in 500 µl buffer A. In both cases, the resin was incubated at room temperature for 10 min, washed twice with 500 µl buffer A, and then eluted by incubation with 50 µl buffer B (8 M urea, 20 mM Tris, 0.5 M NaCl, 0.5 M imidazole, pH 8.0) at room temperature for5分钟。将15微升的上清液与5 µL的4×SDS-PAGE样品加载缓冲液混合,并在90°C加热10分钟,然后加载到4-15%的预铸式SDS-PAGE凝胶(Bio-Rad)上。凝胶在200 V时运行30分钟,并用Coomassie Blue可视化。
For expression and purification of the Ca. P. ubique SBPs, E. coli BL21(DE3) or SHuffle T7 cells transformed with the relevant expression vector were spread from a frozen glycerol stock onto an LB agar plate containing 0.2% (w/v) glucose and 25 µg ml−1 kanamycin, and incubated at 30 °C overnight. The cells were then scraped into 3 ml LB medium, and 500 µl of the resulting cell suspension was used to inoculate 500 ml LB or TB medium supplemented with 25 µg ml−1 kanamycin in a 2 l or 3 l flask, preheated at 37 °C. The culture was incubated at 37 °C with shaking at 220 rpm until the OD600 reached 0.5, then cooled briefly in an ice-water bath until the temperature reached ~25 °C. IPTG was added to a concentration of 0.5 mM, and the culture was incubated at 17 °C with shaking at 220 rpm for a further 16 h. Cells were pelleted by centrifugation (3,300g, 15 min, 4 °C) and frozen at −20 °C until use. For protein purification, cells were thawed on ice, resuspended in 100 ml Ni binding buffer (20 mM Tris, 500 mM NaCl, 20 mM imidazole, pH 8.0), and lysed by sonication. After addition of 500 U Benzonase Nuclease (Sigma-Aldrich) to digest DNA, the cell lysate was centrifuged at 10,000g for 1 h (4 °C). The supernatant was filtered through a 0.45-µm syringe filter and then loaded onto a 1 ml HisTrap HP column (Cytiva) equilibrated with Ni wash buffer using an ÄKTA Pure FPLC system (Cytiva). For purification under native conditions, the column was washed with 10 ml Ni binding buffer followed by 10 ml Ni wash buffer (20 mM Tris, 500 mM NaCl, 44 mM imidazole, pH 8.0), and then the target protein was eluted in 10 ml Ni elution buffer (20 mM Tris, 500 mM NaCl, 500 mM imidazole, pH 8.0). For purification under denaturing conditions, the column was washed with denaturing Ni binding buffer (8 M urea, 20 mM Tris, 250 mM NaCl, 20 mM imidazole, pH 8.0) at 1 ml min−1 for 30 min after loading of the clarified cell lysate, 并用10 mL定性Ni洗脱缓冲液(8 m尿素,20 mM Tris,250 mM NaCl,250 mM NaCl,250 mM咪唑,pH 8.0)洗脱靶蛋白。使用10 kDa分子量截止(MWCO)Amicon Ultra-4离心自旋浓度(Merck-Millipore),将纯化在天然条件下纯化的天然条件下纯化的蛋白浓缩至400 µl,并使用SuperDex 200增加10/300列(Cytiva),通过尺寸 - 分解色谱纯化,在DSF Buffere(cytiva)中增加了10/300列(cytiva)。为了储存,将蛋白质浓缩至0.5-2 mL的体积,并将甘油添加到10%(v/v)的浓度中。然后在液氮中在100-200 µl等分试样中闪烁蛋白质,并保存在-80°C下直至使用。来自肠链球菌的Argt是从PETMCSIII质粒表达的,并如前所述纯化61。
在大多数情况下,将蛋白质在变性条件下纯化的蛋白稀释至0.5 mg ml -1浓度,在变性的Ni结合缓冲液(8 m尿素,20 mM Tris,250 mM NaCl,20 mM NaCl,20 mM咪唑,pH 8.0)中,浓度为10–30 ml,并转移至10 kDa mwco snakeSkin dia tia ia liosisis itocific itociacity(ph)。然后将蛋白质透析在4°C下在2 L透析缓冲液(20 mM Tris,150 mM NaCl,pH 8.0)的情况下进行透析,并在24小时内进行3个缓冲液的变化。收集蛋白质并使用10 kDa MWCO Amicon Ultra-15离心机将其交换为DSF缓冲液,然后浓缩至400 µL,并按照上述尺寸排斥色谱法纯化。对于SAR11_1346*,使用快速稀释进行重新折叠可获得单体蛋白的提高产量:2毫升变性蛋白(在NI结合缓冲液中,在变性的Ni结合缓冲液中)逐渐添加至40 mL预冷的折射缓冲液(20 mM Tris,150 mM nac nac nac nacl,v/incl,V/v/v/v/v/v/v/v/v),添加了NI结合缓冲液)的下降液(V/v/vy)。4°C搅拌20小时。然后通过上述尺寸排斥色谱浓缩并纯化该蛋白质。
使用SteponePlus实时PCR系统和Stepone软件(Applied Biosystems)基于文献协议62,63进行了DSF实验。在Twin.TEC实时PCR板(Eppendorf)中制备反应混合物,并包含5×Sypro橙(Sigma-Aldrich),2.5 µM蛋白质和2 µL 10×配体,总体积为20 µL DSF Buffer。将板用光学清晰的密封膜密封,并以2,000克离心1分钟,然后加载到实时PCR仪器中。温度以1%(约1.33°C min -1)的速度升高,通常在目标蛋白的熔化温度(TM)的60°C窗口上。使用ROX通道监测荧光。通过将荧光强度相对于温度衍生而定,并将所得数据拟合到R软件中TM附近的6°C窗口中的二次方程来确定TM值。
最初筛选蛋白质与四个表型微阵列板中的代谢产物结合,PM1至PM4(生物学)。将每个井的含量溶解在50 µL(PM1至PM3)或20 µL(PM4)无菌过滤水中,每个井中的浓度约为10-20毫米63。然后将板用铝密封膜密封,并存储在-80°C下。在使用之前,将板在室温下解冻,然后在30°C摇动,直到化合物重新溶解。如上所述,将每种化合物的两个微量液添加到制备的18 µL反应混合物中。与整个板上的中位数相比,TM增加了2°C,表示为结合63,64。
为了筛选单个化合物和验证性测定,将化合物以100 mm的浓度溶解在配体缓冲液(0.1 M HEPES pH 7.5)中,并以1 M NaOH或1 M HCl调节pH值(具体而言,如果必要时,如果在DSF Buffer中稀释的10 mm溶液的pH值,则在DSF Buffer的10 mm溶液中均在6.5-8.0范围内。这些储备溶液存储在-20°C。将每种化合物的两个微量液直接添加到18 µl反应混合物中,最终浓度为10 mm,或者在DSF缓冲液中首先稀释10倍或100倍,在测定中的最终浓度为1 mm或0.1 mm。补充表3中提供了用于筛查的化学物质,包括供应商和目录数,钠(R) - 和(S)-2,3-二羟基丙烷-1-磺酸盐均根据(R) - (R) - (S)-3-氯-1,2-丙二醇协议遵循文献协议65和Vererified 1H和1HMR合成。
在陷阱和TTT SBP的情况下,SAR11_0864和SAR11_1203,我们假设由于双相融化曲线在生物学筛选实验中存在ISETHITATE中观察到的双相融化曲线可能需要高亲和力结合的金属离子,从而在生物学筛选实验中存在了与活性和不活跃的蛋白质的混合物(表明)的混合物(表明是无效的蛋白质)。SBP的配体和很大程度上未充电的结合位点(SAR11_1203)。因此,我们测试了添加金属离子(Mg2+,Ca2+,K+,Zn2+,Mn2+,Co2+,Ni2+,Fe2+和Fe3+)对Isethate与SAR11_0864的结合以及DSF(补充图6)与SAR11_1203结合的影响。如上所述,使用重折叠的蛋白质进行DSF实验,并添加1 mM金属离子和1 mM配体。基于这些结果,考虑到这些SBP的DSF和ITC结合实验,包括在Seawater66中的每种金属离子的浓度,10 mM CaCl2(SAR11_0864)或53 mM MGSO4(SAR11_1203)。
使用微局部PEAQ-ITC系统(MALVERTANTICT)进行ITC实验。将蛋白质样品重新折叠并新鲜纯化(不是冷冻),并在用于尺寸排斥色谱法的同一批DSF缓冲液中制备蛋白质和配体样品,以最大程度地减少稀释热。对于SAR11_0864和SAR11_1203,将氯化钙(最终浓度10.3 mm)或硫酸镁(最终浓度为53 mm)添加到蛋白质和配体样品中。在25°C下以700 rpm的搅拌和10 µCAL S -1参考功率进行实验。滴定参数的变化取决于蛋白质的产量,活性蛋白的比例以及相互作用的亲和力和焓。在典型的滴定中,将35 µM蛋白用1×0.4 µl和19×1.6 µl的配体注射滴定,并选择配体浓度在滴定结束时将配体过剩的配体过量> 1.5倍。ITC实验通常至少重复进行。
对于简单的1:1结合相互作用,通过将数据拟合到Microcal Peaq-ITC分析软件中的一组位点模型来确定相互作用的关联常数(KA),焓(ΔH)和化学计量法(N)。在SAR11_0769 + - 葡萄糖相互作用的情况下,通过贝叶斯拟合对修改的竞争结合模型来估计热力学参数,该模型结合了一个附加参数,以说明每种异构形式中配体的分数,以及在PYTC Software中实现的两种位置模型;后一个模型等同于微局部软件中的两集位点模型,除非没有对每次注入的流离失所体积相关的热量进行较小的校正(以与PYTC中的其他模型保持一致)。SAR11_0953 + -GLUTAMATE,SAR11_1203 +柠檬酸盐,SAR11_1210 + - 精氨酸,SAR11_1336 +甘氨酸BETAINE和SAR11_1346* + - 亮氨酸相互作用通过竞争性的移位实验68,sar11_1346*确定-piponements68,sar11_1336*甘氨酸分别包括在细胞中的固定浓度下,以减少对感兴趣配体的明显结合亲和力。通过贝叶斯拟合与PYTC软件中的竞争结合位点模型分析了这些竞争性结合实验的数据。为了确认SAR11_1210 + - 精氨酸相互作用的高亲和力,进行了一个竞争性结合实验,其中SAR11_1210和来自S. enterica的SAR11_1210和ARGT(在同一浓度(28 µm)中包括在细胞中包括-15 nm的-15 nm),并与-arginine滴定。同样,对于SAR11_1210(E108A)+精氨酸相互作用,SAR11_1210(E108A)和SAR11_1210(每个35 µm)的混合物用-artinine滴定。对于这些滴定, the data was fitted to a two-sets-of-sites binding model as described above to obtain thermodynamic parameters for both protein–ligand interactions. For all analyses, the heat of dilution was assumed to be a small constant value and included as a fitted parameter in the model. The validity of this assumption was confirmed for each ligand by performing a control titration where the ligand was injected into DSF buffer.
使用基于文献方案的分光光度测定法分析了铁()与SAR11_1238的结合69,70。使用Multiskan GO分光光度计(Thermo Scientific),在96孔板中以1 nm的带宽(Thermo Scientific)在室温(25°C)的室温(25°C)下记录UV – VIS光谱。所有分光光度测定法使用初始蛋白浓度为100 µM和200 µL的初始体积。首先,使用离心浓缩器将纯化的SAR11_1238解冻并交换为50 mM Tris,200 mM NaCl缓冲液(pH 8.0),并记录了所得蛋白质样品的光谱。为了制备未配合的蛋白质进行铁结合测定,将蛋白质交换为50 mM Tris,200 mM NaCl,20 mM柠檬酸钠缓冲液(pH 8.0),三个回合的30倍稀释和浓度,从而允许螯合和去除金属配体。然后,用50 mM Tris(200 mM NaCl缓冲液(pH 8.0))通过四回合30倍稀释和浓度去除柠檬酸盐。通过滴定8×或10×5 µl的800 µm铁()溶液注射8×或10×5 µl的溶液,通过滴定无配合的蛋白(200 µL 100 µm溶液)进行结合测定,该溶液是由铁()氯化物和2.5倍摩尔过量的三氧化三生酸盐过量(确保了citerate citirble)的2.5倍过量的。为了确认SAR11_1238结合铁()而不是铁() - 柠檬酸盐复合物,该蛋白在相同的条件下也用800 µm铁(II)硫酸盐滴定;在测定的有氧条件下,铁()迅速氧化为铁()69。每次注射后,记录1分钟(铁(铁())或15分钟(铁(铁(铁(铁(铁(铁(铁(铁(铁(铁(铁(铁(Iron)))记录)))光谱。最后,使用柠檬酸盐的竞争结合测定法来估计SAR11_1238对铁()的亲和力。蛋白质用两倍摩尔过量的铁()溶液饱和,稀释至1 ml的体积,然后在4°C下在500 mL的50 mM Tris,200 mM NaCl缓冲液(pH 8.0)中透析过夜,过夜,以去除多余的铁(去除多余的铁() 和柠檬酸盐。然后将蛋白质浓缩至100 µm,并用500毫米柠檬酸钠的5倍连续稀释液注射5 µl(在50 mM Tris,200 mm NaCl缓冲液中调节至pH 8.0)。每次添加后5分钟记录440 nm处的吸光度。将数据拟合到双曲线曲线,从而使柠檬酸盐的显而易见的KD为9.0 mm。鉴于柠檬酸盐对于铁()的KD 〜10-17 m,这意味着SAR11_1238在〜10-19 m的速度上具有kd,类似于先前表征的铁() - 结合蛋白70,71。
对于SAR11_0769/ - 葡萄糖和SAR11_1210/ - 精氨酸结构,蛋白质首先在本机条件下通过镍亲和色谱法表达和纯化,如上所述。在添加20倍过量的 - 葡萄糖(SAR11_0769)或 - 精氨酸(SAR11_1210)之后,该蛋白在HiloAD 26/600 SuperDex 75 PG柱(Cytiva)上通过尺寸 - 排斥色谱进一步纯化,在3×Crystallization hilutization superdex 75 pg柱(Cytiva)中,在3×Crystallization bufferization buffer(60mmmmmm heass,150 mm s,150 amm ph)中。收集含有靶蛋白的馏分,并将葡萄糖(SAR11_0769)或精氨酸(SAR11_1210)添加到30 µm的浓度中。将蛋白质浓缩至〜500 µl,在水中稀释三倍,以将NaCl浓度降低至50 mM,然后进一步浓缩至12 mg ML -1。对于SAR11_0769/-Galactose和SAR11_0655/-Pyroglutamate结构,以相同的方式表达蛋白质并纯化蛋白质,只是没有添加配体。使用蒸气扩散法在20°C的悬挂液中获得蛋白质晶体,然后在液氮中冷冻保护并闪烁。每种蛋白质的结晶和冷冻保护条件在补充方法中给出。使用用于自动数据收集的动物园套件,在弹簧-8同步加速器(Harima,Japan)的Beamline BL32XU上收集X射线衍射数据72。使用KAMO74自动将数据自动索引,集成,缩放和合并。该结构是通过分子替换在Phaser75或molrep76中求解的。对于SAR11_1210,将农杆菌(PDB ID 5OT8)的Opine结合蛋白的结构用作搜索模型。在其余情况下,使用了AlphaFold2模型77。然后,通过RefMac78,Phenix79和COOT80中的迭代真实空间和相互空间改进来完善结构。补充表10和补充表11给出了数据收集和改进统计。在Pymol中可视化结构。
使用PD-10脱盐柱(Cytiva)将纯化的天然条件下纯化的SBP交换为200 mM乙酸铵,并浓缩至〜1 mm。将10-nmol等分试样的蛋白质与10 µl的300 µMα-甲基葡萄糖苷(作为内部对照)和200 µL甲醇混合。将混合物在1500 rpm的24°C下搅拌10分钟,然后在4°C下以21,000g离心20分钟。使用真空蒸发剂将上清液蒸发至干燥,并在20 µl无水吡啶中重新溶解,并通过添加30 µl N-甲基N-(三甲基二甲二基甲二基甲二基甲硅烷基)三氟乙酰氨酰胺(MSTFA)来衍生作用,该含量为1%三甲基甲硅烷(SUB)contimecto contimecco(sub)。在SAR11_1361的情况下,将干燥的样品溶解在20 µl的20 mg Ml -1甲氧胺盐酸盐中的无水吡啶中,并在37°C下在750 rpm搅拌下孵育90分钟,然后在添加MSTFA混合物之前搅拌。将衍生的样品立即注射到配备PAL Combi-X AutoSampler(CTC Analytics)的Agilent 7890 A GC系统(Agilent Technologies)中,并连接到PEGASUS 4D GC×GC×GC TOF-MS仪器(LECO)(LECO)。GC配备了30 m长,0.25 mm内径和0.25 µm膜厚度的DB-1MS色谱柱(Agilent Technologies)。该仪器以脉冲分裂模式运行,分率为2,注射体积为1 µL。入口温度为250°C。氦气用作流速为1 ml min -1的载气。将GC烤箱温度保持在70°C,持续5分钟,然后在12°C min -1至300°C下升高,最后在300°C保持10分钟。6.5分钟溶剂延迟后,从50至500 m/z收集质谱数据。离子源和传递线温度为250°C,电离能为70 eV。使用Chomatof软件(LECO)对NIST数据库进行数据分析和光谱数据库搜索。在对照样品之前对蛋白质衍生的样品进行分析,以防止育率。
使用Ocean Gene Atlas V2.0 Server33进行生物地理分析。来自CA的每个SBP基因的丰度数据。P. Ubique HTCC1062在Tara Oceans OM-RGC_V2_metaG和OM-RGC_V2_metaT数据集中通过BLAST搜索获得,其严格的E-Value阈值为10-30。为了避免包含具有不同传输函数的同源SBP,与相应的HTCC1062 SBP相比,序列同一性少于40%(对于ABC SBP)或55%(对于TRAP和TTT SBP)的命中被排除在分析之外。
为了估计SBP转录物的总丰度,CL0177(PBP; Periplasmin结合蛋白)中38个PFAM家族中的每个家族中的每一个的丰度数据(Periplas_bp; Periplas_bp; Periplasmic结合蛋白喜欢)都包含了转运蛋白家族(PF00405)和任何家族(PF00405),或PF01379,PF01634,PF02621,PF03466,PF09084)使用HMMER搜索OM-RGC_V2_metaT数据集,其E-RGC_V2_metaT数据集,其电子价值阈值为10-10。在31个PFAM家族中,获得了26个点击。对于每个PFAM家族,从Interpro数据库81获得相应的隐藏Markov模型(HMM)。然后,使用HMMAlign将HMMER搜索的蛋白质序列对齐与此HMM对齐,并用于使用HMMer3.4(http://hmmer.org)中的HMMBuild构建新的HMM。然后,使用由此产生的HMM进行了对OM-RGC_V2_metaT数据集的第二个HMMER搜索,其较低的E值阈值为10-5。将所有52次搜索中的命中量合并在一起,并删除了冗余命中,从而总共211,222个独特的SBP基因。两步搜索恢复了23,879个基因中的94%。P. ubique HTCC1062 SBP在应用序列身份阈值之前的爆炸分析中;其余的1267个基因也被添加到SBP基因列表中。最后,计算了每个位点的SBP基因的总丰度。
估计包含来自CA的给定SBP的位点的SAR11细菌的百分比。P. Ubique HTCC1062,我们使用了由Haro-Moreno等人计算的Tara Ocean metagenome数据集中的159个SAR11基因组的募集值。使用50%序列身份和50%的覆盖阈值确定每个相应基因组中每个SBP的同源物的存在。然后为每个站点计算含有给定SBP同源物的SAR11细菌的相对丰度。使用R和GraphPad Prism生成图。
通过对UniProtkB参考蛋白质组和瑞士 - prot数据库的爆炸搜索,鉴定了与感兴趣的SBP同源的蛋白质序列82。对所得序列进行过滤,以去除少数异常长的序列(比平均长度大20%),并在肌肉v3.8.3183中排列。使用Automated1 Option84在三元V1.2中修剪了对齐,然后使用LG+γ20作为替代模型85,用于在FastTree v2.1.11中生成最大样本的系统发育。对于树中的每个蛋白质序列,与Ca的相应蛋白质相比,保守结合位点残基的比例。估计P. Ubique HTCC1062。结合位点残基是从晶体结构(SAR11_0769)获得的,或从AlphaFold2型型86,87中估算。对于此分析,以下替代被视为保守:s/t,i/m,v/l,i/v,l/m,d/e,q/n,a/a/a/a/a/a/a/a/v,f/y,y/w,f/w。使用R88中的GGTREE包装生成系统发育图。使用KRONA89生成了显示分类分布的图(扩展数据图8B)。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。