通过核小体读取器的蛋白质组学分析来解码呈现染色质状态

2025-06-24 06:23来源:本站

  重组人类规范组蛋白蛋白在大肠杆菌BL21(DE3) - codonplus-ril细胞(Agilent Technologies)中表达,来自Pet21b(+)(Novagen)载体,并通过先前描述的凝胶过滤和离子 - 脱位型纯化,并通过变性纯化。

  从Genscript购买了编码人H2A.Z(H2AFZ,UniprotkB:P0C0S5)的密码子优化序列,并从Genscript购买,并克隆到Pet24​​a(+)Vector(Novagen)的NDEI/XHOI位点。然后在大肠杆菌BL21(DE3)-codonplus-ril细胞(Agilent Technologies)中表达H2A.Z,并如前所述纯化,如规范H2A25所述。

  在大肠杆菌BL21(DE3) - codonplus-ril细胞(Agilent Technologies)中表达了修饰组蛋白H3的绑扎的截短的人H3Δ1–31T32C蛋白,并如前所述纯化52。在大肠杆菌BL21(DE3)-codonplus-ril细胞(Agilent Technologies)中,从PET24B(+)载体(Novagen)表达了修饰组蛋白H4的截短的人H4δ1–28I29C蛋白。The insoluble protein was extracted from inclusion bodies with unfolding buffer (20 mM Tris (pH 7.5), 7 M guanidine hydrochloride, and 100 mM dithiothreitol (DTT)) for 1 h at room temperature, and the cleared supernatant was loaded onto a Sephacryl S-200 gel filtration column (Cytiva) in SAU-1000 buffer (20 mM sodium乙酸盐(pH 5.2),7 m尿素,1 M NaCl和1 mM乙二胺乙酸乙酸(EDTA)),没有任何还原剂。将阳性分数组合在一起,并通过相反的阶段色谱法进一步纯化。使用0–65%B(缓冲液A:0.1%三氟乙酸在水中; B:90%乙腈,0.1%三氟乙酸)在20列量的20列量的情况下,使用0–65%B(缓冲液A:0.1%三氟乙酸; B:0.1%三氟乙酸;在20列柱上),将截短的H3δ1–31T32C纯化在资源RPC柱(Cytiva)上(cytiva)。使用0-65%b的梯度(缓冲液A:0.1%三氟乙酸酸; B:90%乙酸酸,0.1%aceetonIririmitrum trifluluOor,在Perkinelmer Aquapore RP-300(C8)列(250 mm×内径250 mm×4.6 mm内径)上纯化H4δ1–28I29C。合并并冻干了纯H3Δ1–31T32C或H4δ1–28I29C的级分。

  为了制备修饰的组蛋白H3,将N末端H3肽(氨基酸1-31)绑扎到截短的H3δ1–31T32C中,以制备修饰的组蛋白H4,N末端H4肽(氨基酸1-28)(氨基酸1-28)的截断以使用截短的H4δ1-28δ1-28E28I29C。所有肽均包含C末端苄基硫酯。所有组蛋白H4肽都是N终端乙酰化的。在550μL的脱气连接缓冲液(200 mM kpo4,2 mm EDTA,6 m甘氧胺盐酸盐)中进行连接,其中含有1 mg修饰/未修饰的组蛋白尾硫酯肽(从Ca​​mbridge peptides或Almac Sciences,4 mg的Hister酸科学中购买),4 mg的4毫克,4 mg,4 mg,4 mgTris(2-羧乙基)膦作为pH值为7.5的还原剂。将反应在40°C下孵育过夜,并通过添加60μl1m DTT和700μl0.5%乙酸淬火。通过离心降水清除后,将连接反应直接加载并纯化到反相色谱柱上(Perkinelmer Aquapore RP-300(C8)250 mm×内径4.6 mm)。在10列体积上,使用45–55%B(缓冲液A:0.1%三氟乙酸的梯度:0.1%三氟乙酸; B:90%乙腈,0.1%三氟乙酸)纯化了修饰的组蛋白H3。在10列体积上,使用35–45%B(缓冲液A:0.1%三氟乙酸; B:90%乙腈,0.1%三氟乙酸)的梯度纯化了修饰的组蛋白H4。然后将含有连接的全长组蛋白H3或组蛋白H4的阳性分数组合并冻干。

  如前所述25,51,从纯化的组蛋白从纯化的组蛋白中重塑组蛋白八聚体,并通过盐沉积透析组装成核小体。生物素基化的核小体DNA含有一个(单核小体)或两个601个核小体 - 置序序列47,由50个基本对(BP)接头(dinucleosomes)分离,或四个601核小体 - 位置序列(Tetranucleosomes),如前所述。使用M.SSSI甲基转移酶制备CpG-甲基化的DNA,并通过限制摘要(补充信息)确认完全甲基化。在存在小鼠乳腺肿瘤病毒A(MMTVA)竞争者DNA(以与601 DNA相同的方式制备的小鼠乳腺肿瘤病毒A(MMTVA)的存在下,将二核小体和四核小体组装在一起,并稍微过度过量的八聚剂,以确保更长的染色质阵列以确保601重复的饱和度。然后通过生物素化的DNA将重生的核小体固定在链霉亲和素sepharose高性能珠(Cytiva)上,洗涤以去除MMTVA竞争者DNA和MMTVA核小体(在Dincleosomes and silac)和实验室纯度或实验室纯度或实验室中使用。通过天然聚丙烯酰胺凝胶电泳(补充信息)验证了核小体的正确组装和固定化。下拉的核小体,其中仅测试了组蛋白H3上的修饰,并与含有从大肠杆菌纯化的重组组蛋白H4的八聚体组装在一起,而不是结扎的H4。同样,下拉的核小体仅测试了组蛋白H4的修饰,其中包含重组H3,而没有结扎的组蛋白H3。将匹配的未修饰的对照核小体与未修饰的连接H3和重组H4或重组H3组装在一起,并相应地将未修饰的连接H4组装。将仅含有CpG甲基化(H27M)的核小体与连接的未修饰的H3和重组H4组装在一起,以及仅包含H2A.Z的核小体 (H36)和没有其他修饰与大肠杆菌中产生的重组(并因此未修饰的)H3和H4组装。

  在两个601个核小体位置序列之间的生物素化601二核小体DNA制备的质粒构建体,该构造601个连接器长度(35 bp,40 bp,45 bp,45 bp,45 bp,50 bp和55 bp接头)是通过将其退火和相应长度的向前和反向启动器产生的PUC19-DI601_NCOI/NHEI_5XGAL4(PTB891,GENscript的基因合成)用NCOI和NHEI限制性酶(Thermo Fisher Scientific)消化,从而与不同的链接片段交换了“ 5×GAL4链接器”,从而交换了“ 5×GAL4接头”。用于制备生物素化的601个二核体DNA的质粒构建体,该DNA包含由SV40增强剂或SV40启动子组成的200 bp接头,是通过PCR扩增的SV40增强子和PGL3-Control(Promega)的PGL3-Controle(PROMEGA)的PCR扩增而产生的。PUC19-DI601_NCOI/NHEI_5XGAL4通过NCOI和NHEI,从而与200 BP SV40增强子或启动子序列交换“ 5×GAL4接头”。对于所有构建体,如先前所述25,51所述,将二核体序列从一个副本放大到每个质粒的八个副本。

  由单链200 bp的200 bp连接器寡核苷酸(由Biolegio的自定义合成)由5'NCOI和3''NCOI INCHERED'NCORICTION和3''''''''和3'''''含有192 bp的单链连接器寡核苷酸(由Biolegio自定义合成),由单链200 bp加扰的寡核苷酸和3''''''''''和3'''''''及3''''''and'''601个含有200 bp连接器的生物素DNA。引物结合位点。通过将其退火为PCIFOR引物(Sigma-Aldrich)并执行PCIFOR的引物扩展,将单链寡核酸转换为双链DNA。使用96×50 µL反应的96孔板格式使用TAQ DNA聚合酶进行底漆延伸。Each 50 µl reaction contained 1 µg of the 200 bp scrambled linker oligonucleotide (250 nM), 340 ng pCIfor primer (1 µM, fourfold molar excess over the 200 bp scrambled linker oligonucleotide), 200 µM dNTPs and 2.5 U Taq polymerase (New England Biolabs) in 1× ThermoPol buffer (New EnglandBiolabs)。使用热环核苷酸,将寡核苷酸在95°C下于58°C退火1分钟,然后在68°C下允许引物延伸反应进行5分钟。合并反应,并通过直接在37°C下直接添加2,000 U外核酸I(新英格兰Biolabs)的2,000 U外核酸I(新英格兰Biolabs),在37°C下孵育30分钟,从而去除其余的单链DNA。根据制造商的说明,使用Qiaquick PCR纯化试剂盒(QIAGEN)纯化所得的双链DNA(20×柱,1 mL缓冲液EB中的总产率为75 µg)。使用NCOI和NHEI(Thermo Fisher Scientific)消化双链200 BP炒连接器DNA,使用5 µL每µg DNA的速度酶DNA浓缩,使用Qiaquick PCR纯化KIT浓缩,使用Qiaquick PCR纯化KIT(10倍列,总负重量,EB eb eb eb seper op 2.5%)。从凝胶中切除包含炒连接器片段的200 bp带,并使用Qiaquick凝胶提取试剂盒(Qiagen)纯化 根据制造商的说明(八列,总收率为11.64 µg,300 µL缓冲液EB)。随后将纯化的NCOI/NHEI消化的200 bp乱七八糟的接头片段与NCOI/NHEI消化,去磷酸化的(快速CIP,新英格兰Biolabs)和琼脂糖 - 凝胶 - 固定的载体后链交换了PUC19-DI601_NCOI/NHEI_-GATARING 4 HEI-5×5×5×针对200 bp的磁连接器片段的库的“ 5×gal4链接器”。使用50 µg的NCOI/NHEI线性化PUC19-DI601载体骨架,11.64 µg NCOI/NHEI二元2毫不限制的200 bp触点链接器插件(约3.5倍摩尔的插件超过3 kb载体),并组合40000 µg(40000)连接酶(新英格兰Biolabs)的总体积为1×T4 DNA连接酶反应缓冲液,并在16°C下孵育过夜。连接后,将ATP添加到最终浓度1 mM的反应中,并通过添加1,000 U的外核酸酶V(新英格兰Biolabs)(新英格兰Biolabs),并在37°C下孵育50分钟,从而消化无缘线性DNA。然后使用Qiaquick PCR纯化试剂盒(10列,每列30 µL缓冲液EB的洗脱)纯化并浓缩了受保护免受外切核酸酶V消化的圆形质粒DNA。在280 µL中,连接的圆形质粒DNA的总产率为6.5 µg。连接的质粒代表了PUC19载体的库,其中每个矢量包含一个601二核小体DNA的一个副本,每个副本每个副本在两个601个核小体位置序列之间结合了不同的200 bp接头。通过使用2 µL(47 ng)的文库DNA和25 µL胜任的细胞,根据制造商的说明,将质粒文库扩增到10-β电容性大肠杆菌细胞(新英格兰Biolabs)中。将细胞在1 mL的出生培养基中回收,并在24.5 cm2生物测定lbamp-agar板(康宁)上选择。将连续稀释液铺板以确定文库的转换效率和复杂性。总共从24个电穿孔中获得了> 108个独立的克隆。在液体LB培养基中轻轻地从板上刮下了菌落,并使用核对PC 10000 GIGA-PREP试剂盒(Macherey-Nagel)分离质粒DNA。来自24个板的质粒DNA的总产率为16 mg。总共从高稀释板中挑选了20个克隆,并测序以验证200 BP接头序列的正确长度和随机组成。

  为了准备不同的生物素化二核体DNA,首先将PUC19 601二核体质粒构建体用Ecorv消化,乙醇凝聚,然后用Ecori(New England Biolabs)进一步消化,以释放Dinucleosomes DNA。在另一个乙醇沉淀后,使用Klenow(3'→5'exo-)聚合酶(新英格兰Biolabs)填充了ECORI悬垂的悬垂物。再次通过乙醇沉淀浓缩了生物素化的二核小体DNA,并通过制剂琼脂糖凝胶电泳与PUC19载体DNA分离,然后使用核纺丝凝胶凝胶萃取量最大(Macherey-Nagel)从切除的凝胶切片中纯化。通过用链霉亲和素sepharose高性能珠(Cytiva)和输入和上清液(补充信息)用链霉亲和素凝胶高性能珠(Cytiva)和琼脂糖凝胶电泳(补充信息)验证了生物素化和二核小体DNA的纯度。然后在MMTVA竞争者DNA的情况下组装二核小体,如上所述。

  HELA S3细胞(ATCC,CCL-2.2)细胞是从癌症研究中获得的Clare Hall Laboratories Cell Servication设施,并在RPMI 1640培养基中的5%CO2下保持在37°C的悬浮培养物中。HELA S3细胞根据其在悬浮培养物和粘附培养中的圆形细胞中生长的能力,通过形态认证。表达C末端定位和亲和力纯化(LAP)标记INO80亚基ACTR548的HELA KYOTO BAC细胞系是M. Mann(Max Planck生物化学​​研究所)的礼物。在5%CO2下,在Dulbecco修改后的Eagle培养基(DMEM)中,在37°C下培养细胞,其中含有4.5 mg ML -1葡萄糖,10%胎牛血清,1%青霉素 - 链霉素和1% - 谷氨酰胺,并通过免疫药物和免疫接种抗体ACTR5进行了验证。MCF-7细胞(ATCC,HTB-22)是从IGBMC的细胞服务设施中获得的。在含有4.5 mg Ml-1葡萄糖,10%胎牛血清,1 mM丙酮酸钠,1%青霉素 - 链霉素和1%的1% - 谷胺和通过形态学的量化量子和量化的基因型基因或经常地鉴定的基因,在5%CO2下在5%CO2下以37°C培养细胞,并通过形态和量化量子的定量型,并在胶霉素上进行了认同,并定期依赖基因并构成基因并在基因上进行了认证。17β-雌二醇治疗后的全局RNA顺序。IMR90人类成纤维细胞直接从ATCC(CCL -186)购买,并在37°C下在5%CO2下以4.5 mg Ml -1葡萄糖,10%胎牛血清,1 mM pyruvate,1%青霉素 - 链霉菌素 - 链霉菌素和1%粘膜素培养。细胞通过形态进行身份验证,仅用于有限数量的通道。所有细胞系都经过测试,并且不含支原体。

  如前所述25,从HELA S3细胞中制备SILAC标记的核提取物。同位素光(R0K0)或重(R10K8)的核提取物是三种独立制备的核提取物的混合物。对于每个下拉,将对应于12.5μg八聚剂对应的核小体被固定在最终的重组缓冲液中(10 mM Tris(pH 7.5)(pH 7.5),250 mm kCl,1 mm Edta和1 mm dtt; 0.1%0.1%0.1%0.1%的N.HELA S3 SILAC标记的核提取物在1 mL的SNAP缓冲液(20 mM HEPES(pH 7.9),150 mM NaCl,0.2 mM EDTA,10%甘油)中,补充了0.1%NP-40、1 mM DTT和蛋白酶抑制剂鸡尾酒(ROCHE),可容纳4 h HE 4 h h h h h h h h h h h h h he中。用乙酰化组蛋白和相应的未修饰的对照下拉的核小体下拉添加了HDAC抑制剂(5 mM丁酸钠(Sigma-Aldrich,B5887)和250 nm TSA(Sigma-Aldrich,sigma-Aldrich,t1952)),以防止将其拆除。两次用1 mL快速缓冲液 + 0.1%NP-40洗涤两次,然后用1 ml np-40洗涤两个洗涤液,将两个SILAC下拉的珠子(修饰和未修饰的对照核小体)中的珠子汇总在一起。将上清液完全去除,并通过珠子消化洗脱结合的蛋白质(见下文)。

  如前所述,从HELA S3细胞中制备了核提取物,除了用10%的常规胎儿小腿血清培养细胞,不使用同位素标记的氨基酸。未标记的核提取物是三种独立制备的核提取物的混合物。Nucleosome pull-downs were performed in the same manner as described above for SNAP, except for the bead washing and protein elution steps, which were performed as follows: after incubation with nuclear extracts, beads with immobilized nucleosomes were washed three times with 1 ml SNAP buffer + 0.1% NP-40, the supernatant was completely removed and bound proteins were eluted by boiling the beads in 50 µlLaemmli样品缓冲液在95°C下含有1%SDS 5分钟。然后,使用滤清器样品制备(FASP)方案将20 µL蛋白等分试样用胰蛋白酶消化,并使用液相色谱 - 质谱法(LC-MS)进行分析,如下所述。

  如上所述,对IMR90人类成纤维细胞进行了培养。将细胞用PBS洗涤3次,并用1.25 µM乙二醇BIS(琥珀酰亚胺琥珀酸酯)(EGS)(例如)和0.75 µm二甲酰亚胺基在PBS中在PBS中在板上交联30分钟。在第一次交联反应后,将细胞用PBS洗涤两次,并在室温下在PBS中与1%甲醛交联10分钟。通过将PBS中的甘氨酸溶液添加到最终浓度为125 mm,并在室温下孵育5分钟,将交联反应淬灭。然后用冰冷的PBS洗涤细胞3次,通过刮擦收集并通过离心(1,000g,5分钟,4°C)收集。将细胞在补充有0.1%NP-40,蛋白酶抑制剂鸡尾酒(Roche),10 mM丁酸钠和1 mm DTT的蛋白酶抑制剂鸡尾酒(Roche),蛋白酶抑制剂鸡尾酒(ROCHE),蛋白酶抑制剂鸡尾酒(Roche)和1毫米DTT中,使用DONES均型均匀的均质器,在补充了0.1%NP-40,蛋白酶抑制剂鸡尾酒(Roche)中,将细胞裂解(10 mM Tris(pH 7.6),5 mM NaCl,1.5 mM MGCL2)。通过离心(3,000g,5分钟,4°C)的核颗粒在补充300 mM NaCl的低音缓冲液中洗涤并再次固定(3,000g,5分钟,4°C)。将核重悬于核裂解缓冲液(15 mM Tris(pH 7.6),10%甘油,1%SDS)中,并在冰上孵育5分钟。通过离心(5,000克,5分钟,4°C)固定染色质,在染色质素洗涤缓冲液中洗涤(15 mm Tris(pH 7.6),300 mm NaCl,1.5 mm mgcl2,0.5%NP-40,0.5%NP-40,0.5%Triton X-100),再次燃烧(5,000 g,5,000 g,5 min,4 min,4 min,4 min,4°c。补充了蛋白酶抑制剂鸡尾酒(Roche)和10 mM butyrate的Tris(pH 7.6),150 mM NaCl,2 mM EDTA,1%Triton X-100,0.01%SDS)。通过超声处理将DNA碎片碎片为150-300 bp(QSONICA,Q800R2,70%放大器,10 s关闭,10 s ON,40分钟的主动超声处理时间,4°C)。染色质碎片通过离心(16,000g,10分钟,4°C)颗粒。然后, 25 µl of supernatant was used for DNA purification to check the average DNA fragment size and another 25 µl supernatant aliquot was transferred to a fresh tube, de-cross-linked as described below, and stored at 4 °C until it was later used as the input sample for histone PTM analysis to define the average levels of core histone PTMs in bulk chromatin.对于DNA纯化,将样品与2×De-Cross-link缓冲液(20 mM Tris(pH 7.6),600 mM NaCl,2%SDS)混合,并在65°C下孵育过夜。第二天,加入蛋白酶K,并将混合物在37°C下孵育2小时。使用Qiaquick PCR纯化试剂盒(QIAGEN)纯化DNA,并在RNase/dnase无水中洗脱。加入RNase A,并在37°C下孵育1小时。将DNA在琼脂糖凝胶上解析,并用溴化乙锭可视化。每种芯片反应使用以下抗体:抗H3K4me1(ABCAM,ABCAM,AB8895),抗H3K4ME3(Millipore,17-614),抗H3,抗H3,抗H3,抗H3(Anti Motif,39163),Anti-H4(ABCAM,ABCAM,ABCAM,ABCAM,ABCAM,ABCAM,ABCAM,ABCAM,AB31830),使用了约0.2 mg染色质(通过DNA含量测量)。对于H3K4me3芯片反应,使用0.6 mg染色质。为了增强H3K4甲基化态特异性蛋白相互作用的鉴定,使用H3K4ME1-和H3K4ME3模化的核糖体和共同结合蛋白质因子的染色质输入进行了H3和H4芯片。具体而言,首先执行H3K4ME1和H3K4ME3芯片,然后将用于H3K4ME1和H3K4ME3芯片的染色质输入组合在一起,并随后用于H3和H4芯片。这旨在将H3和H4控制芯片中与H3K4ME1和H3K4ME3的区域测得的大量染色质相关蛋白质组的组成转移。将抗体 - 染色质混合物在4°C的旋转轮(25 rpm)上孵育过夜。使用蛋白A和蛋白质G dynabeads(Thermo Fisher Scientific)的1:1混合物在4°C的旋转轮(25 rpm)时捕获抗体; 每个芯片样品使用40 µL珠混合物。用冰冷的芯片缓冲液将珠洗涤3次,并用补充NaCl的冰冷芯片缓冲液两次,最终浓度为500毫米。通过在30 µL含有1%SDS的Laemmli样品缓冲液中煮沸珠子,在95°C下添加10分钟,从而洗脱抗体和共结合的染色质。将洗脱器转移到新的管中,并在65°C和500 rpm的热电器中孵育12小时。对于组蛋白PTM蛋白质组学分析,在4–20%聚丙烯酰胺凝胶(Novex Wedgewell Tris Tris-Glycin-Minigel,Invitrogen)上解析了洗脱的蛋白质以及输入样品(见上文),组蛋白带对凝胶衍生物进行了分析,并分析了Trupsin-thrapthe themans – MSMS。为了鉴定和定量共纯化的染色质蛋白,使用FASP方案处理了Laemmli样品缓冲液中的10 µL等化蛋白的等分试样,以进行胰蛋白酶消化,并使用LC-MS使用LC-MS进行分析,如下所述。

  如上所述,培养了表达C末端LAP标记的INO80亚基ACTR548的HELA KYOTO BAC细胞系。通过胰蛋白酶吸收收集细胞,并用冰冷的PBS洗涤3次。如先前所述,在0.1%NP-40存在下,在低渗条件下使用Dounce均应器分离核。25。将细胞核重悬于冰冷的MNase消化缓冲液中(10 mM Tris(pH 7.6),15 mM NaCl,60 mm KCl,0.1%NP-40),并在丁酸二氧化氢酸盐(ROCHE)和10 mM butyrate和MNase中补充了蛋白酶抑制剂鸡尾酒(ROCHE),并在150 U Perefie中添加了10 mM sodium sodium sodium cocktail(Roche)和10 mm sodium sodium sodium cocktail(Roche)和10 mm sodium np-40。将核悬浮液转移到热电器中,在37°C和400 rpm的2分钟孵育后,将CaCl2添加到最终浓度1.5 mm,并在37°C下再孵育6分钟。通过将EDTA添加到最终浓度为10 mm的情况下,MNase消化停止了。然后将混合物用冰冷的2×SNAP缓冲液(30毫米HEPE(pH 7.8),300 mM NaCl,0.1%NP-40,20%甘油,0.4 mm EDTA)稀释1:1,并补充了蛋白酶抑制剂鸡尾酒(ROCHE)和10 mm sodium sodium butyrate。将样品在4°C下在旋转轮上旋转45分钟,然后在4°C下进一步在热晶中孵育1,000 rpm,持续15分钟。核碎片通过离心(16,000g,10分钟,4°C)颗粒。如下所述,将所得的上清液转移到新鲜的1.5 mL低蛋白结合eppendorf管中,用于纯化与Ino80复合物结合的核小体。为了确定MNase消化的效率,将含有不溶性染色质部分的颗粒重悬于1倍的SNAP缓冲液的1倍上清液中,并补充了蛋白酶K,并在37°C下孵育过夜。同时,将上清液的25 µL等分试样转移到新鲜的管中,并补充蛋白酶K,并在37°C下孵育过夜。用蛋白酶K消化蛋白质后, 使用Qiaquick PCR纯化试剂盒(Qiagen)提取DNA,并在无RNase/dNase水中洗脱。加入RNase A,并将混合物在37°C下孵育1小时。然后将DNA在琼脂糖凝胶上解析,并用溴化乙锭可视化。对于每个样品,将上清液的另外25 µL等分试样转移到新的管中,然后用作输入样品,以定义散装染色质上的平均组蛋白修饰水平。为了纯化与INO80复合物结合的核小体,将25 µL的GFP-trap琼脂糖珠(Chromotek)添加到MNase消化的上清液中,并将混合物在旋转轮(25 rpp)上孵育,在4°C下过夜。通过离心(250克,3分钟,4°C)将珠子颗粒,然后用冰冷的快照缓冲液洗涤两次,用一根用NaCl补充了NaCl的SNAP缓冲液洗涤,最终浓度为200 mm。将上清液完全丢弃,并将珠子重悬于40 µL的SNAP缓冲液中,并补充了1 µg 3C蛋白酶(Sigma-Aldrich)。然后将混合物在4°C下孵育8小时。将珠子通过离心颗粒,并将上清液转移到新的管中,并与Laemmli样品缓冲液混合,并在95°C煮沸5分钟。为了鉴定Ino80结合核小体的组蛋白PTM,在4–20%聚丙烯酰胺凝胶(Novex Wedgewell Tris Tris-Gycin-Minigel,Invitrogen,Invitrogen)上分辨出免疫促蛋白和输入样品,将组蛋白带在凝胶中,使用Trinpers-LCESTED LCESTS挖掘,并分析了组蛋白。

  核心INO80复合体亚基INO80B使用先前描述的标记策略在MCF-7细胞系中的V5表位在其C端进行了内源标记。具体而言,在转染前1天,将MCF-7细胞以大约1.0×105个细胞的孔在24孔板上接种到500 µL的低葡萄糖DMEM DMEM培养基中,该培养基补充了10%FBS,1 mM谷氨酰胺和100μgml-1 cenicillin-strepthepycin。On the day of transfection, 25 µl of Opti-MEM medium was added to a 1.5 ml sterile Eppendorf tube, followed by the addition of 1,250 ng of TrueCut Cas9 Protein v2 nuclease (Invitrogen) and 240 ng of two-piece gRNA (crRNA:tracrRNA duplex) generated by annealing crRNA (IDT) and tracrRNA (IDT) according to the制造商的说明。通过涡旋短暂混合后,将1 µL CAS9 Plus试剂添加到包含Cas9蛋白和GRNA的溶液中。将混合物在25°C孵育5分钟,以形成Cas9核糖核蛋白颗粒(RNP)。对于同源性供体DNA的共递送,此时将800 ng的单链DNA DNA寡核苷酸(IDT)添加到Cas9 RNP中。同时,将25 µL Opti-MEM培养基添加到一个单独的无菌Eppendorf管中,然后添加1.5 µL脂肪切开胺CRISPRMAX。短暂涡旋后,将Lipofectamine crisprmax溶液在25°C下孵育约5分钟。孵育后,然后将Cas9 RNP添加到脂肪系CRISPRMAX溶液中。将混合物在25°C下孵育10-15分钟,形成CAS9 RNP和Lipofectamine crisprmax复合物,然后添加到细胞中。转染后48小时,通过绒毛收集细胞,并在96孔板中以每孔为单元1个细胞收集细胞。在达到60–80%的汇合度后,将细胞胰蛋白酶插入并将1:1分成两个96孔板,在其中使用单克隆小鼠抗V5初级抗体(EBIISOSCIENCE,TCM5 14-6796-82,1:250),将第一盘用于免疫荧光筛选(EBIISCIENT 和Alexa-Fluor-488耦合抗小鼠IgGs作为二级抗体(Jackson Immunoresearch Laboratories,715-545-150,1:333),第二个板用于随后的V5阳性克隆的膨胀和进一步测试。如先前所述54,对V5阳性克隆进行了免疫荧光筛选。

  如前所述,大约1.0×107 MCF-7 WT或INO80B-V5细胞用于核提取物制剂。用IP缓冲液(20 mM HEPE(pH 7.9),50 mM NaCl,0.2 mM EDTA,5%甘油,0.1%NP-40、1 mM DTT和蛋白酶抑制剂鸡尾酒(Roche)稀释核提取物,均限制为1 µg-µl-1和1600MM的最终蛋白质浓度,20,000克在4°C下10分钟。然后,将1 ml清除的核提取物与5μl抗V5抗体(ABCAM,AB15828)混合,并在4°C的旋转轮上孵育。第二天,将20 µL的蛋白A和蛋白质G dynabeads(Invitrogen)的1:1混合物添加到样品中,然后在4°C的旋转轮上孵育1小时。用含有150 mm NaCl的IP缓冲液洗涤磁珠3次。通过在95°C的20 µL Laemmli样品缓冲液中煮沸5分钟,从珠子中洗脱共免疫沉淀的蛋白质。洗脱蛋白随后用于免疫印迹和LC -MS实验(IP – MS)。对于LC -MS分析,使用FASP方案用胰蛋白酶消化蛋白质,如下所述。

  通过SDS-PAGE分离蛋白质,并使用Bio-Rad Protean Mini-Gel和印迹系统将蛋白质印迹到硝酸纤维素膜(0.45 µM,Thermo Fisher Scientific)。将抗体在TBST+5%牛奶中稀释(25 mm Tris(pH 7.5),137 mm NaCl,2.7 mm KCl,0.2%Tween-20,5%非脂肪的非脂肪干牛奶)。以下主要抗体用于免疫印迹:抗V5标签(EBISOSCIENCE,TCM5 14-6796-82,1:1,000),抗Ino80(ABCAM,ABCAM,AB118787,1:2,000),抗Ino80b(抗Ino80b)GTX80453,1:1,000),抗TBRG1(Santa Cruz(D-9),SC-515620,1:1,000),抗H3K4Me3(Millipore,17-614,1:2,000),抗H4(ABCAM,ABCAM,ABCAM,ABCAM,AB31830,1 µg ML-ML-HOT-H4AC,ANT-H4AC(ANT-H4AC)(39967,1:1,000),抗CBX4(细胞信号技术,E6L7X 30559,1:1,000),抗CBX8(Santa Cruz(C-3),SC-374332,1:1,000),抗H2B(ABCAM,ABCAM,ABCAM,ABCAM,AB1790,1:1:1:1:1:1:1,000),ANTI ANTI-H2A(ANTI)。通过CCD摄像头使用Bio-Rad Chemidoc触摸成像系统运行图像实验室触摸软件(V.2.3.0.07),通过CCD摄像头(V.2.3.0.07)获取免疫印迹图像。

  将珠子重悬于50μl洗脱缓冲液(2 M尿素,100 mM Tris(pH 7.5),10 mM DTT)中,并在25°C下在振动筛(1,000 rpm)上孵育20分钟。将碘乙酰胺(Sigma-Aldrich,I1149)添加到50 mm的最终浓度中,并将样品在黑暗中在25°C下在25°C的振动器(1,000 rpm)上孵育10分钟。用0.3μg胰蛋白酶(Promega V5113)在25°C下在热振摇(1,000 rpm)上消化2小时后,将上清液转移到新管中,并在25°C下用0.1μg胰蛋白酶进一步消化。通过添加5.5μl的10%三氟乙酸来停止消化。根据制造商的说明,将洗脱的肽纯化在C18阶段-TIPS(Glygen10-200μLToptips)上,并使用SpeedVac干燥。

  如前所述进行滤清器辅助样品制备。52。简而言之,将1%SDS Laemmli样品缓冲液中蛋白质混合物的10–20 µL等分试样用200 µL的100 mM碳酸氢铵缓冲液(TEAB; pH 8.5)稀释。为了减少蛋白质,将1 µL的1 m DTT添加到每个样品中,并将样品在60°C下孵育30分钟。将样品冷却至室温后,将300 µL新鲜制备的UA缓冲液(在100 mM Teab中的8 m尿素(pH 8.5)中)添加到每个样品中。通过添加10 µL的300毫米碘乙酰胺溶液,然后在室温下在室温下孵育30分钟,从而使蛋白质烷基化。然后将样品集中在30 kDa的离心型滤清器单元(Millipore)中,并用200 µL UA缓冲液洗涤3次,并用200 µL 50 mM TEAB(pH 8.5)洗涤两次。然后,将40 µl的50 ng µl -1胰蛋白酶溶液(pH 8.5)添加到每个样品中,并在37°C下过夜进行蛋白质消化。将肽通过过滤器离心,并通过将三氟乙酸添加到最终浓度为0.5%(v/v),从而酸化了收集的流通。然后,如下所述,将大约300 ng的胰蛋白酶肽混合物用于LC -MS分析。

  使用用于凝胶中样品制备的杂化化学衍生化方案制备组蛋白进行LC-MS分析。简而言之,将蛋白质在4–20%聚丙烯酰胺凝胶(Novex Wedgewell Tris-Glycin-Minigel,Invitrogen)上解析,然后是Coomassie染色。从凝胶中切除组蛋白蛋白带中的蛋白质条带,并在脱落缓冲液(50%乙腈中的100 mM三甲基铵碳酸氢盐)中脱离。灭绝后,将凝胶片用200μl的100%乙腈在室温下脱水10分钟,然后丢弃乙腈。通过将50 mM茶具(pH 8.5)和新鲜制备的1%(v/v)丙酸酐溶液在水中以100:1的比例进行制备,制备丙基溶液。制备后,立即将100 µL的丙酰化溶液添加到脱水的凝胶片中,然后在室温下孵育10分钟。通过在室温下添加10μl的80 mM羟胺,然后在室温下孵育20分钟,从而淬灭丙基反应。丢弃丙基化溶液,并在室温下用200μl100%乙腈脱水10分钟。此后,将乙腈溶液丢弃,并在100 mM TEAB(pH 8.5)中添加20μl的50 ng µl -1胰蛋白酶溶液。胰蛋白酶消化在37°C过夜。第二天,将50μl的100毫米茶具(pH 8.5)溶液添加到每个样品中,然后在温暖振荡器(37°C,1,500 rpm)中孵育30分钟。新鲜制备了苯基异氰酸苯甲酸苯甲酸苯酚的1%(v/v)溶液,并将15μl添加到每个样品中,并在37°C下孵育60分钟。通过添加24μl1%三氟乙酸酸化样品。根据制造商的说明,用C18自旋柱(Thermo Fisher Scientific)脱盐,以速度为VAC干燥,重悬于50μl0.1%三氟乙酸中,随后用于LC-MS分析。

  如前所述55,通过LC-MS对Q-激活质谱仪(Thermo Fisher Scientific)进行处理并通过LC-MS进行处理和分析。简而言之,将样品以8μlmin-1的速度加载到陷阱柱上(Thermo Fisher Scientific,Apraim Pepmap 100;100μm内径,2厘米长,C18 c18反向相位材料,5μm直径珠和100Å孔径和100Å孔径)在2%acetonitrile and 0.1%trifluyacacic中。每个样品都加载了两次,提供了两个技术重复。将肽在分析柱上洗脱(Thermo Fisher Scientific,Apraim Pepmap RSLC;75μm内径,25 cm的长度,C18反相材料,直径为2μm,直径为2μm和100Å孔径),并使用250 NL min-1和250 NL min-1 and-the Pruffer and the Pluffer and the Pluffer and the With the Prands:最初的5分钟4%B.4–25%B的90分钟梯度;30分钟的梯度为25–45%b;1分钟梯度45–90%b;最后,在100%B处的15分钟等属物质在返回15分钟平衡的起始条件之前(缓冲液A:2%乙腈和0.1%甲酸在水中; B:80%乙腈和0.1%甲酸)。Q激活仪器以70,000的分辨率获得了全扫描调查光谱(M/z 300–1,650)。使用了3×106的自动增益控制目标值,最大注入时间为20 ms。排名最丰富的多重电荷离子是以数据依赖性方式选择的,被较高能量碰撞诱导的解离,并以17,500分辨率收集数据。使用最大注入时间为120毫秒的自动增益控制目标值为1×105。启用了30 s的动态排除时间。

  LC – MS/MS分析对无标记的核小体下拉和芯片–MS蛋白质组学样品进行了Q-激活的HF质谱仪(Thermo Fisher Scientific)在线与纳米级LC(Thermo Fisher Scientific)进行了耦合。将样品加载在溶剂A(0.1%甲酸)中,在两列设置中,由3.5 cm,100 µm内径的内径组成,并带有reprosil-Pur 120 C18-AQ(5 µm; Maisch)和18 cm,18 cm,75 µm内径的分析柱与septra-partical commetal commetal commetal-parge sepra-septra-pura-pura-pura-pura 120 c18 c18 c18-aq(5 µm; maisch; Maisch博士Maisch)。溶剂B(95%乙腈,0.1%甲酸)的梯度以250 nl min -1的流速施加:90分钟内3%至25%B;30分钟内25%至45%B;3分钟内45%至100%B;和100%B在8分钟内。MS以120,000的分辨率和MS/MS作为前15名,分辨率为15,000,动态排除为30 s。对于MS/MS/MS,最大注射时间设置为100 ms,仅选择了电荷状态2、3和4的肽。

  INO80-V5 IP – MS样品的LC – MS/MS分析在Q-激活的HF质谱仪(Thermo Fisher Scientific)上进行了与纳米RSLC(最终3000,Dionex)耦合。简而言之,将样品自动加载到纳米陷阱柱上(内径300 µm×5毫米,并在分离之前,带有上apmap100 c18,5 µm,100Å; LC包装),然后通过反向相相的色谱法(HSS-T3 M级柱与25 cm,waters in 95 cm,waters in ninr comp in ninr comp complase complase complase complase complase complase complase complase in complase complase compace)in Superation in 25 m cmap填充物。0.1%甲酸的流速为250 nl min -1。使用配备有纳米柔性电离源的Q活性HF质谱仪分析洗脱肽。全扫描MS光谱(M/z 300–1,500)和MS/MS片段光谱在Orbitrap中获得,分别分别为60,000或15,000,最大注射时间为50 ms。根据信号强度,选择多达十种最强烈的离子用于更高能量的碰撞分解碎片。动态排除设置为30 s。

  为了对修饰的组蛋白的LC-MS分析,在Q-激活的HF质谱仪(Thermo Fisher Scientific)上分析了酸化的组蛋白肽消化,并在线耦合到纳米easy lc(Thermo Fisher Scientific)。简而言之,将样品自动加载到内部填充2 cm 100 µm内径的内径C18 c18带缓冲液A(0.1%甲酸)的倒数前,然后在内部包装的reprosil-Pur 120 C18-AQ(3 µm; MAISCH DICERTICTATIC ANTICATIT ANTICATIT ANTICATIT ANINITAL A NINDERIES A linient A linient A linient a)内洗脱并分离,并在内部分离并分离。至40%缓冲液B(90%乙腈,0.1%甲酸)。全扫描MS光谱(M/Z 300-1,000)和MS/MS片段光谱在Orbitrap中获得,分别分辨率为120,000或15,000,最大注射时间为50 ms。根据信号强度,选择了20种最激烈的离子以进行更高能量的碰撞分解碎片。动态排除被禁用。

  使用Maxquant(v.1.5.2.8)56从Q-激活的原始数据文件中量化蛋白质丰度,对UniProt UP000005640使用2-plex标签(2016年9月下载)(arg0/lys0/lys0/lys0 and arg10/arg10/lys8)。进行了搜索,以允许半胱氨酸残基的固定氨基甲基甲基修饰以及蛋氨酸残基的可变氧化和氨基末端的乙酰化。最小肽长度设置为7。使用“运行之间的匹配”功能,将所有由前向和背下下拉产生的原始文件(包括每个核小体测试的技术重复)一起处理。H/L比以高级比率计算模式计算,最小比率和肽计数设置为1。相应的MQPAR.XML文件与蛋白质组学数据一起存放。通过Maxquant v.1.5.1.0分别对单,DI-和DI-di-和四核小体(补充信息)进行初步试验实验,与2015年12月版本的Uniprot蛋白质组的初步试验,并具有至少两个肽的比例估计。

  使用蛋白质组发现者V.2.5(Thermo Fisher Scientific)进行蛋白质鉴定和定量。使用MASCOT57作为搜索引擎,针对人类瑞士 - 推杆数据库搜索数据,前体质量公差为5 ppm,片段质量公差为0.05 Da。允许胰蛋白酶进行两次错过的裂解,并将半胱氨酸的氨基甲基化设置为静态修饰,而蛋氨酸的氧化为动态。通过使用Minora特征检测器,特征映射器和前体离子量化器,可以实现无标签的定量。色谱比对的最大保留时间移动设置为2分钟,并将映射特征的保留时间公差设置为1分钟。将肽定量作为峰面积标准化为总肽量和蛋白质定量,作为前三个独特肽的平均值。

  为了鉴定和定量芯片– MS样品中组蛋白PTM的质量控制以及重组产生的修饰的组蛋白蛋白的质量控制,使用Skyline手动分析了MS原始数据文件(V.20.1.0.31)58。简而言之,手动编译了未修饰以及差异修饰的组蛋白H3和H4肽的列表,并用于评估每个样品中组蛋白的修饰状态。所有未乙酰化或甲基化的赖氨酸残基被认为是丙酰化,所有肽N末端都被认为是用异氰酸苯基修饰的。将MS1过滤设置为包括3个同位素峰,MS1分辨能力设置为120,000。MS2解析功率设定为15,000。对于每个修饰的组蛋白肽,通过将其峰面积除以对应于该肽的所有观测形式的区域的总和来估计相对丰度(即所有具有相同氨基酸序列的肽)。组蛋白变体H2A.Z的相对丰度通过将独特的H2A.Z肽的峰面积总和(即仅在H2A.Z中)除以与所有独特肽的峰面积的总和,与组蛋白H2A,H2A,H2B和H2A.Z的所有独特肽的峰面积之和。

  从分析的数据集中删除了标记为“潜在污染物”,“反向”或“仅通过站点识别”的最大蛋白酶条目。其余条目的SILAC H/L比转换为Log2量表。在最初的试验实验(补充信息)中,在所有实验中估算了中位数和第一个四分位数log2 [h/l比率]值分别估计,从而分别处理向前和反向实验。如果蛋白质从第一和第三四分位数的前向和反向实验掉落,将蛋白质显着富集,而蛋白质的四分位数范围为1.5倍。总体实验集的数据还包括最新的(截至2019年7月30日)的元数据,这些元数据根据“多数蛋白质ID”列中的IDS从mygene.info API Service59下载。蛋白质标识符是根据相关基因名称分配可读物的。在括号中列举了重复的条目(例如,Smarca(1)和Smarca(2)),为最高得分较高的条目分配了较低的数字。简洁的基因名称的常见前缀崩溃(例如,Smad [2,3,9])。数据的主要方向扩散(即富集的方向) 在每个下拉中,通过确定向前左右和底部象限的数据的第一个主要组成部分和反向log2 [h/l比率]图来估算数据的第一个主要成分。删除异常值点±2 s.d。通过重新评估主要方向来调整估计值。远离第二个主要方向的中位数。将蛋白质特异性变化在下拉实验跨第二个主要方向上调整为零,以纠正H/L细胞群体中蛋白质不同的蛋白质在核提取物中的不同丰度或具有不同蛋白质的蛋白质具有重量标记的氨基氨基酸的核提取物而导致的全身性重和轻细胞种群批处理作用。在测量蛋白质的正向或反向H/L比的情况下(比率对的9.13%),但并非两者都通过将测得的比率投影到估计的原金富集线来估算缺失比。在六种情况下(0.01%),其中估计的H/L比无限,因为可以在修饰的核小体中测量蛋白质强度,但在未修饰的核小体中不能测量,该比率与特定SNAP实验中确定的最大比率相比。所有其他缺失的H/L比均归为零(24.27%)。去除所有实验中的五个蛋白质,其中五个蛋白质和反向H/L比等于零。然后进一步旋转每个下拉实验的结果数据,以便估计的主变量方向完全依赖于理想的45°对角线上,因此反向比率平均等于前向的负。为了进行可视化和计算分析,反向实验的符号被翻转为与前向实验相同的尺度。

  从H3K4ME1和H3K4ME3交叉链接芯片实验中获得的蛋白质丰度被转换为log2量表,将零丰度视为缺失的数据。将数据标准化为数据中观察到的十种组蛋白蛋白:H2AC20,H2AC21,H2AW,H2AZ2,H2BC4,H2BU1,H3-2,H3-2,H4C1,MACROH2A1和MACROH2A2。具体而言,我们计算了每个实验中组蛋白的平均log2转化丰度,并计算了残差(即log2转换的丰度减去组蛋白蛋白的平均值(M值))。通过减去每个样品的这些残差的中位数来归一化数据,以使组蛋白蛋白的归一化数据的中值M值在实验中保持大约为零。然后将归一化数据进一步过滤,以包括至少两个实验重复中检测到的蛋白质。

  我们使用limma60来估计H3K4me3和对照(H3和H4),H3K4ME1和对照组之间的log2 [fc]值,以及H3K4ME3和H3K4ME1。具体而言,我们使用了零截距的平均值模型编码每个实验的一个参数(H3,H4,H3K4ME1,H3K4ME3),并分析了H3K4ME1/3实验中蛋白质丰度之间的对比度,以及H3和H4的平均丰度和H4的平均丰度(例如,H3+H4)/2),以及H4/2)。H3K4Me1。使用Limma(v.3.50.1)的默认参数进行分析,并在“ ebayes”步骤中添加“ robust = true”,假设在null假设下使用默认设置进行假设测试,则使用默认设置进行了假设。使用Benjamini -Hochberg程序校正P值,并假定在0.05的FDR下进行显着性。

  在某些情况下,由于缺少数据,无法估计对比度。这经常发生在其中一个实验中检测到蛋白质时,但在对照组中没有检测到蛋白质(反之亦然)。在这些情况下,我们将这种Log2 [FC]估计值(正和负)估计。此外,只要有可能估计H3或H4控件,但并非两者都可以使用其中一种对照对Log2 [Fc]估计。估计的数据和数字清楚地标记了。也仅基于单个数据点(即仅在三个重复之一中观察到的丰度)进行估计。

  为了能够将CHIP -MS数据与MARCS特征效应估计联系起来,我们通过其登录编号和基因名称将芯片– MS蛋白映射到其MARCS对应物。通过在所有匹配的标识符中分配最低的p值估计值,通过分配特征效应估计值来解决一个绘制到MARCS数据集中多种蛋白质的芯片– MS蛋白的情况。

  为了获得关联统计,我们进行了一项Mann-Whitney U检验,比较了MARCS特征强烈募集或排除在MARCS和CHIP-MS数据中检测到的其他蛋白质的估计的蛋白质的芯片– MS Log2 [FC]估计值。仅测试了至少五种蛋白质的组。出于可视化目的,我们计算了每个组中的平均log2 [fc]估计值及其各自的差异。为此,我们假设无限性等于最大有限log2 [fc]加上少数数字。

  独立分析了短接头核小体,长连接器SV40启动子核小体和长连接器SV40增强子核小体亲和力纯化实验的无标记MS定量数据集。将蛋白质丰度转换为log2量表,将零强度视为缺失值。如H3K4ME1/3交叉链接-CHIP-MMS方法中所述,使用Hyp1H4a和Hist2H2BF组蛋白(短接头)或H4C1和H2BC12组蛋白(长连接器)的丰富度进行了标准化数据。

  对于每一组实验,我们使用零截距在Limma和手工制作的对比度中的模型来测量对蛋白质与二核小体的结合的两种类型的影响:(1)(1)修饰特异性效应,即,在蛋白质中,蛋白质丰度中的蛋白质丰度中的log2转换FC与某些核心体之间的蛋白质丰度之间的蛋白质丰度和特定型核体之间的特定链接之间的典范[50 bp链接器] vors log2 [未修饰50 bp链接器]以及(2)特定的链接效应,即两个不同的链接器之间的蛋白质丰度中的log2转换FC,给定某些核小体修饰,例如,log2 [log2 [log2] [H3K27ME3与55 bp linker] versus log2 [h3k27me3 firs log 2 kn3k27 bp [h3 k27] versus log2 [h3 k27]。由于大量缺失值,分析中排除了35 bp接头的H3K27me3实验的第二重复。在至少一个条件下至少具有两个值的蛋白质进行分析。

  使用Limma(v.3.50.1)的默认参数运行分析,使用“ ebayes”步骤中的“ robust = true”参数。假设在FDR为0.05时,使用Benjamini -Hochberg程序校正P值。除此之外,如果绝对log2 [fc]大于1,则认为明显的估计值被认为是“强”的。

  就像在H3K4ME1/3交联芯片实验中一样,我们估算了对比度,这些对比无法使用以下启发式方法从数据中估算出来:在其中一种情况下检测到的蛋白质,但不能接受无限富集或无限耗竭。数据中标记了此类估计值,以及基于单个数据点的估计。

  为了帮助数据可视化,我们将蛋白质分为三组,基于修饰和接头在不同分析中的二核体结合的影响:(1)修饰 - 反应性蛋白质,即至少一个对链接的蛋白质具有重大且强烈的对修饰签名的蛋白质;(2)接头反应蛋白,即在修饰或未修饰的核小体中对接头具有显着反应的蛋白;(3)对两者都反应的蛋白质,即同时满足条件(1)和(2)。

  为了分析INO80B-V5 IP-MS数据,仅考虑基于三个或更多独特肽鉴定的蛋白质。将定量的MS1蛋白丰度标准化为IGHG1丰度。使用两尾t检验进行差异富集分析。使用Benjamini – Hochberg方法对P值进行多次比较调整。使用基于MS1的无标记定量测定蛋白化学计量法61。具体而言,将蛋白质丰度计算为所有鉴定出蛋白质鉴定的独特肽的MS1强度的平均值。为了评估INO80复杂亚基的化学计量,每个亚基的丰度(平均MS1肽强度的平均值)除以INO80B的丰度(在Co-IP复杂化纯化实验中用作诱饵的INO80B(平均INO80B MS1肽强度的平均值)。

  仅通过将核小体排列到有向图中的核小体对单个修饰的核小体对识别,边缘通过一种修饰跟踪差异,包括仅包含一个染色质特征的自我信息核小体(例如,H3K4Me3)。H3K9ACK14AC,组蛋白H3上的全乙酰化(H3K9ACK14ACK18ACK23ACK27AC),H4K5ACK12AC和完全乙酰化H4(H4K5ACK8ACK12ACK16ACK16AC)被视为单个修饰。仅分析了具有两个或更多信息核小体对的染色质特征,因此分析了独立的实验重复。由于每个下拉都由一个前进和反向实验组成,因此至少进行了四个实验测量结果,从而实现了强大的统计分析。此外,仅针对至少有一个核小体对而没有估算数据的蛋白质计算特征效应估计值。

  使用以下公式在Limma中建模核小体之间的关系:“ 〜0+edge+ptm”。这里的“边缘”参数在方向图中跟踪边缘,PTM捕获边缘的方向,并在一个包含目标特征的端点设置为一个,另一个设置为零。该表达式允许核小体对的基线效应由“边缘”参数捕获,允许“ PTM”参数测量由修饰特征引起的效果的变化(即PTM,组蛋白H2A.Z或DNA甲基化)。自动净化未分配边缘系数。林玛(Limma)用强大的经验贝叶(Bayes)运行,重量设置为被检测到的独特肽数量加一个。在本杰米尼– Hochberg调整的FDR为0.01的Benjamini – Hochberg假定。

  如果它们的参数估计值大于或等于1,则将显着的响应标记为强烈。对于至少对一项特征响应的蛋白质,所有特征的集体修改响应曲线都被聚集。在余弦距离下使用prodoclust62(v.1.6.3)进行聚类。树状图对应于最小值分层链接。如果无法对效果进行估计,则用于聚类目的,使用三个最近的邻居(BNStruct Package63)估算值。将所得的树状图分为40个平簇,并在图2E和补充表5中用其各自的原型蛋白注释。

  使用Camera64分析了蛋白质复合物对染色质特征的关节响应。仅分析具有3-40个成员(包含)的复合物。在本杰米尼 - 霍克伯格调整的FDR为0.01的Benjamini – Hochberg中假定显着性。每当可能的情况下,整个蛋白质复合物的富集以及仅对复合物的独家亚基的丰富(不包括与其他复合物共享的亚基)的富集进行了测试。染色质特征对蛋白质复合物的中值作用是从单个亚基的效果分布中估计的100,000个随机样品。报告了中位数以及经验95%置信区间(CI)。

  我们使用在Minet Package36中实现的网络推理算法ARACNE,MRNET和CLR以无监督的方式来推断蛋白质 - 蛋白质相互作用网络,仅使用1,915×110 log2转移的log2转移型重量/光率的重型/光率的重型蛋白的矩阵。将算法配置为使用MI的MILER-MADOW(MI.MM)进行MI和相等的宽度离散策略,将BIN编号设置为10。除了上面的算法外,还评估了MI Metric(不对其对网络算法对网络算法进行)的性能(网络RAWMI)。

  除了上面的基于MI的方法外,我们还基准了由天真计算(CORR)或使用Ledoit-Wolf收缩率(Corr-LW)的概解蛋白相关矩阵定义的网络基准测试。这些网络是通过假设节点之间的邻接等于相关矩阵中的相应条目来构建的。相关矩阵中的负值通过将一个条目添加一个并将结果除以两个来避免。

  训练后,针对Biogrid Database34(第3.5.174版)评估了推断的网络。BioGrid条目通过以前通过MyGene.info API Service下载的Entrez标识符与我们的标识符链接。59。通过计算其精度(网络中预测边缘的比例也位于Biogrid数据库中)和在多个严格级别上预测的Biogrid数据库中的边缘(在Biogrid数据库中的边缘的分数)来评估网络。我们使用了精确的缩放截断区域和召回曲线(AUPRC)统计66,该统计量将多个精度/召回估计值结合到单个分数作为我们的主要度量。由于我们没有预期网络可以完全恢复Biogrid相互作用,因此希望将更高的精度交易以减少召回率,因此我们没有考虑任何阈值设置,召回大于0.2以评估算法。评估中排除了与组蛋白蛋白以及自相互作用的相互作用(生物群中的同二聚体或两个具有相同基因名称的蛋白质之间的相互作用)。

  为了产生本文中描述的推断网络,我们指出,可以通过指出CLR评分函数将CLR算法的得分转换为P值,其中假定ZI和ZJ遵循NULL假设35,36下的标准正态分布,p值在null下,可以表达为p值。其中erfc是互补误差函数。使用Benjamini – Hochberg程序(即将它们转换为Q值)调整多个假设测试的计算P值,使我们能够选择一组直觉阈值以产生论文中介绍的网络。

  使用Gephi67中的力图集2算法绘制不同调整后的Q值阈值的网络,并手动调整。仅绘制至少五个非零值的蛋白质。没有绘制孤立的节点(大小为1的连接组件)。网络节点是由社区(在Python-Louvain软件包中实现的Louvain AlgorithM68)上色的,或者由颜色编码的染色质响应估计值叠加(请参阅上面的“单个修改功能(SNAP数据集)的效果)”。在网络投影图中,根据蛋白质复合物(由染色质修饰(按照摄像机程序报道)显着调节蛋白质复合物,并在经验上估计的中位数至少为0.3。专家判断被用来消除具有大量共享亚基的复合物,并确定要排除哪些标签以减少拥挤。未在网络中未形成紧密簇的蛋白质复合物注释。

  通过选择一个实现70%精度的网络阈值,为蛋白质相互作用预测生成了额外的高置信网络。将算法(假阴性)预测的生物群相互作用添加到网络图中。使用Cytoscape69对网络进行可视化。网络节点标签和注释手动添加到网络中。补充表7中提供了高信心和标准网络交互预测。

  从2019年7月19日(参考文献38)和Epifactors数据库(2019年7月29日获得EBI Complex Portal版本)下载了一个策划的蛋白质复合物列表,并从EBI复合物版本中下载了复合物。在我们的实验中未检测到的复合物的蛋白质成员被过滤了。仅保留过滤波后至少有两个蛋白质亚基的复合物,合并过滤后变得难以区分的蛋白质复合物(即具有相同的亚基)。基于手动审查,将数据库中的蛋白质复合物注释(例如,由冗余衔接蛋白定义的蛋白质复合物的变体)合并在一起。根据对推断的蛋白质网络和相应文献的评论,手动添加了数据库中缺少的注释。在某些情况下,条目还通过Corum70和Uniprot71的数据增加了。在可能的情况下,手动重命名蛋白质复合物以匹配规范名称。记录所有注释来源,并在补充表8中找到。

  对于关节MARC和芯片序列分析,将相关的Encode30芯片seq,DNase-Seq和ATAC-Seq数据集用于K562细胞系,以及RoadMap1的染色质状态预测,下载了K562细胞系。接下来,我们将HG38参考基因组(除黑名单区域72和染色体Y)分为一组非重叠的1,000 bp宽箱,并标记了来自每个NGS数据集的峰的垃圾箱。我们已经假设每个基因组垃圾箱是独立的且分布相同的,因此对给定峰作为Bernoulli事件进行了建模。因此,对于给定的NGS数据集,我们通过计算两个数据集都是共同存在,共同兼容和相互排斥的箱来计算其联合分布的。添加了100个伪数,以避免零并平滑概率估计。该联合分布使我们能够计算两个NGS数据集之间的MI,这相当于Kullback -Leibler与独立的联合分布的差异。为了获得可解释的统计量,该统计量可以测量可以通过了解B来预测的有关A的信息的部分,将MI除以两个数据集之一的香农熵(H):U(a,b)= mi(a,b)/h(a)。我们经常将此比率称为B或简单地归一化MI解释的A熵的一部分。作为惯例,我们使用它来测量蛋白质的分数熵(例如,PHF8)NGS实验,即染色质特征的知识(例如H3K4ME3)NGS实验提供了U(PHF8,H3K4ME3)= Mi(PHF8,H3K4ME3)= MI(PHF8,H3K4ME3)/H(pHF8)/h(pHF8)(ext Data)(图)

  接下来,我们比较了每种MARCS鉴定的蛋白质的归一化MI估计值,其中K562细胞中可以使用编码芯片 - seq数据。对于每个MARCS染色质特征,对于每个芯片seq染色质特征,我们测量了与MARCS特征所预测的蛋白质是强烈募集或强烈排除的蛋白质,而与蛋白质相比,与蛋白质相比,不确定的蛋白质均不得均高于不可排除,或者在MARC中均未施加了蛋白质,而不是在Marcs中均未施加的蛋白质。为了进行这些比较,我们使用了Mann-Whitney U检验(双面)和Benjamini-Hochberg校正。为了可视化的好处,我们还计算了与MARC-Feature相关蛋白等的平均log2归一化MI估计值之间的差异。在蛋白质具有多个CHIP – SEQ重复的情况下,我们使用其标准化MI系数的谐波平均值进行分析。我们独立处理了染色质特征芯片分析的重复。在一个绘制到多个MARCS蛋白的芯片seq蛋白的情况下,我们使用了最低p值的蛋白质的染色质特征效应估计值。

  作为与上述归一化的MI统计量的另一个相似性度量,我们计算了峰高(由“ narlchpeak”和“ Broadpeak”文件格式中的第7列信号价值定义的Kendall相关性),用于基因组箱,峰为峰值是共同存在的。该度量用于扩展数据图4E – J。

  为了验证网络分析导致扩展数据图7F,我们根据基于MARCS的网络分析的推断相互作用的信心将芯片– Seq数据的每对蛋白分组为组。在对MARC进行多次映射的情况下,选择了最高信心的结果。对于每个这样的对,我们根据其芯片– Seq数据集计算了标准化MI统计量的对称变体:USYM(A,B)=(2MI(A,B))/(H(A)+H(B))。复制实验的统计数据平均。使用单方面的Mann-Whitney U检验来测试在MARCS置信度(Bonferroni校正)上,对称归一化MI系数的分布在统计上是否有所不同。

  定量和统计分析的详细信息在方法中详细描述了。在适当的情况下,图中还描述了必要的信息。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。