全基因组加倍驱动染色质分离的致癌性丧失

2025-06-22 23:35来源:本站

  HTERT-RPE-1 WT和HTERT RPE-1 TP53 - / - (46,XX)27个细胞是J. Korbel的礼物。这些细胞在DMEM/F-12,谷氨酸(10565018)中生长,并补充了10%FBS(Thermo Fisher Scientific,10270106)和1%抗生素 - 抗生素(Thermo Fisher Scientific,15240062)。CP-A(KR-42421)(47,XY)细胞购自美国型培养物收藏(CRL-4027)。在本研究中使用CRISPR-CAS9方法生成CP-A TP5​​3 - / - 细胞。The cells were grown in MCDB-153 medium (Sigma-Aldrich, M7403) supplemented with 20 mg l–1 adenine (Sigma-Aldrich, A2786), 400 µg l–1 hydrocortisone (Sigma-Aldrich, H0135), 50 mg l–1 bovine pituitary extract (Thermo Fisher Scientific, 13028014),1× insulin-transferrin-sodium selenite media supplement (Sigma-Aldrich, I1884), 8.4 µg l–1 cholera toxin (Sigma-Aldrich, C8052), 4 mM glu​​tamine (Sigma-Aldrich, G7513), 5% FBS and 1% antibiotic–antimycotic.K562(67,XX)细胞购自DSMZ(ACC 10),并在RPMI培养基(Thermo Fisher Scientific,11875093)中培养,并补充了10%FBS和1%Penicillin -Stropsypomycin(Thermo Fisher Scientific,15140122)。所有细胞系均在37°C的无菌,加湿的孵化器中与5%CO2生长,并根据细胞系每3-5天传递一次,以保持适当的细胞密度。

  该研究中使用的所有动物都是在EPFL动物设施中维持的SCID伽马(NSG)雌性小鼠。按照建议,将小鼠保持在12 h灯12 h-dark循环中,在18-23°C下,湿度为40–60%,并按照《动物福利法》(SR 455)和动物福利条例(SR 455.1)的规定。将小鼠皮下注入500万个细胞的细胞混合物比基质基底膜基质(Corning,354234),并监测肿瘤生长。动物实验是根据瑞士联邦兽医办公室指南进行的,并由广州兽医办公室(动物许可VD2932.1)授权进行。如果肿瘤体积≥1cm3,则处死动物。

  使用人类肿瘤解离试剂盒(Miltenyi Biotec,130-095-929)与酶鸡尾酒和带有加热器(Miltenyi Biotec)的绅士exocociator分解了来自小鼠的皮下肿瘤。然后通过40 µM细胞过滤器(Corning,352340)将细胞悬浮液拧紧。将样品用1×红细胞裂解溶液(Miltenyi Biotec,130-094-183)在4°C下进行10分钟,然后在300G下旋转5分钟,然后在PBS中重悬于0.5%BSA中。最后,使用小鼠细胞耗竭试剂盒(Miltenyi Biotec,130-104-694)从样品中除去小鼠细胞,并根据制造商的协议。

  将靶向TP53(参考文献27)的SGRNA序列克隆到PSPCAS9(BB)-2A-GFP矢量(PX458)中,这是F. Zhang的礼物(Addgene Plasmid 48138; http://n2t.net.net.net/addggen/addgen/addgene:48138; addg; Rrid; rrid; rrid; rrid; Rrid; rid; rid;简而言之,将每个正向和反向寡核苷酸的最终浓度在1×T4连接缓冲液(新英格兰Biolabs,B0202S,B0202S)中在37°C下退火30分钟,在95°C下加热5分钟,并将0.1°C S – 1升至S – 1至室温。同时,将10μg的PX458载体用10 u的BSMBI(新英格兰Biolabs,R0580L)在55°C下1×Nebuffer 3.1中消化1小时。根据制造商的说明,使用Nucleospin凝胶和PCR清理(Macherey-Nagel,740609)进行消化的质粒,并使用Nucleospin凝胶和PCR清理(Macherey-Nagel,740609)进行纯化和纯化。使用5 U T4 DNA连接酶(Thermo Fisher Scientific,EL0011)在1×T4 DNA连接酶缓冲液中使用5 U T4 DNA连接酶(Thermo Fisher Scientific,EL0011)结扎10分钟。然后将质粒添加到DH5α化学竞争的细菌中,并在冰上保持30分钟,然后在42°C下进行热休克45 s。将细菌在冰上冷却,并在37°C的SOC培养基中回收1小时。转化的细菌在37°C的含氨苄青霉素的生长培养基上生长过夜。在37°C下,采集并在补充氨苄青霉素的LB肉汤中挑选细菌菌落。根据制造商的协议,使用质粒加MIDI试剂盒(Qiagen,12945)提取质粒DNA。通过使用HU6引物的Sanger测序(Microsynth)来验证质粒。

  CP-A WT细胞在10 cm板中生长至60–70%的汇合。接下来,将含有TP53靶向SGRNA的5μgPX458质粒稀释为200 µL Opti-Mem I还原性血清培养基(Thermo Fisher Scientific,31985062)。然后将15 µL Fugene HD转染试剂(对于3:1转染试剂:DNA比)(Promega,E2312)添加到DNA中,并在室温下孵育15分钟。然后将混合物添加到板块下滴入板上,并通过摇动混合。将细胞在37°C下在加湿的孵化器中孵育48小时。将表达GFP的转染细胞单细胞分类在BD Facsaria Fusion仪器(BD Biosciences)上。允许克隆扩展克隆,然后通过3 µM阿霉素治疗24小时后通过免疫印迹对TP53蛋白水平进行单独测试(Cayman Chemical,15007)。

  将细胞接种至60–70%的密度。对于有丝分裂滑移诱导,将0.1μgml– 1 Nocodazole(Sigma-Aldrich,M1404)添加到生长培养基中,CP-A和K562细胞分别孵育72和48小时。对于四二磷化后具有伸长G1相的细胞,用0.1μgml– 1 nocodazole诱导了CP-A TP5​​3 - / - 细胞中的WGD 72 h,并用0.5μm的CDK4/6i Palbociclib(Sigma-Aldrich,pz0333333333383)处理0.5μm的CDK4/6i Palbociclib(sigma-aldrich)。对于细胞因子衰竭,将RPE细胞与含0.1μgml– 1氧唑唑的培养基孵育24小时。诺辅唑处理后,将细胞额外暴露于24小时至4μM二氢细胞藻素B(Cayman Chemical,20845)。除去处理,并允许细胞恢复48小时,以使其从核中核的过渡到单核状态。或者,通过在RPE TP53 - / - 细胞中诱导WGD,通过与9μm的CDK1抑制剂RO-3306(Sigma-Aldrich,SML0569)孵育24小时,以进行G2同步。将化合物洗净,然后用4μM二氢细胞藻素B处理24小时。允许细胞恢复48小时,并根据1μgml– 1 Hoechst 33342(Thermo Fisher Scientific,H1399)根据细胞周期染色对四倍体细胞进行排序。

  将CP-A TP5​​3 - / - 细胞用1μgml– 1 Hoechst 33342染色,用于细胞周期分析。分类具有高倍数的细胞(高HOECHST 33342信号,> 4N峰)。允许细胞恢复过夜,然后固定以进行下游分析。

  使用先前描述的修改方案51在RPE TP53 - / - 细胞中诱导CIN。简而言之,将细胞与5 mM胸苷(Sigma-Aldrich,T9250)在G1/S边界同步24小时。胸苷块释放六个小时后,将细胞用500 nm的MPS1抑制剂逆转52(Sigma-Aldrich,R3904)处理12小时。在处理下游分析之前,允许细胞恢复6小时。

  收集细胞并用PBS洗涤(Thermo Fisher Scientific,10010023)。在0.01%Triton X-100(Applichem,A1388)中在4°C下进行30-60分钟进行透化。PBS洗涤后,将细胞固定并用Fxcycle Pi/RNase染色溶液(Thermo Fisher Scientific,F10797)在4°C的情况下染色。使用Guava Easycyte(Luminex)和Galios(Beckman Coulter)细胞仪测量碘化丙二醇强度用于细胞周期检测,并使用FlowJo(V.10.8)(BD)进行了分析。

  在加湿的孵化器中,在37°C下,用20 ng mL – 1 karyomax colcemid溶液(Thermo Fisher Scientific,15212012)处理细胞2小时。将细胞收集在0.8%柠檬酸钠溶液(Sigma-Aldrich,S4641)中,并在37°C保持30分钟。用3:1甲醇固定细胞悬浮液:乙酸(Chemie Brunschwig,M/4000/17; FSHA/0406/PB08)添加了逐滴,在固定溶液中洗涤两次,并在-20°C下孵育过夜。将细胞滴入载玻片上(Thermo Fisher Scientific,J1800AMNZ)。将载玻片在65°C的加湿腔室中孵育2分钟,并在室温下气干30分钟。根据制造商的说明,将载玻片与DAPI(Thermo Fisher Scientific,p36962)一起安装,并与DAPI(Thermo Fisher Scientific,p36962)同时使用DAPI染色。在Zeiss Axioplan直立显微镜上以×100分辨率成像。使用斐济(V.2.9.0)53分析图像。

  对于非纤维蛋白,将细胞在RIPA缓冲液中孵育,由50 mM Tris-HCl pH 8.0,1毫米EDTA,1%Triton X-100,0.5%脱氧胆酸钠(Sigma-Aldrich,D6750),0.1%SDS和150 mm NACL,用于蛋白质替代的30 mm NACL。对于组蛋白提取,最初将细胞与PBS裂解缓冲液一起孵育,该缓冲液由1%Triton X-100,1 mM DTT(Applichem,A2948),1×蛋白酶抑制剂鸡尾酒在4°C下于4°C孵育15分钟,并在12,000克旋转。将所得的沉淀与0.2 N盐酸(Applichem,A5634)一起孵育过夜。然后将裂解物在4°C下以12,000克离心10分钟。分离含有蛋白质分数的上清液,并与6×Laemmli样品缓冲液(12%SDS W/V,60 mm Tris-HCl,pH 6.8,50%甘油(Fisher Scientific,g/0650),600 mm DTT和0.06%Bromophenol Blue(Sigma-Aldrich,sigma-Aldrich,b55525)p.55525.555525.55525)然后分别将分子重量蛋白和组蛋白分别在12%或15%SDS-PAGE凝胶上分离,而高分子重量蛋白在7.5%的Mini-Protean TGX预制蛋白凝胶上分离(Bio-Rad,4561023)。根据制造商的规格,使用透射印刷涡轮转移系统(Bio-Rad,1704150)将所有凝胶转移到0.2 µM硝酸纤维素膜(Bio-Rad,1704270)上。将膜封闭在含有5%牛奶(Applichem,A0830)和0.1%Tween-20(Fisher Biereagents,10113103)的溶液中,在室温下30分钟。将印迹在两个4°C的同一牛奶溶液中与针对TP53的主要抗体(Santa Cruz Biotechnology,SC-126; 1:500),β-肌动蛋白(细胞信号技术,4967; 1:5,000),CTCF,CTCF,CTCF(Active Motif,61311; 1:1,000),ABC ABC,ABC,ABC ABC(ABC,ABC,α-actinin (Cell Signaling Technology, 6487; 1:1,000), or for 1 h at room temperature with primary antibodies against trimethyl-histone H3 (Lys9) (Cell Signaling Technology, 13969; 1:1,000), acetyl-histone H3 (Lys27) (Cell Signaling Technology, 8173; 1:1,000), 三甲基 - 历史H3(LYS27)(细胞信号技术,9733; 1:1,000)和组蛋白H3(细胞信号技术,4499; 1:5,000)。将膜用荧光标记的山羊抗小鼠(Li-Cor Biosciences,926-68070; 1:10,000)或山羊抗兔(Li-Cor Biosciences,926-32211; 1:10,000)在房间温度下使用2 h,并使用Odyssey Clx Imave(Li-clx Imave)(Li-cor)(Li-Cor Biosciences,926-32211; 1:10,000)孵育。或者,将膜与HRP偶联的山羊抗小鼠抗体(Merck,Ap308p; 1:5,000)或山羊抗兔抗体(Merck,AP307P)一起孵育1小时。根据制造商的说明,将印迹与Amersham ECL Western印迹检测试剂(GE Healthcare,RPN2232)一起孵育,并使用FX6 Edge Imaging System(WITEC)捕获。使用斐济(V.2.9.0)53分析图像。

  将细胞培养在覆盖有聚赖氨酸(Sigma-Aldrich,p7280)的盖玻片上,并在标准条件下孵育。盖玻片上的细胞在4°C下用冰冷的甲醇固定30分钟。用PBS多次洗涤细胞,并在室温下与5%BSA(Sigma-Aldrich,A7906)一起孵育30分钟。将下一个盖玻片与原代抗体孵育,以抗酸丁香蛋白的浓度(0.1μgml– 1; ABCAM,AB4448)和α-微管蛋白(0.5μgml-1; Sigma-Aldrich,t6074)在1%BSA中稀释1%h,在1%的室温下,室温为1%。Coverslips were washed with PBS and incubated with the fluorescent secondary antibodies anti-mouse IgG-Alexa Fluor 594 (2 μg ml–1; Thermo Fisher Scientific, A-11005) and anti-rabbit IgG-Alexa Fluor 488 (2 μg ml–1; Thermo Fisher Scientific, A-11034) diluted in 1% BSA for 1 h at room在黑暗中的温度。用PBS洗涤盖玻片,然后用延长的Dapi与DAPI用延长的Diamond Antifade Mountant进行对抗。在Zeiss Axioplan直立显微镜上以×63分辨率捕获细胞图像。使用斐济(V.2.9.0)53分析图像。

  对于每种条件,将100,000个细胞重悬于完整的MDCB-153培养基中,以1:1的比例与0.7%无菌贵族琼脂(Thermo Fisher Scientific,J10907)混合。将细胞铺在1:1 MCDB-153培养基和1.4%无菌贵族琼脂的混合物上,将细胞铺在肋骨超级附着板上(Corning,3473)。使混合物在37°C的混合气氛中固化过夜,然后将新鲜的完整MCDB-153培养基添加到琼脂层的顶部。在正常条件下将样品孵育长达10周,并每周更换两次培养基。从琼脂层中挑选出单个菌落并进行培养以进行下游分析。最后,用0.5%晶体紫(Thermo Fisher Scientific,405830250)在20%乙醇的溶液中染色30分钟,用PBS洗涤并成像。

  如前所述,进行了批量HI-C库的准备,并进行了少量修改。收集约1-20万细胞并用2%甲醛固定(Thermo Fisher Scientific,11483217)。将反应用200 mM甘氨酸(VWR,101194M)终浓度淬灭,用PBS洗涤细胞(Thermo Fisher Scientific,10010023),并在包含10 mM Tris-HCl PH 8.0(Thermo Fisher Scientific,15568025,15568025)的溶液中裂解,10 mm nacl(10 mm nacl)(sig seg sep sep sep,s65465466546546546)(Sigma-Aldrich,I8896)和1×蛋白酶抑制剂鸡尾酒(Roche,11697498001)在4°C下30分钟。将所得的核重悬于1×Neb3.1缓冲液(新英格兰Biolabs,B7203S)中。将核的悬浮液与0.11%SD(Carl Roth,CN30)终浓度在65°C孵育10分钟。将反应用1%Triton X-100(Applichem,A1388)淬灭,并在37°C下用100 U MBOI限制酶(新英格兰Biolabs,R0147)消化核。根据制造商的规格将限制酶灭活,并将消化的核洗涤并重悬于1×Neb3.1中。Digested ends were then marked with biotin through incubation in 0.03 mM biotin-14-dATP (Thermo Fisher Scientific, 19524016), 0.03 mM dCTP, 0.03 mM dGTP, 0.03 mM dTTP (Promega, U1420) and 50 U Klenow DNA polymerase I (New England Biolabs, M0210M) for 4 h at室温。与50 U T4 DNA连接酶(Thermo Fisher Scientific,EL0011),1×T4 DNA连接酶缓冲液(Thermo Fisher Scientific,B69),5%PEG,1%Triton X-100和0.1 mg ML – 1 BSA(New England Biolabs,B9000S)近端连接钝端。通过与300 mM NaCl孵育和1%SDS在68°C下孵育,在接近度粘合的染色质上进行了交联反转。然后将样品用50μgml -1 RNase A(Thermo Fisher Scientific,EN0531)在37°C下处理30分钟,然后在400μgml -1蛋白酶K(Promega,V3021)中处理30分钟 在65°C下持续1小时。通过沉淀纯化DNA,纯乙醇和0.1体积的乙酸钠,pH 5.2(Thermo Fisher Scientific,R1181)在-80°C时纯化。在80 V峰发射能力下进行超声处理,将DNA洗脱,然后通过E220聚焦 - 粉状剂(Covaris)在60-80 s下进行超声处理,每次爆发为60-80 s。使用Ampure XP珠子(Beckman Coulter,A63881),将剪切的DNA大小选择用于库制备。接下来,使用Dynabeads Myone链霉亲和素C1(Thermo Fisher Scientific,65001)分离出生物素标记的片段,并在珠子结合的DNA分数上进行所有后续步骤。Hi-C library preparation continued with an end polishing reaction, which involved incubation of DNA with 1× T4 ligase buffer (New England Biolabs, B0202S), 2.5 mM each dNTP, 50 U T4 polynucleotide kinase (New England Biolabs, M0201), 12 U T4 DNA polymerase (New England Biolabs, M0203) and 5 U Klenow DNA聚合酶I,在室温下持续30分钟。通过将DNA样品与1×烟雾的2(新英格兰Biolabs,B7002S)中孵育,在37°C下37°°C中孵育DNA样品(新英格兰Biolabs,B7002S)和25 U klenow片段(3'→5'外核酸酶)(新England Biolabs,M0212)。然后将DNA片段末端连接到Illumina Truseq独特的双索引(集成的DNA技术),在1×T4连接缓冲液中,用5%PEG和15 U T4 DNA连接酶在室温下或在16°C下过夜2小时。最后,使用Illumina Forward(aatgatacggcgaccaccagagatctacac)和反向(Caagcagaagagacgggcatacgagat)引物和Kapa Hifi Hotstart readymix(Roche,KK2602)对图书馆进行了PCR。使用Ampure XP珠子选择了尺寸的片段。在HISEQ X,Novaseq 6000或Hiseq 2500 Systems(Illumina)上的PE150配置中对库进行了测序。

  对于每个库复制,使用BWA MEM(V.0.7.17)54映射到人类HG19参考基因组,并使用Juicer Pipeline(V.1.6)55进行处理。对于每个样品,在以下分辨率下生成HI-C地图:10 KB,20 KB,25 KB,50 KB,100 KB,250 KB,500 KB,1 MB和10 MB。一旦评估了相同生物条件的重复关系之间的一致性,就使用Juicer Pipeline中提供的Mega.sh脚本合并了相同条件的HI-C图。使用榨汁机管道中实现的骑士 - 瑞斯方法(KR)56对所有HI-C图进行了标准化。

  使用Calder Pipeline29在KR级别化的HI-C映射上以50 kb分辨率来调用车厢29。Calder返回对每个段的基因组的分割,其中每个段都被分配了一个隔室等级(0到1之间的实际数字)和隔室标签(B.2.2,B.2.1,…,…,A.1.2,A.1.1),这是八个不同类别中等级的离散化。隔室的排名和标签与DNA区域的染色质状态相关,其值接近0是B样的隔室和接近1的值是更类似A的隔室。

  肉体内接触图之间的成对比较基于以下指标:接触之间的相关度量,通过相互作用基因座之间的距离进行分层;隔间域及其边界的保护;边界绝缘水平的相关性;以及Calder隔室等级的相关性。

  比较了相同的生物学条件(对照与对照,WGD与WGD)的复制和不同条件的样品(对照与WGD,对照,对照在WGD肿瘤后与20周之间),以及不同细胞系的样品(对照组对照与参考文献12中的GM12878相对于GM12878)。复制比较和间比较线比较给出了每个分数的参考基线和随机波动的参考基线和广泛的染色质变化。

  按层调整的相关系数57用于Hicrep.py Package58中实现。将测试的最大基因组距离设置为10 MB,并以100 kb的形式将HI-C图归入并用H = 3箱窗口平滑。对于每个比较,计算每个染色体的层调整相关系数值。

  使用kr标准化的HI-C矩阵上的Calder管道以50 kb的分辨率调用隔室域。

  给定两个样品中同一染色体上鉴定的两个隔室域集,计算了Concordance59的度量,以前已定义以比较两个聚类分配。一致性的度量是一个在0到1之间的实际数字,其中1个代表相同的染色体分割和0最大不一致。

  如先前所述30计算HI-C绝缘材料。使用FANC Library60,特别是InsulationsCores.From_HIC函数在KR范围内使用1 MB的滑动窗口以50 KB分辨率计算每个染色体的绝缘得分。FOM_HIC函数。不考虑具有超过20%的缺失值的滑动窗口。通过几何平均染色体将得分标准化,并最终以log2尺寸为单位。因此,最终分数以0为中心,局部最小值代表原来的TAD边界。

  通过计算每个染色体的绝缘得分的Spearman相关系数来进行样品之间的比较。

  Calder给出的隔室分段分为50 Kb的箱,分配给每个垃圾箱的隔室等级。然后,将两个样品之间的相似性分别计算为每个染色体,作为两个binned等级矢量的长矛人相关性。

  通过分别考虑两个样品中每对不同染色体之间的相互作用,比较了每对HI-C映射的染色体相互作用。针对每个染色体对的两个样品之间计算了原始相互作用计数的Spearman相关系数。因此,对于每个HI-C比较,获得每对染色体的相关值。

  为了确定染色体对之间的相互作用偏差,每对染色体之间聚集了HI-C相互作用,获得了23×23相互作用矩阵I。使用迭代校正61平衡基质以消除相互作用偏见,以消除由于染色体的长度(因此每个Chromosome is Chromosome is is Chromosome is is 1)。这导致了标准化的矩阵IICE。这种归一化类似于参考文献中提出的归一化。11,具有确保恒定边缘的优势。比较时,两种归一化都产生了可比的结果。

  然后根据IECE中的相互作用曲线将染色体分为两个簇:从1到14个染色体,将X染色体分为X,而X被分类为长,而从15到22的染色体则将其归类为简短。

  为了比较控制和WGD间的染色体相互作用矩阵,计算了它们的比率r = log2 [iice(wgd)/iice(对照)]。然后,根据其末端的染色体簇,将染色体相互作用分为三类:长期,长期和短期。通过计算每对类别的R值之间的MAN -WHITNEY测试P值,比较了染色体相互作用类别。

  为了在10 MB分辨率下可视化染色体HI-C地图,使用Cooler Package62进行迭代校正。对计数进行标准化,以使每个垃圾箱的染色体互相互作用总数等于1。

  考虑了Calder(B.2.2至A.1.1)给出的八个类别中的基因组分割。然后,每个50 kb的基因组箱与其所属的隔室水平相关联。对于每个染色体,以1 MB分辨率提取其内骨体接触,然后使用Fanc Package60通过基因组距离12进行标准化。然后,通过将其属于的1×1-MB超像素的值分配给每个50×50 kb像素,将这些相互作用提高到50 kb分辨率。执行此过程以平滑归一化的相互作用值并确保每个基因组距离的足够覆盖率。对于每个50 kb基因组bin b,分别计算了bin和属于八个隔室水平类别的bin和bin之间的归一化相互作用的总和,从而为每个隔室水平comp获得一个值SB(COMP)。然后将这些值除以该箱结核的总相互作用总和。要考虑由每个隔室水平覆盖的染色体量引起的偏差,将这些值进一步除以属于每个隔室水平BCOMP的箱的百分比,从而获得ZB(Comp)= SB(Comp)/TBBComp。最终将获得的值除以其总和以获得每个bin fb(comp)= zb(comp)/σczb(c),这是每个隔室水平的0到1之间的数字,代表该箱的每个隔室水平的分离水平。对于每个bin b,它被定义为cScoreb bin所属的隔室水平的隔离水平。该定义是对参考文献中计算的隔室评分的改编。63,但在垃圾箱水平上应用。

  给定两个条件,例如WGD和控制,每对子组门的差异comp1,Comp2的差异如下:

  和

  代表Comp1中垃圾箱数量的比率,Comp1中失去了Comp2的隔室隔离,而Comp1中的垃圾箱数量,这些垃圾箱的数量与Comp2获得了Comp2的隔室隔离。

  仅仅是平均值和平均值,这使其成为对隔室水平Comp1和Comp2之间平均隔离变化的对称测量。该数字的–LOG2是出于表示目的计算的,其正值和负log2比分别表明两个隔室水平之间的增益和接触损失。

  为了具体评估特定隔室水平的分离损失程度,采用了类似的策略:

  被计算出来,这表示Comp Loss Loting分离中的垃圾箱数量与Comp Aptrage Degregation中的垃圾箱数量之间的比率。高于1的值表示种族隔离的损失,而值低于1表示种族隔离的增益。

  使用Fanc.boundaries.from_insulation_score函数从fanc Package60中确定对照和WGD样品中的TAD边界,从绝缘得分中确定,查看了垃圾箱周围400 KB区域中分数的局部最小值。每个边界都分配了与其位置相对应的绝缘得分。得分的较低值表示边界的较高绝缘能力。然后提取两个样品(±50 kb)之间共享的边界。选择了前300个绝缘边界如下:对照和WGD边界根据其绝缘得分分别排名。对于每种条件,选择了前300个排名边界,并确定其最大绝缘得分(对应于集合中的较弱边界),分别被调用并分别称为。定义了绝缘阈值。最后,控制和WGD之间的共享边界比所选择的绝缘得分小。应当指出的是,此方法不能确保选定边界的最终数正好为300。

  将RPE TP53 - / - WGD细胞(2.18亿个读取)的汇总图与其中一个对照映射(1.08亿个读取)进行了比较。相反,将对照的一个复制(1.08亿读)与相同对照的汇总图(2.21亿读)进行了比较。

  为了确定重要的核心,我们开发了一种算法,以识别使用Calder计算出的一致不同隔室等级的连续基因组区域。我们将此方法称为diffcomp。分割算法的设计如下。给定两个HI-C实验X和Y,使用Calder在50 kb分辨率的KR标准化HI-C矩阵上确定两个隔室域中的基因组分割。然后将两种分段以50 kb的垃圾箱进行了归纳,并分配给每个箱的相对隔室等级。因此,对于每个染色体,两个样品中的分区化表示为两个数值矢量CX,Cy。

  每个基因组箱的成对等级差计算为ΔRXY= CX - CY。该矢量表示两个实验之间的差分等级,正值表明向主动隔室的转变,而负值表示向非活动隔室的转移。

  使用递归策略根据ΔRXY对基因组进行了分割。给定的σ*,它表示一个段可以在分为子秘密之前可以具有的信号中的最大允许的标准偏差,该过程涉及以下过程。

  每个染色体最初被视为一个整个段,然后

  可以使用同一实验的技术或生物学复制来计算隔室变化的预期分布。使用RPE TP53 - / - 对照的两种重复计算预期的差异矢量Δre= Cr1 - CR2。

  在此分析中,σ*= 0.1是固定的,是ΔRE的标准偏差的1.3倍。对于每个检测到的隔室重新定位段s,经验p值作为p值(s)= p(max {|Δrxy(s)|}< |E|) was computed, where EΔRE. This P value depends both on the average value of the segment and on its length, for which longer segments have higher statistical power.

  The output of this method is a list of CoRE regions together with their average compartment repositioning score (which can vary from −1 and 1) and their computed empirical P value.

  For each comparison studied, CoRE regions having an absolute average value above 0.1, an empirical P value below 0.01 and a segment length above 300 kb were considered.

  To assess the amount of overlap between two sets of CoREs C1, C2 belonging to different sample comparisons, the two sets were divided in activations and inactivations on the basis of the sign of the compartment repositioning score (). The CoREs of the same type coming from both sample comparisons () were merged together by stacking overlapping regions together (using the bedtools merge command from bedtools (v.2.30.0)64,65), finally creating a consensus set of CoREs concatenating the two sets (). Each consensus CoRE was checked for overlapping with a CoRE of the same type in C1 and C2. Consistent CoREs were considered overlapping when two CoREs of the same type were overlapping and at least one of the two was a consistent CoRE.

  For each of the tumours, the CoRE regions that passed the previously defined statistical filters were considered. For each of these regions s, the corresponding Calder segmentation in the WGD and control time points were extracted. The average compartment rank of the CoRE region in the two previous time points were then computed, which were defined as rWGD(s) and rControl(s), respectively. The compartment rank of the CoRE region in the tumour were defined as rTumour(s) = rControl(s) + mean(s), where mean(s) is given by the CoRE detection algorithm. A parameter ε was then defined, which is the minimum absolute rank difference between WGD and control, namely |rWGD(s) – rControl(s)|, to classify the CoRE region as activating or inactivating in WGD with respect to control.

  Given ε, CoRE regions in tumours can be discriminated on the basis of the type of change in tumours (activating or inactivating) as well as the type of change at WGD (unchanged, activating or inactivating). The number of CoRE regions belonging to each of the six combinations was counted.

  A CoRE region was defined as ‘consistent’ when it belongs to the activation–activation or the inactivation–inactivation class. The percentage of consistent CoRE regions were counted with different choices of parameter ε. Observing the steepness of the curves in the three tumour samples, a shared parameter to ε = 0.05 was fixed.

  The segmentation strategy in DiffComp was compared to the circular binary segmentation (CBS) algorithm, which was previously developed for the segmentation of copy number changes66. CBS was applied to the Calder differential rank vector ΔRXY = CX – CY, which was computed as explained above. Segments detected using CBS were annotated with their compartment repositioning score and P values as described above. CoREs were then filtered on the basis of the repositioning score, P value and size as defined above. The CoREs detected using DiffComp and the ones detected with CBS were compared using as the benchmark the RPE TP53−/− 20 week post-WGD tumour 1 versus RPE TP53−/− control comparison. We then compared the breakpoint positions between the two segmentation strategies, the corresponding sets of significant CoREs and the traceability of these events to subcompartment changes occurring in WGD cells.

  Integrated phasing was performed using Hi-C reads from the pooled RPE Hi-C replicates (control). Single-nucleotide variants (SNVs) were first identified from the Hi-C reads using Freebayes67 (version v1.3.2-46-g2c1e395-dirty). SNVs were phased into two haplotypes, namely Hap1 and Hap2, using a previously described integrated phasing strategy68. In brief, population-based phasing was first conducted using SHAPEIT2 (ref. 69; version v2.904.3.10.0-693.11.6.el7.x86_64) with hg19 1000 Genomes project phase 3 as a reference panel. Pseudo-reads generated from the population haplotype likelihood were then combined with the Hi-C reads as input to HapCUT2 (ref. 70) for the second round of phasing. This approach returned several phasing blocks for each chromosome. Phasing information was retained only from the most variants phased block, which harbours the majority of input SNVs (>90%)。仅保留了严格映射到两个单倍型之一的锚固型的HI-C相互作用进行分析,从而获得了三组相互作用类型:HAP1-HAP1,HAP1-HAP2和HAP2-HAP2。

  WGD之后,预计顺式和反式接触中的速率都会增加。详细说明,在WGD之后,假定的顺式接触应增加3倍,并且在反式接触中应增加4倍。因此,预计在WGD后,Trans(T)与CIS(C)接触的比率增加如下所述:如下所述:

  为了验证这一预测,在顺式相互作用中被定义为hap1 – hap1和hap2 – hap2类型的所有基于HI-C的相互作用,而在反式相互作用中,所有HI-C-phap1类型HAP1-HAP2的相互作用的所有相互作用。计算以下内容:

  并分别适用于每个染色体,以及全基因组平均比率。最后,获得了接近预测值的获得。

  从HI-C数据中估算广泛CNV的策略的设计如下:

  对于CP-A TP5​​3 - / - 菌落的批量HI-C数据,使用了2 Mb的bin尺寸,t = 0.4,γ= 7。对于分阶段的HI-C数据,使用了γ= 4。

  HIC-DC71用于计算bin水平上染色质相互作用的统计学意义(分辨率为20 kb)。障碍负二项式回归模型中的自由度设置为6。样本量参数是通过在(0.5,1)范围内的20个值等距离的20个值确定的,然后选择不导致R. HIC-DC的其他参数的最大值的最大值。将HIC-DC的其他参数设置为默认值。

  根据制造商的协议,使用RNeasy Mini Kit(Qiagen,74104)从RPE TP53 - / - 对照细胞和WGD细胞中提取RNA。根据供应商的建议,使用Truseq绞合的mRNA试剂盒(Illumina,20020594)处理了所得的RNA进行测序。然后在PE150配置中的Illumina Novaseq 6000平台上对库进行测序。

  使用NFCORE/RNASEQ管道(V.3.8; https://nf-co.re.re/rnaseq)分析RNA-SEQ FASTQ文件,使用As Anigner star_rsem(参考72),将读数映射到HG19基因组。使用DESEQ2确定WGD和对照之间差异表达的基因(参考文献73)。绝对log2(FC)高于0.1的基因,P值为P值 <0.01 were considered significantly differentially expressed. Gene set enrichment analysis was performed using Enrichr74.

  Each gene was associated to the 50 kb bin containing its transcription start site. Each gene bin was then associated to the compartment rank computed by Calder in RPE TP53−/− control and WGD and computed the difference (Δcompartment). To check the association with boundary insulation changes after WGD, the genes for which the transcription start site was in proximity of an insulation boundary in RPE TP53−/− control (±50 kb) having an insulation score below −0.1 were considered. The percentage of upregulated and downregulated genes in proximity of boundaries gaining and losing insulation and the fold changes against the percentages in the total set of genes were computed.

  Single-cell Hi-C was performed using a modified protocol described previously75. Fixation of the nuclei with formaldehyde, MboI digestion and biotin fill-in was performed in a pool of 1 million cells following the same procedure as described for bulk processing. Next in-nucleus proximity ligation was done with 50 U T4 DNA ligase, 1× T4 DNA ligase buffer, 5% PEG, 1% Triton X-100 and 0.1 mg ml–1 BSA at 16 °C overnight, with light mixing. only pools of nuclei with at least 75% of the population showing an integral nuclear membrane were considered for further processing. Nuclei were strained multiple times through a 10 µm nylon net filter (Merck-Millipore, NY1009000). Sample preparation was done using DispenKit (SEED Biosciences), and single nuclei were dispensed in skirted Eppendorf twin.tec PCR plate 96-wells (Eppendorf, 0030128648) containing 50 µl of NEBuffer 3.1 (New England Biolabs, B7203S) using the single cell isolator DispenCell (SEED Biosciences) following the manufacturer’s instructions. A nucleus passing through the tip of the DispenCell, which acts as a Coulter counter76, leaves an electrical impedance change mark, which is proportional to the volume of the nucleus. For RPE TP53−/− cells, a minimum impedance change of 75 Ω was detected for the diploid nucleus and 200 Ω for the tetraploid nucleus. A lower impedance change was associated with debris or unsuccessful induction of genome doubling in the case of the WGD condition; thus, such nuclei were not considered for further processing. To avoid processing of nuclei aggregates, dispensed single nuclei associated with a threshold higher than 400 Ω and 800 Ω for diploid and tetraploid nuclei, respectively, were also discarded. These ranges were set from quality metrics of a test scHi-C batch. Specifically, an unreasonable number of unique interactions of each fragment end (for example, >2对于二倍体基因座)将指示一个核聚集体而不是单个核。分配后,通过在65°C的65°C下孵育过夜,将单核去解链接。接下来,每个选定的核与25 µL Dynabeads Myone链霉亲和素C1混合,并转移到1.5 mL管中,并在旋转轮上在室温下孵育1小时。用1×Rcutsmart Buffer(新英格兰Biolabs,B6004)在37°C中用10 U的Alui限制酶(新英格兰Biolabs,R0137)消化珠子结合的片段。对于大量HI-C处理,对每个单元进行了A量表反应和适配器连接。同样,单细胞文库的PCR扩增在与上述批量HI-C的同一主混合物中进行了27-30个周期。使用Ampure XP珠清洁库,然后在100 V时在2%琼脂糖凝胶上运行50-60分钟。成功的图书馆展示了300-700 bp的涂片,并从凝胶上切出。按照制造商的说明,使用核蛋白凝胶和PCR清理(Macherey-Nagel,740609)进行了琼脂糖的DNA纯化。通常需要额外的AMPURE XP珠子大小选择以去除任何引物二聚体污染。在PE75配置中,在NextSeq550平台(Illumina)上对库进行了测序。

  对于每个单元格,使用BWA MEM(v.0.7.17)将配对端R1和R2 FASTQ文件分别与HG19参考基因组对齐。Schicexplorer Pipeline77用于以冷却器格式生成HI-C接触地图。如先前报道的75,78,对SCHI-C相互作用进行了质量控制。具体而言,正如先前报道的那样,仅一个读取的端对可能是测序机器的比对或配对误差的结果78,因此将它们从分析中删除。从分析中也取消了单胎相互作用百分比超过75%的细胞。此外,除去了少于100,000个未过滤相互作用的细胞。最后,对于剩余的终点,至少有两个重复的读数支持的终端对,则删除了重复项。由于缺乏涉及1号染色体的染色体相互作用,从分析中除去了一个细胞,这表明在图书馆制备过程中出现了技术问题。

  与散装HI-C相似,对于每个通过先前定义的过滤器的单元X,将每对染色体之间的染色体间相互作用聚集,并获得冰平衡的相互作用矩阵IICE(X)。然后为每个细胞LCS(x)= ls(x)/(ll(x)+ss(x))定义染色体隔离评分的损失,其中:ls(x)=长染色体和短染色体之间平衡相互作用的数量;ll(x)=长染色体和长染色体之间平衡相互作用的数量;SS(X)=短染色体和短染色体之间平衡相互作用的数量。

  LCS得分越高,分析细胞中染色体分离的损失越高。比较对照组和WGD RPE TP53 - / - 种群的分数,并计算了Wilcoxon两尾P值。

  通过对每个单元的染色体对进行排序,通过平衡相互作用的数量对WGD种群中的相互作用富集或耗竭最高的染色体对,然后计算对照组和WGD种群中每对的平均等级。

  采用了一种简化的隔间归档策略。对于每个细胞,提取以1 MB分辨率的每个染色体的肉体内接触矩阵。从分析中除去了零边数的垃圾箱。然后按照先前所述的11进行计算观察到的预期矩阵,从而在对数中使用Cooltools Package在对数增加垃圾箱中计算触点衰减曲线62。归一化矩阵通过减去1左右。接下来,计算了每对垃圾箱的Pearson相关性,最后,提取了每个bin的前两个主要成分分析(PCA)组件(PCA)组件。通过将RPE tp53 - / - 对照样品的calder分割汇总到A和B区域,将A和B室分配给了批量HI-C中的相对隔室。然后,使用两个先前确定的PCA组件作为二维笛卡尔平面中的点坐标,将单个细胞的分离得分计算为每个染色体A和B簇之间的轮廓分数79。

  使用KMeans算法80将SCHI-C bin群聚集在两个PCA组件的基础上,并将簇数固定为2。仅考虑分析得分高于0的内骨体内图。两个K-均值簇被重命名为A和B,以使与散装室的相关性最大化。计算每个1 MB箱的相同生物条件细胞(对照或WGD)跨室呼叫的一致性,如下所示:如果A和B分别是称为A或B隔室的细胞数量,则箱的一致性为Max(A,B)/(A+B)。

  通过将每个染色体对的所有相互作用求和,因此获得23×23的染色体相互作用矩阵I。观察到的和预期(O/E)染色体水平相互作用,从参考文献中所述得出了23×23的染色体相互作用,从单个细胞互色体计数得出了单个细胞间染色体计数,从而从单个细胞染色体计数中得出了染色体伪膨出的HI-C值。11。简而言之,一对染色体IIJ之间观察到的相互作用的数量除以两个染色体EIJ之间可能相互作用的数量。EIJ在经验上被估算为第一染色体(CI)和第二染色体(CJ)的染色体互相互作用总数之间的产物,除以两倍的染色体相互作用总数(N):

  获得了染色体级相互作用富集矩阵OE = I/E。

  为了消除噪声,计算每个染色体对(I,J)的相关性,作为对应于OE基质中两个染色体的行的矢量的长矛相关性(OEI,OEJ)。获得了23×23的相关矩阵ρ,以使ρij= spearman(OEI,OEJ)。

  计算伪Bulk Hi-C中对照与WGD之间的相关性差异被计算为相关性的log2比率增加了1:

  使用5 MB的bin尺寸和最大的绝对偏差阈值t = 0.4进行了与批量和分阶段HI-C数据所定义的相同过程。

  SCRNA-SEQ使用制造商协议的铬铬下一个宝石单细胞3'KIT v.3.1(10x基因组学)进行。针对每种条件的细胞数量为3,000。在Novaseq 6000或Hiseq 4000系统(Illumina)中对产生的库进行了测序。

  The sequencing reads for all the samples (RPE TP53−/− control, RPE TP53−/− 6-weeks post-WGD, RPE TP53−/− 20-weeks post-WGD, RPE TP53−/− 20-weeks post-WGD tumours T1–T3) were aligned using the human reference transcriptome (hg19,ENSEMBL-87构建)具有10X基因组细胞Ranger Pipeline(v.3.1.1)82带有默认参数。Seurat R软件包(v.3.1.5)83用于数据处理。通过保持至少一个细胞中的基因表达基因,原始唯一的分子标识符(UMI)读取计数数据被读为seurat数据对象。每个样品过滤后获取并保留以下细胞数量:RPE TP53 - / - 对照,3,996个细胞获得,并保留了2,180个细胞;wgd后RPE TP53 - / - 6周,获得了3,716个,保留了3,475个细胞;WGD后RPE TP53 - / - 20周,获得的2,727个细胞,保留了1,976个细胞;RPE TP53 - / - 20周后WGD T1,3,359个细胞获得,并保留了2,851个细胞;RPE TP53 - / - 20周后WGD T2,3,467个细胞获取,并保留了2,721个细胞;WGD后,获取的3,790个细胞和3,078个细胞保留了RPE TP53 - / - 20周。在整个数据集的基因的交集上,发现了17,187个基因。将17,187个基因保存在所有数据集中,并应用了库中的合并函数以合并数据。该数据集由17,187个基因和21,055个细胞组成。从分析中除去了少于200和10,000个基因的细胞。还取消了超过8%的线粒体UMI基因的细胞。最终数据集由17,187个基因和16,281个细胞组成。在此阶段,使用来自Seurat的归一化函数进行标准化,其中每个单元的UMI计数除以该单元的总UMI计数,其缩放系数设置为10,000。因此获得的表达矩阵是自然对数转换的。RUNPCA功能使用默认参数和2,000个高度可变基因运行 (使用FindVariableFeatures函数找到)。运行RunuMAP函数以获得统一的歧管近似和投影,保留默认参数以及使用PCA组件的数量,即使用。

  Undercnv R软件包(V.1.1.0)39用于调用复制号码更改。UMI计数包括17,187个基因,21,055个细胞用作推断拷贝数更改的输入。RPE对照细胞被视为对照样品。使用具有RAW UMI计数和HG19基因组注释作为输入的CreateInferCnVobject对象创建了一个渗透性对象。运行功能参数设置为如下:。由包含拷贝数状态的supplcnv生成的残差矩阵用于使用快速策略(v.1.2.3)Python package84执行层次聚类。肘法用于确定簇85的最佳数量,其中簇之间的距离绘制在每个阈值相对于每个阈值。Matplotlib(v.3.4.2)Library86用于数据可视化。

  使用Seurat包装中的MAST87检测到RPE TP53 - / - 对照和20周WGD肿瘤之间的差异表达基因。调整后的P值低于0.001,绝对log2(FC)的所有基因都被认为是差异表达的。

  然后在风景秀丽的工作流程88,89之后计算转录调节器分数,使用Pyscenic软件包v.0.11.2如下:使用GRN命令生成基因调节网络,然后使用CTX命令使用CTX命令(从CISTASED DATADASE下载CISTAbase),然后将规范(转录因子及其目标基因)鉴定为规范(转录因子及其目标基因)。https://resources.aertslab.org/cistarget/)。使用AUCELL命令对每个单元格的调节子进行评分。

  分别计算出上调和下调的基因与激活和灭活核的重叠的百分比,并用作完整基因集的背景。然后将效应大小计算为四种可能情况的log2(fc),例如

  并类似地计算了其他效应大小。

  通过随机选择一组基因数量与差异表达基因的总数相同的基因并计算重叠核心的基因的百分比来评估统计显着性。经验P值计算为一组随机基因具有高于实际差异表达基因的重叠基因百分比的概率。

  根据制造商的规程,使用Dneasy血液和组织试剂盒(Qiagen,69504)从细胞中提取DNA。使用TRUSEQ DNA无PCR(Illumina,2001596)或Truseq DNA Nano(Illumina,2001596)套件进行库制备。在具有PE150配置的Novaseq 6000系统(Illumina)上对库进行了测序。

  使用bwa mem(v.0.7.17),将每个样品的配对末端FASTQ文件共同与1000个基因组3阶段的Human_G1K_HS37D5对齐,并使用SAMTools(V.1.10)90使用stort命令进行排序。使用FixMate命令固定了读取配对中的不匹配。使用MarkDuplicatessPark命令使用基因组分析工具包(GATK)91,92确定重复读数。使用基本成绩核能校正基础质量评分,并从GATK Suite施加BQSR。

  使用Control-Freec Software93(V.11.6)识别CNV。通过将样品和先前生成的对照BAM文件作为输入来调用每个样品的CNV相对于RPE TP53 - / - 对照样品调用CNV。该软件使用以下参数运行:

  所有其他参数都默认保留。

  然后使用Control-Freec软件提供的ession_simentific.r脚本计算每个检测到的CNV的统计显着性。

  选择了使用具有kolmogorov – smirnov p值和Wilcoxcon P值低于0.01的对照 - freec获得的CNV。相同类型(增益或损失)的拷贝数变化是根据其在三个肿瘤样品之间的重叠(±50 kb)合并的,使用床托的合并函数(v.2.30.0)64,65。

  使用gatk的Mutect2(参考91)算法调用SNV。黑名单的地区源自参考。94并使用该选项排除。在预处理阶段计算出的F1R1计数已提供该选项。使用GNOMAD数据库(B37版本)95的选项过滤了种系变体。使用FiltermutectCalls命令设置进行过滤突变,并使用该选项预处理时计算出的读取方向模型。然后,使用VCF2MAF96将VCF文件转换为MAF,并组装成单个文件。在分析中,仅考虑了单核苷酸多态性变体。

  删除具有以下滤波器值的突变:normal_artifact,种系,多级和群集。然后,删除了所有具有GNOMAD_AF值高于0.01或已在DBSNP(dbsnp_rs =='neks')中报告的突变。分别计算为肿瘤样品中的VAF和对照样品中的VAF为T_VAF = T_ALT_COUNT/T_DEPTH和N_VAF = N_ALT_COUNT/N_DEPTH。突变使T_VAF <2N_VAF被删除。对于剩余的突变,检查了样品之间的重叠(n_samples)。突变仅在一个样品中发现或已移除。相反,如果仅在一个样本中发现突变,但是保留了突变。

  使用Oncokb97评估了变体的致癌性。

  为了研究WGD后获得了多少个突变,并将其与没有WGD诱导的同一时间范围中积累的突变进行了比较,对WGD后6周和6周对照样品进行了突变数,并进行了以下排除标准:在TP53 - / - RPE对照样品中已经检测到的突变;WGD后6周和6周对照样品之间共有的突变,因为这些突变很可能已经存在于TP53 - / - RPE对照样本中,并且未被发现。出于相同的原因,在6周控制和WGD样品之间共享突变。

  使用制造商的协议,使用SimpleChip酶染色质IP试剂盒(Cell Signaling Technology,91820S)进行芯片。简而言之,在室温下,每个条件的2-40万细胞在1%甲醛中固定10分钟。用1x甘氨酸淬灭反应,并用PBS洗涤细胞沉淀。将细胞裂解,用1,000 U微球菌核酸酶在37°C下消化20分钟,并在80 V峰值发病能力下短暂超声,每次爆发200个周期和5%的占空比,在E220聚焦 - 粉底式 - 释肌(Covaris)上90 s,以破坏核膜。下一个1-5μg消化的染色质,有或没有0.1-0.5μg消化的小鼠染色质以进行尖峰归一化,在4°C下孵育与以下抗体之一,在建议的稀释液中孵育过夜:抗乙酰基因H3(抗乙酰基酮H3(Lys27))13969),抗CTCF(Active Motif,61311),抗三甲基 - 历史H3(LYS4)(细胞信号技术,9751)或三甲基 - 轴承H3(LYS27)(细胞信号技术,9733)。使用蛋白质G磁珠沉淀抗体结合的染色质,并使用NaCl和蛋白酶K进行交联反转。使用自旋柱纯化所得的DNA。根据制造商的规程,使用Nebnext Ulta II DNA库预备套件(新英格兰Biolabs,E7645)进行了染色质免疫沉淀DNA的测序准备。处理DNA片段以进行终端维修,然后进行粗短的适配器连接。使用Ampure XP珠(Beckman-Coulter,A63881)选择DNA尺寸选择。使用Illumina(新英格兰Biolabs,e7335)使用索引的NEBNEXT多重寡核能对Adaptor绑扎的DNA进行PCR扩增。在PE37/38配置中,在NextSeq 500系统(Illumina)上对所得的库进行了测序。

  使用NFCore/Chipseq管道(V.1.2.2)98,99(https://nf-co.re/chipseq/)处理FASTQ文件,将读取与HG19基因组保持一致。对于每个样本,然后使用来自DeepTools软件包(v.3.5.1)100设置的BAMCOMAPRE命令来计算针对输入实验的倍数更改。MacS3(参考文献101)用于峰值通话。Q值低于0.1的峰值,最小倍数变化为1.5。然后,由RPE TP53 - / - 和CP-A TP5​​3 - / - 细胞系从对照和WGD样品中创建了CTCF和H3K9ME3的一组共识集,通过将H3K9ME3和CTCF直接重叠的10 kB关闭的峰值分别创建。控制和WGD中的最大芯片– seq信号(折叠更改)与集合中的每个共识峰相关联。

  如先前所述的102,对CTCF信号上的尖峰归一化。

  通过将所有位于边界基因组箱中的峰(±10 kb)中的所有峰(±10 kb)中的所有峰通过,从HI-C鉴定出的RPE TP53 - / - 样品中共有的对照和WGD样品之间共享的绝缘边界与CTCF峰相关联。然后将边界与CTCF分数相关联,代表边界处所有CTCF峰信号的总和。

  对上一步计算的折叠更改信号对每个10/50 bp bin(具有值x)计算log2(x+1)值的缩放。然后以50 kb的分辨率将缩放值归为bin中的平均信号。最后,通过将每个垃圾箱除以染色体中位数值将50 kb binned信号归一化。对于WGD肿瘤HI-C样品,对于每个RPE TP53 - / - 20周,将50 Kb的BINNED CALDER等级与每种组蛋白修饰的BINNED芯片seq值匹配。最后,将Calder等级(ΔRank)的差异与针对RPE TP53 - / - 对照样品的芯片– Seq信号(ΔHm1,ΔHm2,…)的差异进行了比较。

  为了研究RPE TP53 - / - WGD肿瘤的子分会重新定位事件与表观遗传变化之间的关系,将每个组蛋白标记的平均芯片– SEQ信号差分配给了每个核心(平均(ΔHM1),平均(ΔHm2),平均(ΔHm2),…),核心区域的每个50 Kb bin中的每个50 kb bin。在子组门重新定位分数和核心的平均表观差异之间计算了Spearman相关性。为了估计观察到的相关性的显着性,通过随机对整个基因组跨基因组相同大小的许多区域进行随机采样1000倍的多个区域并重新计算相关值来计算经验P值。获得了P值,对应于预期相关的次数,绝对值与观察到的相关值更大或相等,除以随机试验的总数。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。