2025-06-25 07:19来源:本站
RNA接头是单链嵌合寡核苷酸,其5'端(ssDNA;扩展数据图2E)和10个RNA核苷酸在其3'端(SSRNA;扩展数据图2E),表示为17个DNA核苷酸,其5'端(SSDNA;扩展数据图2E)和10个RNA核苷酸。5' - /5OH/cgaggagcgcttnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn oh/-3',其中a,c,g,t和n表示DNA核苷酸,ra,rc,rc,rg和rt表示RNA核苷酸RNA核苷酸和nnnnn代表五个随机化的DNA DNA核代码,该核代码为umii secs umi iumi。RNA接头是通过集成的DNA技术(IDT)合成的。
RNA链接器设计用于通过RNA接头SSRNA与(1)RNA的有效连接,(2)通过RNA接头SSDNA的第一组细胞条形码,该条形码与第一组细胞条形码中的七个核苷酸(NT)悬垂互补。
DNA链接器是两个DNA链的杂交产物,顶部为5' - /5phos/ctagacactgcgcgtgcgtatctnbaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa a/3Oh/-3'',其中任何一个随机的底座和B底部,并具有底部为基础。5' - /5OH/CGAGGAGNNNNNNNNNACAACGCACAGTGTCTAGT/3OH/-3',其中NNNNN表示五个随机DNA碱基,它们用作UMI。杂交后,DNA接头包含15 bp双链DNA和36 NT(顶部ssDNA)和15 nt毫无杂交的ssDNA(底部ssDNA),以及底部链的单个碱基(t)悬垂(扩展数据图2G)。36 NT顶部ssDNA反向互补与铬的10倍条形码下一个宝石单细胞3'试剂盒(PN-1000268)。DNA接头的两个链由IDT合成。
DNA接头设计用于(1)通过粘性结扎的DNA接头的1 nt悬垂的碎片染色体DNA的有效连接,((2)通过DNA链接的15 NT底部ssDNA与细胞条形码有效连接DNA链接器的有效连接,以及(3)通过10x Barce的有效潮汐序列中的Poly Sequence通过10X Barcodes进行了高效效率。
小区条形码包含三组条形码,称为第一,第二和第三组。每组细胞条形码都有三个组件,即7 nt顶链悬垂,一个14 bp dsDNA区域和一个底链悬垂(第一组和第二组为7 nt,第三组为11 nt)。14 bp dsDNA区域包含每个细胞条形码的独特序列(双链N14;扩展数据图2D,i)。每组细胞条形码都包含96个独特的条形码,每个条形码在此14 bp dsDNA中都是唯一的(补充表2)。
在当前版本的音乐(v.1.0)中,每组细胞条形码都基于其dsDNA区域包含96个独特的条形码,总共产生了884,736个独特的序列组合。这三组细胞条形码旨在最大化连接效率,以使第一组带有RNA和DNA链接器的细胞条形码顺序连接,第二组和第三组与第二组。最佳的连接效率是通过悬垂序列的互补性来实现的(扩展数据图2d,i)。将排序的绑扎(例如带有第一组细胞条形码的第三组的绑扎)被最小化,因为第三组的悬垂物与第一组的悬垂不相称。
另外,第三组细胞条形码还旨在补充索引适配器3'侧的22 NT序列。
第一组和第二组细胞条形码由Sigma-Aldrich合成,第三组由IDT合成。
10倍条形码包含在10倍基因组学的铬铬下一个宝石单细胞3'试剂盒(PN-1000268)中。Each 10X barcode is an 82 nt oligonucleotide with a partial (22 nt) Illumina Read1 sequence (Read1), a 16 nt unique barcode sequence (N16, 10X GEM barcode), a 12 nt UMI (N12, 10X UMI), a 30 nt polyT sequence, a V (A, C or G) and an N (any base) (10X barcode; Extended Data Fig.2J,K)。10x宝石条形码在同一宝石的条形码之间共享;10x UMI是每10倍条形码独有的。
索引适配器包含三个段,即24 nt Illumina P7序列,一个8nt唯一的标识符序列,称为i7和34 nt Illumina Read2序列(补充表2)。在此版本中,音乐v.1.0使用八个不同的i7条形码,总共提供了约8350万个复杂条形码(8(i7条形码)×350万(10倍条形码))。每个库构造使用八个索引适配器,每个库都有一个唯一的i7序列。我们将这八个索引适配器称为一组索引适配器,每个索引适配器都可以与第三组细胞条形码中的互补读取2序列杂交以启动PCR反应。
同时,这些用作样品条形码。我们总共设计了三组索引适配器,以允许从三个输入样本中构建三个库并将它们进行排序(补充表2)。这三组索引适配器共享P7和Read2序列,并因其i7序列而异。它们还用作样本指数,以区分三个样本。索引适配器由IDT合成。
通用适配器包含一个Illumina P5序列和Illumina Read1序列(补充表2)。通用适配器可以通过其互补读取序列与10倍条形码杂交,以启动PCR反应。通用适配器由IDT合成。
H1人类胚胎干细胞和E14小鼠胚胎干细胞是从4D核心联盟中获得的,并根据4D核心财团批准的方案(https://www.4dnucleome.org/)培养。简而言之,在Matrigel(Corning,354277)涂层菜肴上,在37°C下在37°C下生长H1细胞。将细胞保持在从基底培养基(Corning,85851)中制备的完整MTESR培养基中,并具有5倍补充剂(Corning,85852)。每天更换培养基。细胞通道数保持在P10以下。将E14细胞培养在涂有0.1%明胶(EMD,SF008)的板上,无血清2I/LIF培养基;该培养基由基础培养基(1:1的神经质量培养基(Gibco,21103-049)和DMEM/F12培养基(Gibco,11320-033)补充了0.5×N2补充剂(Gibco,Gibco,17502-048),0.5×B27 Esprement(Gibco,Gibco,1750444444444444444444)(BSA) fraction V (Gibco, 15260-037)), supplemented with 1 µM PD0325901 (Reprocel, 04-0006-02C), 3 µM CHIR99021 (Reprocell, 04-0004-02C), 0.15 mM monothioglycerol (Sigma, M6145-25ML) and1,000 U ML -1 LIF(细胞引导系统,GFM200)。每天更换培养基,并将细胞通道数保持在P10以下。
细胞在10 cm盘中汇合后,将培养基清除并用PBS洗涤一次。加入ACCUTASE(1 mL; EMD,SF006),并在37°C下孵育3分钟以解离细胞。PBS(10 mL)用于通过移液产生单细胞悬架。通过以330克离心3分钟来形成细胞颗粒。接下来,将溶解在PBS中的10 mL 2 mM二核酰丙酸酯(DSG)添加到交叉链接中,并将细胞重悬在小管中,并在室温下在室温下孵育45分钟。孵育后,通过以1,000克离心4分钟收集细胞,以去除DSG溶液,用PBS洗涤一次,然后以1,000g再次离心4分钟以去除上清液。洗涤后,将细胞彻底重悬于10 mL含有3%甲醛的PBS中,并以轻微的旋转孵育10分钟。通过添加3 ml的2.5 m甘氨酸每10 mL 3%甲醛,孵育5分钟,旋转孵育5分钟,可以停止交联反应。然后将细胞以1,000克离心4分钟以去除上清液。接下来,用含有0.5%BSA(w/v)的冰冷PBS洗涤两次细胞,并以1,000g离心4分钟。洗涤后,将细胞重悬于PBS中,用0.5%BSA(w/v),每个细胞等分试样,然后在1.5 mL管中含有500万个细胞。通过以1,000g离心5分钟获得细胞颗粒,在液氮中捕获冻干,并存储在-80°C下。
如前所述12(50 mm HEPES pH 7.4,1 mm EDTA pH 8.0,1 mm EGTA pH 8.0,140 mm nacl,0.25%Triton X-100,0.25%Triton X-100,0.25%igepal Ca-630,,冷冻细胞在冰上融化,并在1.4 mL的1.4 mL细胞裂解缓冲液中重悬于1.4 mL的细胞裂解缓冲液A中。鸡尾酒)。对于混合物种实验,将相等量的人H1(250万)和小鼠E14(250万)细胞重悬于一起。在冰上孵育10分钟后,通过在4°C下以900克离心4分钟收集细胞颗粒。然后将细胞沉淀重悬于1.4 mL细胞裂解缓冲液B(10 mM Tris-HCl pH 8.0、1.5 mM EDTA,1.5 mM EGTA,200 mM NaCl,200 mM NaCl和蛋白酶抑制剂鸡尾酒)中,并在冰上持续10分钟。在4°C下以900g的900克收集细胞核。Two hundred microlitres of rCutSmart buffer (NEB, B7204S) containing 0.25% SDS was used to thoroughly resuspend and permeabilize the nuclei, with incubation at 62 °C for 10 min with Eppendorf Thermomixer C. Following incubation, 60 µl of rCutSmart buffer containing 10% Triton X-100 (w/v) was mixed with the SDS solution and该反应在800 rpm摇动时在37°C下孵育15分钟。将处理的核在4°C下以900克离心2分钟,以去除上清液,并用rcutsmart缓冲液洗涤一次。
每50毫克尸体后人脑额叶样品样品被放入1.5 mL的小管中,并用杵将较小的碎片切成较小的碎片。将脑样品转移到15毫升的小管中,并在室温下孵育45分钟,在10 mL溶于PBS中的10 mL 2 mM的DSG中轻轻旋转。孵育后,将组织样品以1,000克离心4分钟,然后用PBS洗涤一次以去除DSG溶液。洗涤后,将样品彻底重悬于10 mL PBS中,其中含有3%甲醛,并轻轻旋转孵育10分钟。通过添加4 ml 1.25 m甘氨酸,然后在旋转中孵育5分钟,从而停止交联反应。然后将样品以1,000克离心4分钟,并用含有0.3%BSA(w/v)的冰冷PBS两次洗涤。
根据制造商的用户指南,使用铬核分离试剂盒(10倍基因组学,1000494)与交联皮层样品分离核。具体而言,将50毫克的冷冻组织放在预处理的样品分解管中,然后将提供的裂解缓冲液的400 µL添加到管中,然后将组织解散,直到使用塑料杵均匀地分离直至均匀。接下来,将600 µL的裂解缓冲液添加到管中,并且用户通过移液混合了十倍。在冰上孵育10分钟后,将溶液均匀地加载到两个核分离柱中,并在4°C下以16,000g离心20 s。在3200 rpm以3200 rpm旋转含有核的收集管中的流动管以重新悬浮核。然后将收集管在500g和4°C下离心3分钟,以使细胞核并去除上清液。将细胞核重悬于500 µL的500 µL碎屑去除缓冲液中,并通过移液器15次,然后在4°C下以700G离心10分钟,并取出上清液。将细胞核重悬于1 mL洗涤和重悬的缓冲液中。在500克离心5分钟后,在4°C下离心5分钟,将上清液取出,该核e留下了纯化的分离核的弹丸(补充图1A,B)。对于细胞系和人皮层样品,所有以下步骤都是相同的。
将细胞核重悬于250 µl的5'磷酸化主混合物中(T4 PNK缓冲液,500 U ML -1 T4PNK,1 mM ATP,1 U µl -1 RNase抑制剂(Roche,3335399001))与在37°C时在37°C下的孵育量为800°C时,在87°C下旋转。RNA。用PBS清洗缓冲液1(PBS,1 mM EDTA,1 mM EGTA和0.1%Triton X-100)洗涤核一次,并用PBS洗涤缓冲液2(PBS,0.5%BSA(W/V)和0.1%Triton X-100)洗涤核。RNA接头是具有DNA 5'羟基末端和RNA 3'羟基(5'-OH-CGAGGAGGAGGAGCGCTTNNNNNNNRARARRARRARRARRARRARRARRARURRRCRC-OH-3')的单链嵌合寡核酸。用4 µM RNA接头,T4 RNA连接缓冲液,400 U ML -1 T4 RNA连接酶1、15%PEG 8000、1 mM ATP和1 U µL -1 RNase抑制剂制成RNA连接混合物。将分离的核与250 µL的RNA连接混合物彻底混合,以将RNA接头与核RNA结合。将混合物在25°C下孵育2小时,然后在16°C过夜,间歇性混合在800 rpm(30 s ON,270折)。连接后,用PBS洗涤一次核一次,用PBS洗涤缓冲液2洗涤3次。
将所有洗涤的核重悬于消化师混合物中(300 µL含有30 µL 5,000 U ML -1 HPYCH4V的RCUTSMART缓冲液和1 U µL -1 RNase抑制剂)。在800 rpm旋转时,在37°C下将这种主混合物保存3小时。除去上清液时,在900g下以900g收集核。用900 µL PBS洗涤1和900 µL PBS洗涤缓冲液2的PBS洗涤一次,然后将核冲洗一次。
为了创建DNA接头连接的粘性端,将核悬浮在250 µL DA-Tailing Rections Master Mix中(Nebnext DA-Tailing反应缓冲液,200 U ml-1 klenow片段,1 U µl-1 rnase抑制剂),在37°C下在800 rpm旋转1.5 rpm,并在37°C下孵育。Next, nuclei were washed once with PBS wash buffer 1 and three times with PBS wash buffer 2. The DNA linker is a hybridized product of two DNA strands, with the top strand being 5′-Phos-CTAGACACTGTGCGTATCTNBAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA-OH-3′ and the bottom-strand5'-OH-CGAGGAGNNNNNNNNNNACGCACAGTGTCTAGT-OH-3'。DNA接头包含14 bp dsDNA,36 NT顶部SS DNA和15 NT底部ssDNA(扩展数据图2G,H)。DNA连接主混合物包含4.5 µm DNA链接器,0.2×2×即时粘性连接酶主混合(NEB,M0370),0.8×5×快速连接酶缓冲液(NEB,B6058S),6%(V/V/V/V/V/V/V/V/V/V/V/V/V/V)1,2-蛋白酶抑制剂)。为了将DNA接头与粘端DNA结合,将所有核与250 µL DNA连接主混合物完全混合。连接反应在20°C下进行6小时,以1,600 rpm的间歇性混合(30 s ON和270 s折)进行。
为了磷酸化连接器的5'端,将核重悬于250 µL的5'磷酸化主混合物中,并在37°C下孵育,同时在800 rpm旋转1 h。然后将核用PBS洗涤一次,用PBS洗涤缓冲液洗涤1和3次。将核与0.2 U µl-1 RNase抑制剂重悬于900 µL的PBS洗涤缓冲液2中,并通过10 µM细胞过滤器过滤(Pluristrainer,43-10010-50)。用6 µL乙锭同型二聚体1染色了六个微量的核悬浮液,并使用伯爵夫人II自动细胞计数器(Thermofisher)对核进行计数。总共从Hawkins等人获得了288个条形码。56,分为1、2和3。每个条形码的形式为7 NT_OVERHANG-DSDNA-DNA-7 NT_OVERHANG(扩展数据图2D,I和补充表2)。然后将收集的288个条形码称为细胞条形码。制备了三种连接主混合物,每种包含一组条形码(5.4 µm),0.2×2×瞬时粘性末端连接酶主混合物,0.8×5×快速连接酶缓冲液,6%(v/v)1,2-丙二醇和0.8 U µl-1 rnase rnase rnase抑制剂。连接主混合物分别命名为Mix 1、2和3,分别对应于条形码集1、2和3。
收集了多达100,000个核进行分割,以确保大多数用独特的细胞条形码组合标记。用PBS洗涤2和24 µL的RNase抑制剂,将核悬浮液分配为1,144 µL,然后分成96孔。为了将条形码与RNA和DNA接头结合1,每个孔中的核在连接主混合物1在20°C下孵育过夜,并以1,600 rpm的间歇性混合在1,600 rpm(ON 30 s和270折扣)中孵育。隔夜孵育后,通过添加60 µL淬火缓冲液(PBS,50 mM EDTA,50 mM EGTA,0.1%Triton X-100)淬灭反应,并在20°C下孵育10分钟。来自96孔的核溶液被合并成15毫升小管。然后将95 µL的淬火缓冲液添加到每个孔中以冲洗并收集任何剩余的核,并汇集到相同的15 mL管中。将核以900克离心4分钟,然后转移到剩余的上清液为0.5 mL的1.5 mL管中。PBS洗涤缓冲液2(500 µL)用于冲洗15毫升管,并将残留的核收集到相同的1.5 ml管中。用900克离心2分钟,将核用900 µL PBS洗涤缓冲2洗涤3次。
合并的核进行了与第一轮相同的分裂程序,除了连接主混合2和3分别用于第二轮和第三轮,取代了连接主混合物1。
我们使用了两组条形码的组合来共同区分单个分子复合物,称为复合条形码。第一组条形码是铬下一个宝石单细胞3'试剂盒(PN-1000268; 10x条形码)中提供的350万个寡核体。每个寡核苷是一个82碱基寡核苷酸,具有16 NT条形码和12 nt UMI(BC+UMI 10倍;扩展数据图2J,K)。第二组条形码由八个条形码(索引条形码)组成,每个条形码为8 nt(在扩展数据中i7图1H和补充表2)。
将细胞核重悬于250 µL的3'二磷酸化缓冲液(PNK缓冲液,0.5 u µl-1 T4PNK,1 U µl-1 RNase抑制剂)中,并在37°C下孵育1 h,并在800 rpm中以800 rpm旋转,以转换2',3',3''Cyc phosh phoseh ohoh。用PBS洗涤一次核一次,用PBS洗涤3次洗涤缓冲液,并以900g离心2分钟。为了在所有RNA分子中添加多A序列,将核重悬于Polya尾尾缓冲液中(E. coli Poly(A)聚合酶反应缓冲液,0.08 U µl -1 E. e. sui e.coli Poly(A)聚合酶,1 mM ATP,1 mM ATP,1 U µl -1 µl -1 RNase抑制剂)。在800 rpm旋转时,将混合物保持在37°C 10分钟。加入Polya尾巴后,将核彻底重悬于PBS中,该PBS具有0.04%BSA(W/V),并通过10 µM细胞过滤器(Pluristrainer,43-10010-50)过滤为1.5 mL管,以获得分离的核。用6 µL同型二二聚体1染色了六个微量的含核溶液,并使用伯爵夫人II自动细胞计数器计数核。将五千个单核转移到Covaris Microtube-15中,然后用PBS和0.04%BSA(w/v)填充至15 µL。使用Covaris M220聚焦 - 脱心剂(水温为6°C,入射力50 W,占空比5)对核进行超声处理5分钟以释放染色质复合物。
为了将10倍的条形码添加到DNA接头的多腺苷酸化RNA和顶部SS端,将超声的核配合物转移到1.5 ml的叶片管中,并与25 µL水混合,18.8 µl逆转录(RT)逆转录(RT)逆转录(RT)试剂B,2 µL降低的8.7 el Zym rt int ins in Zym rt C. rt C. rt Chrolts C. rt Chrolts C. rt Chrolts c。免疫沉淀测序G,然后根据步骤1.1-1.5在铬的下一个GEM单细胞3'试剂盒中,根据步骤1.1-1.5将其加载到10倍铬控制器上。根据10X方案将检索到的液滴转移到PCR管中以进行互补的DNA合成。液滴分散,根据10倍协议中的步骤2.1获得水相。
含有核酸的水相用无核酸酶的水填充至200 µl,并在小叶1.5 ml管中分成八个等分试样;接下来,将25 µl 2×反向交联缓冲液(400 mM NaCl,0.4%SDS,50 mM EDTA,50 mM EGTA,0.04 U µL -1蛋白酶K)添加到每个管中,随后的反向交叉反应在50°C下在55 h,然后在55 h的55 h中孵育,然后在55 h,然后在55°C下孵育,并在55小时内连接。在每个等分试样中,使用Monarch RNA纯化试剂盒(NEB,76307-460)将反向交联的核酸纯化,并将其洗脱为21 µL无核酸酶的水。将洗脱的DNA和RNA分子在55°C下与等温放大缓冲液II,0.32 U µL -1 BST 3.0 DNA聚合酶,另外6 mM MGSO4、1.4 mM DNTP混合和0.5 U µL -1 rnasin一起孵育15分钟。用1.8×RNA清洁安培珠(Beckman Coulter Life Science,A63881)纯化产品,并将其洗脱为20 µL无核酸酶的水。对于每个等分试样,在25 µL Nebnext Ultra II Q5 Master Mix中,对每个等分试样进行了2.5 µL共享通用适配器的2.5 µm共享通用适配器(P5和READ1)和2.5 µL等分试样的底漆。等分的特异性引物是八个索引适配器(“关键试剂”)。PCR在13-14个周期中进行。用1.2×Ampure珠纯化扩增的DNA,并洗脱为12.5 µl无核酸酶的水。将来自八个等分试样的纯化的DNA溶液组合在一起,并将其加载到4%E-Gel的五个车道中(Invitrogen,G401004)。切除300 bp至1.2 kb之间的DNA带。使用NEB君主凝胶纯化试剂盒(NEB,T1020S)提取DNA,并在30 µL洗脱缓冲液中洗脱。
测序文库的摩尔性是使用Qubit 4.0荧光计(Invitrogen,Q33238)和Qubit DSDNA HS分析试剂盒(Invitrogen,Q33231)测量的。使用具有高敏感性DNA染色质免疫沉淀测序的安捷伦生物分析仪评估片段尺寸分布。该库是使用Illumina Novaseq 6000的UC San Diego IGM基因组中心对库进行测序的。序列仪设置为读取28 bp序列,旁边是通用适配器旁边的28 bp序列,AS Read1,Index适配器内的I7区域的8 BP索引序列和150 bp序列和Index Adapter旁边的150 BP序列As Read2。
我们开发了Music-Docker使用Docker处理音乐测序数据以封装SnakeMake57管道,从而确保跨平台执行。这将处理i7索引 - 分类,配对的fastq文件,将它们分开处理为RNA和DNA序列,将单元格和复杂的条形码和地图添加到基因组中,删除PCR重复项并得出处理的文件。可在http://sysbiocomp.ucsd.edu/public/wenxingzhao/music_docker/intro.html上获得详细的文档。
使用BCL2FASTQ将原始测序输出(.BCL)转换为FASTQ文件,生产了8个bp read1和150 bp read2的FASTQ文件。Read1包括10倍条形码和10x UMI,其中包含Read2包含细胞条形码,RNA和DNA接头和插入序列。
反复插入步骤提取单元格和复杂的条形码信息和片段身份信息,为RNA和DNA读取单独的FASTQ文件单独读取,其中读取序列将是插入,并且读取名称将是片段标识信息。
为了解决通过测序误差和实验设计引入的潜在人工序列,如果其长度大于20 bp,我们将从DNA插入物的3'端中删除连续的AS或GS。对于RNA读取,我们检测RNA接头序列CGAGGAGCGCTT的ssDNA区域,然后删除其之后的任何序列。我们将CASADAPTOR(v.2.8)58与参数“ -Q 15 -m 20”一起使用。使用Bowtie2(v.5.4.0)59将DNA和RNA插入物映射到基因组上,该参数为“ bowtie2 -p 10 -p 10 -t -phred33 -x”和BWA(v.0.7.17)60 MEM,分别带有参数为'-SP5M'的MEM。选择独特的映射读数以进行下游分析。
如下读取映射,使用自定义脚本删除了由共享10x UMI和映射坐标识别的PCR重复项。该脚本对BAM文件进行排序,扫描一次并标记重复,如果它们符合特定条件:(1)将其映射到上一读的8 bp以内的位置;(2)它与先前的读取共享相同的细胞和分子条形码;(3)它的UMI与上一读的UMI相比表现出小于2 bp的Levenshtein距离。随后删除了所有已识别的PCR重复项,以确保下游分析的完整性。
最后,将每个i7索引库中的重塑BAM文件合并为一个全面的,分类的BAM文件,捕获DNA和RNA的基本信息,包括单元格和分子条形码(10X和i7索引)以及插入映射位置。
基于先前发表的Method12,如果其95%的DNA读数可以映射到一个物种,我们将一个细胞分配给了一个物种。具有唯一映射的,非复杂的DNA读数少于1,000的细胞被归类为环境细胞。为了计算单个群集混合物种速率,如果超过99%的独特映射的非删除的DNA读取的读数超过99%,我们将簇分配给一个物种。
每个群集都是共享相同单元格,10x和i7条形码(CB+GEM+i7)的读取集合。一个由两个读数(群集2)组成的群集对应于成对的相互作用,三个或更多读的群集对应于多路复用群集。如先前所述的12,22,每个多路复用群集分解为成对相互作用,该过程可调整来自多路复用群集的成对相互作用的总数。对于含有仅包含DNA或RNA读取的簇的同质群集,首先将每个大小为N的同源簇分解为所有非重叠对,然后每对均由1/N归一化。对于含有DNA和RNA读取的簇的异型簇,首先将每个异型簇分解为所有DNA -RNA对,然后将每对归一倍地标准化为1/(m+n),其中M和N分别是DNA和RNA读数的数量。这种归一化过程消除了来自不同大小的簇的成对分解数量的差异,从而确保了较大的簇在分解成对相互作用的数量中不会膨胀12,22。
为了生成DNA – DNA相互作用的二维触点图,我们首先定义每个单元的大小,通常表示为基因组箱,用于行和柱。分配给bin [i,j]的权重取决于包含DNA读取的簇的簇的总数,映射到ITH和JTH bin,这是由群集大小归一化的,如前所述。为了比较特定基因组区域内的DNA -DNA接触差异,仅使用映射到该区域的DNA读取,考虑了小簇,仅使用DNA读数来计算簇大小。如果为多个细胞生成DNA – DNA接触图,则计算所有簇的加权总和。类似的方法应用于得出RNA – DNA二维接触图,并计算每种相互作用的重量。
为了确定特定基因组箱的RAL,代表特定感兴趣的RNA的一维RNA-染色质接触,我们计算了涉及兴趣RNA的总加权RNA – DNA相互作用,DNA末端映射到所需的基因组箱。对于集合图,总结了来自单个单元格的RAL值。
最后,为了可视化DNA – DNA或RNA – DNA相互作用的二维触点图,使用线性因子(通常为100或1,000)对以前提到的步骤获得的原始触点进行缩放。这种放大步骤阻止了对数转换在小数值中的应用。放大后,进行对数转换以增强接触图的可视化。
为了达到音乐和微C之间的总接触量表的一致性,从两种方法都获得了标准化转换的触点图。最初,从微C或音乐得出的接触图是对数缩放的;然后将它们归一化为它们各自的最大值,从而在[0,1]的范围内限制所有触点。本研究中使用的Micro-C数据是从4DN Portal61(4DNFI2TK7L2F)34获得的。为了从.hic文件中提取原始触点,采用了稻草62工具。
为了计算Micro-C和Music DNA – DNA接触矩阵的隔室得分(PC1分数),我们首先计算了预期的接触矩阵。随后,我们从观察到的/预期比率矩阵的相关矩阵中确定了PC1得分,其中通过计算平均接触频率作为基因组距离的函数来得出预期矩阵。为了比较微型-C与音乐之间的PC1相关性,计算是在每个染色体上单独进行的。报告的相关性代表了所有染色体中这些相关性的中位数。
前MRNA是RNA读取的读数,与基因内含子至少具有15 bp的重叠,并被归类为蛋白质编码RNA。RNA – DNA簇的计算涉及所有NSARNA和PREMRNA的包含,以及它们相关的DNA读取。选择不超过1,000的RNA – DNA簇来计算RAL。本研究中使用的H1 A/B室数据是从4DN数据门户(4DNFID162B9J)2获得的。
系统检查了染色体臂内的接触频率与基因组距离之间的关系。最初,基因组距离范围(从10 bp到150兆瓦)被分为500,000尺寸的垃圾箱。随后,对于源自DNA – DNA或RNA – DNA簇的DNA读数,确定了所有所有基因组内成对相互作用的基因组距离,并计算了每个基因组距离箱的频率。然后根据分配给每个相互作用的权重标准化这些频率。计算每个群集和单个细胞中每个基因组箱的归一化频率。最后,在所有单个单元的所有簇中汇总了基因组距离与接触频率。
我们使用Cooltools(V.0.5.4)63在表示基因组距离与接触频率的微C数据中生成曲线。我们从4DN数据门户(4DNFI9GMP2J8)34下载了H1 Micro-C的.mcool文件。
对于每个大脑样本,我们应用标准的Music_docker管道来获得有效的RNA,DNA读取每个单元的信息。为了选择高质量的单细胞来对数据进行鲁棒分析和解释,我们删除了读取少于100个RNA或少于5,000个DNA读取的细胞,用于脑样品的下游分析。
我们首先通过计算映射到每个人类基因的RNA读取的数量(Gencode64,v.36; CHRM基因均排除),从而构建了单细胞RNA表达计数矩阵。然后,我们为每个大脑样品构建了一个seurat对象(seurat v.4.3.0)65,66,其参数为“ min.cells.cells = 2 and min.features = 200”(过滤基因在不超过两个细胞中表达,并过滤出不超过200个表达基因的细胞)。然后使用Harmony R软件包(V.0.1.1)60的Runharmony集成了所有大脑的计数矩阵,基于Stransform处理的数据,并根据包括单个库和实验批次在内的因素进行了回归。
为了比较脑细胞中的基因表达,我们使用了seurat r封装的对数正态化方法。原始读取计数首先通过库大小进行归一化,然后进行对数转换。
然后,使用seurat r软件包,基于PCA的前20个主组件,将集成的大脑对象通过UMAP方法降低维度。然后,使用基于从UMAP的前两个坐标计算出的基于k-nearest邻居(k = 20)的共享最近的邻居图(k = 20),将所有细胞以无监督的方法聚类。然后,使用具有0.05的参数分辨率的函数FindCluster来优化模块化函数来得出簇。首先以1的分辨率提取细胞子集并重群落,从而聚集兴奋性和抑制性神经元。
我们通过已知的细胞型特异性标记基因表达水平将细胞类型分配给每个群集。细胞类型特异性标记基因基于以前的出版物:对于主要的脑细胞型38,亚clusters(Azimuth)67和血管细胞68。如果每个群集的平均表达是A型A类型A的所有标记基因的平均表达,则分配给一种单元格类型(A),加上簇A类型A类型的标记基因的细胞比例高于任何其他细胞类型。我们设计了这个分数,该分数既采用了细胞类型标记基因表达水平和表达基因的细胞的比例,却更加重视表达水平。
我们通过确定前十大最常见接触基因组垃圾箱的基因组距离的中点来计算每个细胞的LCS渗透评分。为了得出所有额叶皮层细胞的接触频率与基因组距离的热图,我们首先产生了149个基因组垃圾箱,跨越5,000 bp至150兆瓦酶对,n bin跨基因组区域,其中N = 1,2,3,..,..,150。随后,对于源自DNA – DNA或RNA – DNA簇的DNA读数,确定了所有所有基因组距离bin的频率。然后将这些频率与bin尺寸进行标准化。对于每个单个单元,在绘制热图之前,将总接触频率归一化。表现出超过3×105的LCS渗透评分的细胞被归类为LCS射线细胞,其余的则被认为是LCS保存的。
为了评估基于转录组的细胞生物年龄,我们实施了先前研究中描述的规模方法43。这种方法涉及使用从https://sysomics.com/agingmap/获得的人类相关基因的列表。最初,我们根据每个标记基因的方向(+1或-1)基于其与样品的年代年龄的相关性。该方向取决于基因表达是阳性(+1)还是负(-1)与年龄相关。随后,对于每个标记基因,我们分配了一个计算为表达该基因的细胞比例乘以其方向值的比例。最后,我们使用基因表达z得分和相应基因权重的DOT产物计算了每个细胞的转录组龄。
为了鉴定其表达与染色质LCS-渗透评分显着相关的基因,我们在所有细胞中每个基因的表达和LCS-慢性评分之间应用方差分析(ANOVA)。具有p的基因< 0.01, F >1和大于0.1的LCS-渗透评分和基因表达之间的Spearman相关性的绝对值被认为是显着的。为了鉴定细胞类型特异性的LCS-erosion评分相关基因,我们在每种细胞类型中分别应用ANOVA。我们使用R软件包Gprofiler2(参考文献69)进行途径富集分析。显示了丰富的Wikipathway,Kegg和Reactom途径。
从参考文献中下载了所有脑细胞型特异性EQTL数据。45。我们通过选择标称P <1×10-4的EQTL并在内皮细胞和周细胞中删除eqTL来编译合并的数据集。EQTL及其靶基因之间的音乐DNA – DNA接触是读取对的对,其中一端被映射(一个基础重叠)在EQTL上,另一端在基因启动子上(从转录起始位点进行2.5 kb侧翼区域)。全局卡方检验是在6×6表上进行的,以测试细胞类型特异性DNA – DNA接触与细胞型特异性eqtl – gene对的总体关联。然后将6×6表减少到六个2×2表以测试每种单元类型中的关联(卡方检验)。优势比的95%置信区间计算为EXP(log(优势比)±1.96×selor),其中SELOR是log的标准误差(优势比)。
为了得出一维Xist基因组RAL,我们提取了所有包含一个Xist RNA的簇。对于带有M Xist RNA读取的每个群集,n DNA读取我们得出了M×N配对的Xist – DNA相互作用,然后根据其簇大小1/(M+N)对每个DNA相互作用进行标准化。然后,我们以1 MB分辨率将整个基因组纳入。每个垃圾箱的XIST RAL是与DNA末端与该箱重叠的所有Xist -DNA相互作用的总重量。
To derive the two-dimensional RNA–DNA contact map for chromosome X we extracted all RNA and DNA reads that can map to chromosome X. Next, for any matched molecular complex barcode with M chromosome X RNA reads and N chromosome X DNA reads, we again first derived all combinations of RNA–DNA interactions, with adjusted weight indicating the reverse of cluster size (1/M + N).我们以1 MB分辨率将X染色体组合成X染色体;m [i,j]然后表示加权相互作用的总和,其RNA的末端映射到ITH bin,DNA末端映射到jth列。
XIST - 染色体X关联水平在数值上表示为XIST附着的染色体X DNA垃圾箱的数量;每个单元将具有一个XAL值。为了评估XIST+和Xist-簇之间染色质组织的差异,我们根据其XAL值:1组,XAL为零XAL,其中包括所有可检测到的Xist -chromosomos X关联的细胞;和第2-4组,随着XAL值的增加,其中包括所有具有Xist -chromosoms X关联的细胞,在这三组之间平均分配。为了得出基因组距离和接触频率关系,我们遵循“基因组距离计算与音乐数据的接触频率曲线”中引入的方法。
在机构审查委员会的批准下,在Banner Sun Health Research Institute批准(研究1132516,研究者T. Beach),在Banner Sun Health Research Institute进行了验收。从所有组织供体获得了知情同意。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。