2025-06-22 22:40来源:本站
严格遵守法律和机构道德法规,收集了心脏样本。心脏样本是根据加利福尼亚大学圣地亚哥分校(UCSD)人类研究保护计划委员会机构审查委员会(IRB)批准的协议(IRB编号081510)收集的,UCSD Perinatal Biorepository的发育生物学资源是从捐助者家族那里获得知情后的开发生物学资源。所有实验均在IRB制定的指南和法规(IRB编号101021,在发育生物学资源上注册)中进行。数据隐私的道德要求包括通过受控访问数据库共享序列级数据(例如FASTQ文件)。
在含有10 mM HEPES pH 7.8、130 mM NaCl,5 mM KCL,10 mM葡萄糖,10 mM BDM,10 mM BDM,10 mM牛磺酸,1 mM EDTA和0.5 mM NAH2PO4的缓冲液中收集组织样品。
对于单细胞解离,来自八个心脏的组织样品进一步切成小块,并通过与IV型胶原酶(Gibco)和Accutase(Thermofisher)在37°C下孵育60分钟来消化。去除解离培养基后,将细胞重悬于补充5%FBS的PBS中,并使用Sony SH800分子分类。在处理SCRNA-SEQ之前,将样品稀释至每µL约1,000个细胞,如图1a所示。
将Merfish的样品用冰冷的PBS洗涤,然后在4°C的4%多聚甲醛中固定过夜。在第二天,将样品在冰冷的PBS中洗涤3次,每个10分钟,并在4°C下在10%和20%的蔗糖中孵育4小时,然后在30%的蔗糖中孵育过夜,然后浸入OCT(Fisher,23-730-571)和30%咖啡糖(V/V)中,以浸入OCT(Visher,23-730-571)。然后将样品嵌入OCT中,并存储在-80°C下直至切片。
对于单细胞和生物打印研究,H9-HTNNNTZ-PGZ-D2 HPSC系(TNNT2:EGFP HPSC HPSC心肌细胞报告报告)购自Wicell,并如前所述维持。41。在生物打印研究中,在差异化的心肌细胞中(补充图18a),使用了一项其他工程的TNNT2:NLS-MKATE2 RUES2 HPSC心肌细胞转基因报道线,该系列特异性表达了含有核定位信号(NLS-MKATE2)的MKATE2荧光蛋白(NLS-MKATE2)。通过荧光显微镜,免疫荧光和流式细胞仪研究对两条线进行了定期验证,并通过PCR对支原体污染进行了阴性测试。要生成TNNT2:NLS-MKATE2-T2A-BSDR RUES2 HPSC心肌细胞报告线(TNNT2:NLS-MKATE2),我们使用表达NLS-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE-MKATE 2A-T2A-BBSDREDIC 2NNT驱动器转选了Rues2 HPSC系列。To clone the PB-TNNT2:NLS-mKATE2-T2A-BsdR, we used the PB plasmid pcsj532 (a gift from K. Willert, UCSD) and used Gibson assembly (SGI, GA1200) to clone in a synthesized TNNT2 promoter42 (Integrated DNA Technologies), PCR-amplified NLS-mKATE2-T2A-BsdR (withPolya)来自PGRNA-CKB43(来自B. Conklin,Gladstone; Addgene,质粒73501)和PCR放大PGK:RT3Gepir44的PUROR(来自J. Zuber,Imp,Austria; Addgene; Addgene,Addgene,质粒111169)。所有三个组件均在一个Gibson组装中组装,并使用使用NHEI(NEB R3131L)消化的PCSJ532组装。使用lipofectamine stem(Invitrogen,STEM00015)转染RUES2 HPSC,并带有Pb-TNNT2:NLS-MKATE2-T2A-BSDR和表达人类优化的PB Transposase酶(PCSJ533)的质粒(PCSJ533),来自K. Willert,UCSD的礼物,以整合Pb。转染两天后,使用0.4μgml– 1尿霉素选择细胞。在增殖和分化方面,随后的幸存细胞与亲本和TNNT2:EGFP HPSC线的行为相似。协议已由UCSD的IRB(190561)批准。
将HPSC线培养在E8培养基中,并在胶状涂层(Gibco)涂层板上生长。如前所述41,45,46,使用已建立的方案进行了HPSC分化为心肌细胞。简而言之,将HPSC生长至80%汇合,在第0天(D0),将细胞用RPMI/B27补充剂培养,没有胰岛素(B27减去胰岛素; Thermofisher),其中含有10 µM Chir(Fisher Scientific)。施用Chir 24小时后,将培养基替换为没有胰岛素的新鲜B27,并将细胞再培养48小时。接下来(D3),5 µM IWP2(Tocris)在没有胰岛素的情况下补充了B27,并培养了48小时。在D5时,无胰岛素和IWP2的B27被无胰岛素的新鲜B27代替了48小时。从D7开始,将细胞与胰岛素(B27,Thermofisher)保持在RPMI/B27中。在D15上,该B27培养基随后补充了NRG1(50 ng ML – 1)47或PBS,然后进一步培养直至D30及更大,每3天刷新培养基。
如“组织加工”部分中所述,制备了对HPSC衍生样品进行的SCRNA-SEQ研究。简而言之,通过与胶原酶IV型(Gibco)和Accutase(Thermofisher)在37°C下孵育60分钟,从而酶消化了D25 HPSC衍生的心脏细胞。去除解离培养基后,将细胞重悬于补充5%FBS的PBS中,并使用Sony SH800分子分类。
动物研究严格符合美国国立卫生研究院和协议的护理和使用指南,并由UCSD机构动物护理和使用委员会批准(A3033-01)批准。在受控温度(20–22°C)和湿度(30–70%)环境中,将小鼠保持在12 h – 12 h的光线周期。先前已经描述了TCF21-CREERT2和SEMA3CFL/FL小鼠的生成48,49。为了验证小鼠的基因型,通过在含有25 mM NaOH和0.2 mM EDTA的75 µL溶液中添加2 mm的尾部剪切来提取基因组DNA,然后在98°C下将样品加热30分钟。接下来,添加75 µL 40 mM Tris-HCl(pH 5.5)以中和反应,并将基因组DNA模板的1:50稀释用于基因分型PCR。在这项研究中都使用了雄性和女性胚胎。胚胎没有基因分型来确定性别。为了确定胚胎发育的发育阶段,在此期间进行了他莫昔芬治疗,假定阴道塞当天中午为E0.5。他莫昔芬(Sigma,T5648-1g,0.1 mg G – 1体重)通过gavage在E10.5时喂入孕妇小鼠,并在E12.5,E14.5,E17.5,E17.5,E17.5,E17.5和NataTal Pay 1的心脏中收集心脏。固定的心脏被嵌入在pafaffin中,并与Haematoxyoxyl and Haematoxyl和EosiNsiN和EosiNIns嵌入了pafaffin。图像是在Hamamatsu纳米纳员幻灯片扫描系统和Olympus VS200幻灯片扫描仪上拍摄的,并分别使用NDP View 2软件(Hamamatsu)和Qupath(V.0.4.3)50进行处理。如前所述51进行了心室壁厚度的表型分析。简而言之,在乳头状肌肉的水平上测量了心室紧凑和小梁区的厚度,每个部分至少三个区域进行测量,每只小鼠至少三个部分。
使用10倍基因组铬控制器,铬单细胞3'库和凝胶珠子Kit V2(PN-12237)和铬i7多元吉特(PN-i7多元吉特(PN-122262)),根据制造商的说明制备了使用Sony SH800分子的细胞悬架的单细胞液滴库。所有库均在HISEQ 4000(Illumina)上测序,平均每个单元格至少65,000个对齐的读数。
为了检测SCRNA-SEQ数据集中鉴定的细胞群,我们设计了一个针对这些亚群特有的238个基因的面板。然后使用组合条形码成像技术在心脏样品上同时成像这些基因7。我们最初通过执行差异基因表达(DGE)分析以及应用NS-ForeST2(参考文献52)分类器在SCRNA-SEQ数据上应用从上述人类心脏获得的SCRNA-SEQ数据进行差异表达的基因标记,并应用NS-ForeST2(参考文献52)分类器在补充图1中从上述人心中获得的数据。genes) (Supplementary Table 7) and DGE analysis (7,557 genes) (Supplementary Table 3) of the cell subpopulations, and were then filtered for genes that were either not long enough to construct 48 target regions (each 30-nucleotides long) without overlap or for which expression levels were outside the range of 0.01–300 average unique molecular identifier (UMI) per cluster, as measured by scRNA-seq.还比较了NS-ForeST2和SPAPROS53管道之间识别标记基因的性能。Spapros的初始结果产生了80个基因,这是NS-Forest2选择的数字的一半。为了比较NS-Forest2和SpaproS之间的类似数量的基因,从数据集中删除了这80个基因,然后再次运行Spapros,然后选择了另一个90个基因。这两组基因的组合用于SPAPROS基因列表(补充表9)。为了量化所选基因以与SCRNA-SEQ数据相同粒度重新识别细胞亚群的能力,仅使用算法(NS-Forest2或Spapros)选择的基因重新计算了降低性降低和邻居图。 that was being evaluated. Each cell was then reassigned its cell subpopulation label based on the majority cell subpopulation of its five nearest neighbours in the new neighbour graph. The percentage of cells reassigned their original label was used as an accuracy metric. With this metric, we found that NS-Forest2 and Spapros chose genes with similar performance (Supplementary Table 10). Among the 238 MERFISH target genes, 63 were manually selected from the DGE and NS-Forest2 gene lists, including established markers for atrial, ventricular and non-chambered cardiomyocytes, as well as non-cardiomyocyte cell markers for fibroblasts, pericytes, VSMC, epicardial, endocardial, BEC, LEC and immune cells. Genes specific for platelet–red blood cells were not selected. To validate the final target gene list, we tested whether we could transcriptionally rederive the cell populations by cluster analyses using only the 238 target genes. To this end, we reduced the scRNA-seq dataset to only the 238 genes in the MERFISH gene panel and then performed dimensionality reduction, graph-based clustering and UMAP visualization. We observed a similar level of transcriptional separation and definition of cell classes between using the 238 target genes versus using the 3,000 variable genes chosen to annotate the cell classes in the scRNA-seq data (Fig. 1a and Extended Data Fig. 1b). In addition to the 238 MERFISH genes, we selected 11 genes that were imaged sequentially using smFISH (Supplementary Table 11), including genes that validated the combinatorial MERFISH imaging (Extended Data Fig. 2d).
总共238个基因被鉴定为Merfish靶基因,随后用于探针生成和Merfish分析,如补充表11所示。为了编码Merfish RNA探针以进行空间检测,使用了22位修改后的Hamming距离4代码8。238个可能的条形码中的每一个都需要至少4个累积错误才能转换为另一个条形码。该属性允许检测到任何2位的错误,并将错误纠正到任何位。此外,该编码方案使用恒定的锤击重量(即每个条形码中的1位1位的数量),以避免由于1至0和0误差的差异速率而导致不同条形码的测量中的潜在偏差,并且因为每个位内的光密度可以干扰各个荧光点,如前所述,如前所述,如前所述。我们在7,315个可能的条形码中使用了238个编码细胞RNA,并选择了10个未分配以用作空白对照的条形码。我们使用的编码探针集包含每个RNA的30-48个编码探针,每个编码探针包含分配给每个RNA的4个读数序列中的3个。编码探针是使用我们自己的管道设计的,即探针。使用完全优化的DNA探针和RNA探针中的C ++中的完全优化的算法开发了探针。探针使用了各种已发表算法(寡素54,寡聚仪55,寡聚56和探针57)使用的相同探针设计原理,其非目标是基于基因组全基因组的17-核苷酸非靶向靶向的。选择具有相似GC含量或熔化温度的探针,重复区域用于脱靶计数,但不用于探针设计。探针分为三个步骤实施。(1)基于参考基因组(DNA)或基因组注释文件(RNA)构建17-核苷酸指数。该步骤通过比特矢量和哈希表进行了完全优化,以进行高性能计算;(2) 扫描选择的基因组或基因组序列以基于上一步中的17-核苷酸计数计算非目标。(3),基于预定义的选择标准的过滤和等级探测候选物。对于RNA探针设计,我们使用了从NCBI_REFSEQ(https://hgdownload.soe.ucsc.edu/goldenpath/goldenpath/hg38/hg38/bigzips/genes/)下载的人类参考基因组序列(HG38)的转录序列。如前所述58,59,从寡核苷酸池制备了编码探针集的产生。简而言之,我们首先使用有限的周期PCR来扩增寡头(Twist Biosciences)。然后,我们使用这些DNA序列用作使用T7聚合酶(NEB,E2040S)进行体外转录到RNA的模板。随后,将RNA产物转化为单链DNA,用最大的逆转录酶(Thermo Scientific,EP0751)转化为单链DNA,然后通过碱性水解(去除RNA模板)纯化DNA,然后进行DNA Oligo Purigiencation in(然后是DNA Oligo Purigiencation in(Zymo Research,Zymo Research,d40060))。
在低温恒温器(Leica CM3050S)上以-20°C的截面为冻结的心脏。沿收集的人类心脏的前轴约为600μm,将一系列的12μM冠状切片切割,该切片捕获了所有主要的心脏结构。如先前使用编码的条形码序列(补充表11)所述,对238个具有10个非目标空白对照的基因的Merfish测量值进行了,并发布了读取探针60。简而言之,将12μm厚的组织切片安装在40毫米号。1.5被硅烷化和聚赖氨酸涂层58,随后通过浸入50%(v/v)乙醇,70%(v/v)乙醇和100%乙醇的覆盖鞋,每个均已预先清理。然后将组织干燥5分钟,然后在40°C下用蛋白酶III(ACDBIO)处理30分钟,然后用PBS洗涤5分钟。然后将组织在室温下用杂交洗涤缓冲液(2×SSC中的30%(v/v)甲酰胺)预孵育10分钟。预孵育后,将盖玻片移至新鲜的60毫米培养皿中,并用Kimwipe实验室组织去除残留的杂交洗涤缓冲液。在新菜中,将盖玻片与50μl编码探针杂交缓冲液(2×SSC,30%(v/v)甲酰胺,10%(w/v)硫酸葡萄糖,1 mg ML – ML – 1 Yeast TRNA和5μm编码探针的总浓度和1μm的总浓度:15-Nuc的总浓度:A 15-Nuc的总浓度,胸苷锁的核酸(DT+),具有5'-亚丙烯岩的修饰(综合DNA技术)。然后将样品放入加湿的37°C烤箱中36-48小时,然后在37°C下用杂交洗涤缓冲液洗涤20分钟,在室温下20分钟。将样品用4%(v/v)在2×SSC中的4%(v/v)多聚甲醛,然后用2×SSC用鼠RNase抑制剂洗涤5分钟。为了将RNA固定到位,如前所述的58,将编码探针杂交样品嵌入薄的4%聚丙烯酰胺(PA)凝胶中。简而言 首先将盖玻片上的杂交样品用De-Gass的4%PA溶液洗涤,由4%(v/v)组成19:1丙烯酰胺/BIS-丙烯酰胺(Bio-Rad,1610144),60 mm Trishcl pH 8(Thermofisher,Thermofisher,Am9856),0.3 M Nacl(Am9856),Am9856),Am95959595959595959595959595959595959595959595959595959595959595959595959595959595959595959595959595959595959.59595直径为0.1 µm的蓝色荧光(350/440)珠(Life Technologies,F-8797)。这些珠子用作基准标记,以对齐在多个回合成像中拍摄的图像。然后,将盖玻片用相同的4%PA凝胶溶液再次洗涤2分钟,并补充有聚合剂(Sigma,a3678)和TEMED(Sigma,T9281),分别为0.03%(w/v)和0.15%(v/v)。然后允许凝胶在室温下铸造1.5小时。然后将盖玻片和玻璃板轻轻分开,然后将PA膜与消化缓冲液一起孵育,该消化缓冲液由50 mm Trishcl pH 8,1 mm EDTA,0.5%(v/v)Triton X-100在无核酸酶的无核酶和1%(V/V)蛋白酶K(New England Biolabs,P8107s)中孵育。将样品在该缓冲液中消化> 36小时,在37°C的孵化器中用2×SSC洗涤3次。最终,用Alexa 488偶联的锚探测器阅读寡核苷酸(集成的DNA技术)和DAPI溶液染色,以1μgmL– 1的形式染色。如前所述60,在自制系统上进行了Merfish测量。
对于TNNT2:NLS-MKATE2 HPSC系的免疫荧光研究,将D25 HPSC衍生的心脏细胞解离,重新播放,然后再培养4天,然后再固定。然后,如前所述,使用TNNT2的抗体(A647小鼠抗心脏肌钙蛋白T,BD 565744,1:200)对固定细胞进行免疫染色。使用DAPI(1 µg ML – 1,Roche)染色可视化细胞核。免疫荧光图像是在尼康C2共聚焦显微镜上拍摄的。
通过定量PCR(QPCR)测量RNA表达。使用TRIZOL试剂(热泡)和直接Zol RNA Miniprep试剂盒(Zymo Research)提取RNA。使用1,000 ng RNA与iscript逆转录超级粘合(Bio-Rad)混合生成cDNA,然后在超纯的DNase/RNase无蒸馏水(Thermofisher)中稀释1:10。根据制造商的建议,使用Power Sybr Green Master Mix(Thermofisher)进行QPCR,并在Bio-Rad CFX Connect实时PCR检测系统上使用两步放大的CFX_2STEPAMP协议进行QPCR。使用2 -ΔΔCT方法分析数据。将所有基因表达归一化为TATA盒结合蛋白(TBP)的表达。底漆序列在补充表22中列出。
To create an in vitro hPSC ventricular wall model for studying ventricular wall morphogenesis, we bioprinted cardiomyocytes in multilayered constructs as shown in Fig. 5. To this end, we differentiated TNNT2:eGFP and TNNT2:NLS-mKATE2 hPSCs into D15 cardiomyocytes (hPSC-CMs) as described in the ‘hPSC cardiac differentiations and sample准备部分。D15 TNNT2:EGFP HPSC-CM被NRG1进一步处理,如先前所述46,以创建小梁样CMS。作为对照,D15 TNNT2:EGFP和TNNT2:NLS-MKATE2 HPSC-CM被PBS处理。然后将D30+ HPSC-CMS(> 90%通过流式细胞仪效率)与IV型胶原酶(Gibco)和Accutase(Thermofisher)酶解离,并以每毫秒的1亿个心肌细胞重悬于。生物启动多层结构的方法涉及打印D30+ HPSC-CMS,这些D30+ HPSC-CM用NRG1或PBS处理的矩形,带有指型的矩形为500×700×600 µm(高度×宽度×宽度×长度)(内部LV CC状层)(内部LV CC样层),然后打印出邻接的7500×700×700×700×700××700××700×700××含有明胶甲基丙烯酰基(GELMA)61与100 ng ml – 1的CC样层),如图5B所述,SEMA3C,SEMA3D,SEMA6A或SEMA6A或SEMA6A(R&D System)蛋白质的不同组合的100 ng Ml – 1混合。用于图5C中条件的SEMA3C的浓度为1,000 ng ML – 1,因为SEMA3C距离内部LV CC样层更远。使用6.25%的凝胶和0.33%的光线在15 s的光照时间内制造细胞包裹的层,并在生物涂纸前直接与单体溶液混合细胞。使用4%Gelma和0.4%的膝盖打印了包含信号因子的相邻层,并在15 s的光照时间内打印。使用固定在控制器阶段的甲基丙烯酸化盖玻片,将20 µL细胞 - 材料混合物放入盖玻片和聚二甲基硅氧烷(PDMS)之间的空间中 胶片连接到玻璃滑梯上。然后将这种细胞 - 材料混合物暴露于紫外线(365 nm,88 mW cm – 2),并带有由数字微骨器设备芯片产生的图案。打印每一层后,用温暖的PBS将构建体洗涤3次,并吸气干燥。最后,将多层构建体在PBS和培养基中洗涤,然后存储在细胞培养孵化器(37°C,5%CO2)中。媒介每隔一天刷新一次。
使用10倍基因组学的细胞游舱(V.3.0.1)管道处理原始测序读数。将读取被消除并与人HG38基因组对齐,每个细胞每个基因的UMI计数被量化以产生基因 - barcode矩阵。
从单元格ranger生成基因– barcode矩阵文件后,将单个计数矩阵合并在一起,并使用seurat(v.4.0.1)R Package62(https://satijalab.org/seurat/)进行处理。如教程(https://satijalab.org/seurat/)中所述,使用Seurat软件包对SCRNA-SEQ细胞进行进一步的过滤和聚类分析。检测到至少1,000个基因且线粒体读取百分比少于30%的细胞用于下游加工。使用DoubleTefinder(v.2.0)63(https://github.com/chris-mcginnis-ucsf/doubletfinder)除去潜在双重球,并使用预期的双重表率为5%,这是10x基因组学的预期速率,该细胞数量是10x基因组学的数量。对于汇总数据集,使用标准化函数将每个细胞表达的基因和总表达表达的基因表达归一化。使用默认参数的FindVariable Features函数检测到前3,000个可变基因。随后使用Scaledata函数对所有基因进行缩放,该功能利用线性回归模型消除了由于检测到的基因数量,重复差异和线粒体读取百分比而消除了技术可变性。使用RUNPCA计算主要成分,并使用了前50个主要组件(由肘部块状组件支撑(肘部平台支持显示差异的降低差异)超出了前50个主要组件)用于创建使用K.Param = 50的FindNeighbors功能的最接近的邻居图。然后,将带有图形的邻居图用于基于图形的,基于图的近距离图。细胞分为两个维度。使用Wilcoxon rank-sum测试(Findallmarkers,默认参数)鉴定了标记基因 对于每个单元格簇的一式比较。除了来自文献的原位杂交数据外,通过将其标记基因与已知的心脏细胞类型标记物交叉引用通过文献10,11,12,13,14,15分配给了簇。有时,会出现一个细胞簇,表达代表多个种群的标记基因,并包含逃避第一个过滤步骤的低UMI和基因计数的细胞。从下游分析中除去这些细胞。然后,为上述每个细胞(心肌细胞,间质,内皮,神经元和血液)的每个隔室重复聚类方法,如上所述,使用SCCAF(v.0.0.10)64评估聚类精度,具有以下参数:linearters:linearters Remission in 50/50/50/50/50/50/50/5。对于成人心室scrna-seq比较,我们将先前发表的数据集33与开发的心脏scrna-seq数据集结合在一起,并重新运行归一化函数,以比较这些数据集之间的基因表达。
将SCRNA-SEQ数据集的细胞注释与最近发表的使用围巾的成人心脏数据集进行了比较(v.0.5.9)65。对于围巾,使用SCVI(v.1.0.3)66(n_hidden = 128,n_latent = 50,n_layers = 3,分散='gene-batch'),使用SCVI(v.1.0.3)66集成了成人和发展的转录数据集。然后,使用Treeches67 Workflow(https://docs.scarches.org/en/latest/latest/treearches_identify_new_ct.html)构建了参考层次结构树,并具有默认参数和“ cell_state”标签。然后将来自参考数据集的标签传输到开发心脏查询数据集中,以预测使用schpl.predict.predict_labels()函数使用默认参数的单元格标签。使用0.5阈值的后验概率(默认选项)计算被拒绝的单元。
为了识别基因表达与年龄相关的变化,我们将Pyscenic(V.0.12.1)68基因调节网络(GRN)推论工具应用于SCRNA-SEQ数据集。为此,通过细胞类别进行了SCRNA-SEQ数据集,并进行了PYSCENIC分析,以识别GITHUB上标准管道(https://github.com/aertslab/aertslab/scenicprotocol/)之后的细胞类特异性调节。简而言之,我们执行了三个步骤,为每个细胞类创建一个GRN:(1)使用GRNBOOST2算法的GRN推断,(2)转录因子(TF)调节预测和(3)曲线下的细胞富集面积(AUC(AUC,AUC,测量,测量调节子活性)的计算)。然后,使用所得的AUC矩阵来识别年龄段活动最显着变化的调节,通过将线性模型拟合以调节活性并识别具有最高正和负变化速率的调节值。为了找到富含每组调节子的功能途径,我们使用富集生物导体套件(v.3.1)69进行了基因本体富集分析。在同一法规上,我们按重要性得分构建了一个具有网络前100个非冗余边缘的监管网络,并使用Cytoscape(v.3.8.0)70可视化边缘,转录因子和目标基因。对于VCM的整体GRN,我们通过中心性构建了一个具有前50个转录因子的监管网络,然后通过重要性得分占据了网络的前500个非冗余边缘,并使用Cytoscape可视化边缘和转录因子。
我们将CellChat(V.1.6.1)71应用于SCRNA-SEQ数据集,以识别特定区域的CCI。根据解剖区域(心房和LV/RV/IVS的LA/RA)分别分析心房细胞和心室细胞,并分别分析。接下来,我们遵循了CellChat的建议工作流程,使用其人体配体 - 受体相互作用的数据库(由于其在心脏发展过程中已知的生物学作用31,36,37),添加了NRG1 – ERBB2信号通路),识别过表达的基因,计算相互作用概率和基于Defales的大量参数,并发现了基于Defailes的大量参数。使用每个区域中存在的所有细胞类别(血小板 - 红细胞除外)进行该管道以计算潜在的CCI。
为了确定SCRNA-SEQ数据集中VCM的发展轨迹,我们使用了Waddington-OT(V.1.0.8)72软件包。分离了VCM细胞类别,代表心肌细胞室的C1 – C11,并将相应的细胞用于Waddington-Ot轨迹推断,如Github所述(https://broadinstitute.githinstitute.github.io/wot/tutororial/)无需选择估算的初始生长速度。计算每个相邻的时间点(9pc.w. – 11 p.c.w.,p.c.w. – 11 p.c.w. – 13 p.c.w.和13 p.c.w. – 15 p.c.w.)的传输矩阵,然后通过计算9 p.c.w阶段的下降分布来计算轨迹。通过将每个细胞的分位数计算出以原始伪频率值排名的分位数来计算用于后续分析的归一化假频率值。在构建了发育轨迹之后,通过确定每个相应的转录因子的表达加权假频率,由VCMS表达的每个相应转录因子和配体的表达加权假次来订购VCM的GRN和CCIS的GRN和CCI,如前所述73。
为了处理Merfish数据,如前所述,使用Merlin(V.0.6.1)对单个RNA分子进行解码。8。通过在基准珠通道上最大化相位互相关以调整阶段位置的漂移,从而使图像在杂交回合中对齐。通过施加高通滤波器来减少背景,然后每个像素进行解码。对于每个像素,从22轮成像中的每个回合中的每一个构建了一个矢量。然后将这些矢量放大,并计算出它们与Merfish Codebook的每个L2均衡条形码的欧几里得距离。像素被分配给其最接近条形码的基因,除非最接近的距离大于0.512,在这种情况下,像素未分配基因。分配给同一基因的相邻像素被合并为单个RNA分子。通过比较分配给空白条形码的分子的最接近的分子与分配给基因的分子的最接近的分子,通过比较分子的平均亮度,像素大小和距离来消除潜在的假阳性,以实现5%的估计错误识别率。每个分子的确切位置被计算为所有像素的中值位置,由分子组成。
使用细胞蛋白(V.1.0.2)74进行图像分割以确定细胞和核的边界。鉴定出不同的RNA分子并将其分配给单个细胞,如总聚腺苷酸化的RNA染色和DAPI染色所分割,从而可以检测细胞边界。核边界是通过使用“核”模型运行的细胞核来确定的,该模型使用前杂交图像的DAPI染色通道上的默认参数来确定。使用Polyt染色通道对细胞质边界进行了“ Cyto”模型和默认参数进行分割。通过将这些分割掩模施加到分子的位置,将Merlin鉴定的RNA分子分配给细胞和核。在构造单元格基质之前,将除去任何未分配条形码的分段细胞。
对于两个基因通道(750 nm和635 nm)和基准标记(405 nm)通道的图像校正了图像。为了减少每个杂交回合的背景噪声,在强度下降低了前面杂交圆的图像,并减去以获得新的背景图像。然后,通过从每个像素中减去15×15模糊,然后将最大强度投影分为两个维度,然后将图像局部归一化。为了进行转录检测,使用OPENCV函数自适应途径的块大小为41像素,在我们的复制Smfish实验中,减去范围为-80至-70。通过选择一个值确保所得面膜仅捕获了每个基因的不同成像平面上的可见荧光斑的值,该常数是通过经验确定的。使用Scikit-image的区域Props函数,我们滤除了偏心值为0的斑点和低像素区域的细胞(<4 pixels) to combat artefactual fluorescence detection. A global threshold was identified for the images of each gene by evaluating the values of features determined as nonspecific background (for example, irregular shape, low intensity). The coordinates of local brightness maxima that remained unattenuated after applying this global threshold were stored. Coordinates lying within the adaptiveThreshold mask boundaries were identified and counted as a single identified gene transcript. The images for each of the smFISH imaging rounds were aligned to the respective initial MERFISH hybridization round images to correct for microscopic drift using the fiducial marker channel. This was done by fitting spots to the fiducial bead markers of both sets of images, then minimizing the median distances between them. DAPI segmentation masks obtained from the MERFISH imaging were translated using this drift correction so that all identified gene transcript locations could accurately be assigned to the drift-corrected nuclei, which enabled reconstruction of a spatial mosaic of the cellular gene expression for each of our sequentially imaged gene targets. For the replicate smFISH experiments to validate MERFISH gene markers, each gene was imaged twice on the same colour channel but in different non-consecutive rounds, allowing for a more robust analysis by using the combination of the two images to reduce the effect of noise in the result. Genes were imaged on three colour channels: Alexa 750, Cy5 and Cy3. The genes were separated and analysed into batches of six, with the imaging being done in a pattern described as follows. In the first imaging round, genes A, B and C were imaged on the Alexa 750, Cy5 and Cy3 channels, respectively. On the second round, genes D, E and F were imaged on the same three channels. The third and fourth imaging rounds were then repeats of the first and second rounds. By imaging each gene twice, the data could be analysed as a pseudo-MERFISH experiment, whereby a codebook was designed with each gene having a barcode containing two ‘on’ bits in the two imaging rounds they were imaged. Using this codebook, the data was processed using the same method as the MERFISH data as previously described8.
With the cell-by-gene matrix, we followed a standard procedure as suggested in the Scanpy (v.1.8)75 tutorial using Python (v.3.9) for processing MERFISH data. Count normalization, principal component analysis (PCA), neighbourhood graph construction and UMAP were performed using the default parameters in Scanpy. We performed Leiden clustering utilizing a resolution of 2 because the additional clusters gained at higher resolutions either did not have differentially expressed genes or were related to technical imaging artefacts. The top 20 differential genes identified by the rank_gene_groups() function were used to annotate each cluster. We further subclustered the vCM clusters using Leiden clustering at a default resolution of 1 to further annotate vCMs as compact and trabecular vCMs for both the left and right ventricles. To investigate the cellular populations in the ventricle specifically (both 13 p.c.w. and 15 p.c.w.), we manually defined the ventricular region, subsetted the MERFISH dataset to those cells populating the ventricle and performed Leiden clustering using a similar strategy to that used in the overall clustering (resolution of 5). Again, the top 20 genes identified by the rank_gene_groups() function were used to annotate each cluster.
To integrate the scRNA-seq and MERFISH datasets, we first isolated both datasets to only the 238 MERFISH target genes interrogated by both modalities. We then utilized Scanpy’s implementation of Harmony to project both the scRNA-seq and MERFISH datasets into a shared PCA space76. The dimensionality of the joint embedding was visualized using UMAP (min_dist=0.3, 30 nearest neighbours in Pearson correlation distance). The parameters matched those used in a previous publication of Harmony76. To impute a complete expression profile and cell label for each MERFISH profile, we assigned the expression profile and cell label of the closest scRNA-seq cell to the MERFISH cell in the Harmony PCA space using the Euclidean distance metric (default number of PCs).
To evaluate the performance of the gene imputation method, we developed a predictability score for each gene which is the Pearson correlation between the imputed expression and measured image expression for all genes (Supplementary Fig. 14a). Because the shared embedding space is constructed using the 238 MERFISH target genes, it is expected that these genes would have higher predictability scores than genes not used in the construction. To avoid this bias, tenfold cross-validation was used to calculate independently the MERFISH and scRNA-seq gene predictability scores. To this end, a new shared embedding utilizing only 90% of the 238 MERFISH target genes was used to calculate the MERFISH and scRNA-seq gene predictability scores for the remaining 10% of genes that were not included for constructing the embedding. This process was repeated 10 times with a different 10% of genes being imputed by a different shared embedding each time to cover the full set of 238 genes. To calculate whether a predictability score represented a prediction that is a significant improvement over random prediction, we calculated predictability scores using a randomly connected neighbour graph. In other words, rather than predicting the expression from the cell with the most similar gene expression, the prediction was made from a randomly selected cell in the dataset, and then the predictability score was calculated between the measured expression values and these randomly predicted values. This process was repeated 100 times to estimate a normal distribution of predictability scores that result from random prediction. P values were then determined for the true predictability scores based on rejecting the null hypothesis that the true scores originated from the null normal distributions. Finally, these P values were corrected for multiple hypothesis testing using the Bonferroni method. We observed that the maximum scRNA-seq predictability score for a gene that failed this significance test (adjusted P value >0.01)为0.11。
我们试图定义代表由相邻细胞近距离定义的独特的共享细胞环境的CC。为此,我们根据150μM区域内相邻细胞的细胞组成聚集了每个Merfish细胞,这代表了细胞外信号分子的典型扩散距离77。该区域采样了大约300个邻居。因此,每个细胞的区域由载体表示,该向量包含在Merfish数据集的整体和心室子集中27个鉴定的细胞中每个细胞的相对比例。然后,我们使用Python的Scikit-Learn(v.0.22)对区域进行了聚类,用于整体Merfish数据集的K = 13的Kmeans或Merfish数据集的心室子集的K = 9,由Silhouette分数选择。因此,在Merfish数据集的整体或心室子集中,每个Merfish细胞分别分配给13或9 CC中的1个。
为了推断社区特异性的CCI,将每个Merfish细胞得出的细胞注释转移到Harmony关节嵌入空间中的最接近的SCRNA-SEQ曲线中,并将其用于“ CCI分析”部分中所述的CellChat管道。通过分析分配给这些社区的SCRNA-SEQ概况,分别分别分析了整体和心室社区。对于每个整体或心室细胞群落,我们仅考虑在Merfish数据集中至少代表至少5%或3.5%的社区的细胞进行细胞CCI分析。
To visualize the similarity in the gene expression profiles of the vCMs, we isolated the vCM-LV-compact I, vCM-LV-compact II, vCM-LV-hybrid, vCM-LV-trabecular I, vCM-LV-trabecular II and vCM-LV/RV-Purkinje populations, and reperformed PCA, nearest neighbour graph construction and UMAP utilizing Scanpy with default参数。然后,我们使用Scanpy的基于分区的图形抽象的实现来构造一个图形,其中节点代表不同的VCM,而边缘表示邻域图中VCM之间的连接程度。这捕获了VCM之间相似性的度量。
为了确定每个Merfish细胞在心室壁内的距离,每个Merfish细胞的心室壁深度定义为与最近的心外膜细胞或EPDC的距离,它们都位于心脏的外层。为了比较不同心室之间的心室壁深度,通过将每个值除以相应心室的最大深度来归一化壁深度值。为了鉴定深度相关基因,我们计算了每个基因的表达和心室壁深度之间的皮尔逊相关系数。我们认为相关性大于0.2的基因与深度相关。接下来,使用Scanpy的Scanpy.tl.dpt()函数计算了VCM最近的邻居图上的扩散pseudotime距离。我们注意到,该度量通常被报道为代表发育变化的假期,但是在这种情况下,我们仅将其用作表达与VCM-LV-Compact I细胞表达相似性的度量。如前所述78,将与假次相关的顶部基因的缩放表达绘制为平滑的样条(扩展数据图6D)。
通过使用D0位置作为起点并计算HPSC-CMS每天迁移的距离来测量生物打印HPSC-CM的迁移距离。简而言之,在Leica SP5上拍摄了GFP+和NLS-MKATE2+ HPSC-CM的Brightfield和荧光(绿色和红色)共焦图像,其中使用了Brightfield图像来可视化构建体。由于印刷构造之间的大小和单元格数的较小变化,我们通过将构造的宽度划分为每个图像的15个均匀块,使迁移距离归一化。在每个块中,计算了从D0位置到HPSC-CM的最远位置(每天)的距离。然后,我们平均为15个块测量的距离计算每个条件和线的迁移距离。
复制和统计测试在图中描述了。使用统计方法,样本量不是预定的。组织样品不是随机的,在收集过程中,研究人员也没有被视为主观测量。从所有可用样品中收集了SCRNA-SEQ和MERFISH的数据,不需要随机分组。对于利用人类多能干细胞系的研究,对NRG1进行处理。对于动物研究,从每个基因型和阶段随机选择动物。分析过程中的盲目性是不需要的,因为使用无偏分析和不受样本影响的软件工具分析了所有结果。所有实验均可独立重复至少3次,结果相似,包括图5E中的实验,扩展数据图。2a和12a以及补充图18a。为了识别簇之间的差异表达基因,进行了Wilcoxon秩和测试,并使用Bonferroni程序校正了所得的P值。对于SCRNA-SEQ可预测性得分,通过使用bootstappaging生成每个基因的得分分布,然后计算(1-累积分布函数)以获得P值来生成P值。对于迁移距离,心室壁厚和QPCR结果,我们使用R(V.4.2.0; https://www.r-project.org/)使用单向方差分析。
图2E中的小提琴图的样本大小如下:从上到下,n = 9,106、7,661、19,901、3,791、4,003、60,810、2810、28,263、16,369、6,369、6,956、6,956、21,087、11,087、17,940、5,135和27,135和27,6135和27,6135和27,6113。图4C:从左到右,n = 541、849、1,552、719、2,290、1,112、754、499、335、55、55、13、701、338、177、177、163和49个细胞。扩展数据图5D:从左到右,n = 9,106、7,661、19,901、3,791、4,003、60,810、28,263、16,369、6,956、21,087、17,940、17,940、5,135、5,135和27,6113个细胞。扩展数据图5E:从左到右,n = 27,613、5,135、17,940、21,087、7,661、6,956、3,791、28,263、9,263、9,106、4,003、60,810、60,810、16,369和19,901个细胞。Extended Data Fig. 8f: top panel from left to right (13 p.c.whttps://www.nature.com/articles/15 p.c.w.), n = 573/706, 976/160, 1,532/895, 354/303, 784/553, 720/NA, 187/NA, 1,440/866,1,905/840和508/417细胞;从左到右的底部面板(13 p.c.whttps://www.nature.com/articles/15 p.c.w.),n = 711/274,313/305,548/711,387/21,1,444/938,938,800/451,800/451,557/409,79,79,79,79,79/80和66/124扩展数据图9d:从左到右,n = 9,723、18,908、21,203、8,042、47,906、16,225、5,814、6,307和18,592个细胞。扩展数据图9E:从左到右,n = 18,592、8,042、5,814、6,307、47,906、21,203、18,908、16,225和9,723。扩展数据图11E:从左到右,n = 81,880、75,531、34,953、145,935、19,949和18,485 RNA分子。在这种情况下,未显示由十个或更少的细胞数组成的小提琴图,并将其标记为“ NA”。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。