巨型二倍体Faba基因组解锁了全球蛋白质作物的变化

2025-06-23 09:42来源:本站

  PACBIO HIFI读取是使用带有默认参数的HIFIASM V0.11-R302(参考文献45)组装的。使用minimap2 v2.20(参考文献46)将Dovetail Omni-C数据与所得重叠群对齐,以准确订购和定向重叠群。同样,先前已经报道了来自共识遗传图的遗传标记物,并且使用MiniMAP2对准NV644×NV153重组近近交系(F6)的25K SNP阵列标记物(F6)与初步重叠群对齐,以将其分配给染色体。随后,使用Tritex Pipeline48完成了假分子的结构。检查每个染色体中重叠群的最终顺序和方向,并通过对OMNI-C和NV644×NV153衍生的遗传图的互补支持进行手动校正。组装的重叠群使用Kraken2 v2.1.1(参考文献31)进行分类分类,其中包括植物,昆虫和细菌的序列,以及Blobtools v1.1(参考文献49)。基因组完整性和共识精度通过Merqury V1.3(参考文献50)评估。诸如Merqury,Findgse V1.94(参考文献21)和Genomescope V1.0(参考文献51)等各种工具(例如,杂合性,杂合性和重复)的水平进行了评估。使用染色质免疫沉淀在每个染色体中鉴定出丝粒区域,然后用CENH3(一种芯片– Seq)与先前报道的52抗体进行测序(chip – Seq)(一种CENH3(一种中心粒特异性组蛋白H3变体)抗体。简而言之,Castadapt v.1.15(参考文献53)对芯片seq的原始读数进行了修剪,并使用minimap2映射到初步的伪分子。使用Samtools v1.15.1(参考文献54)将对齐方式转换为BAM格式,并由NovoSort v3.06.05(http://www.novocroft.com)进行排序。然后在100 kb窗口中计算读取深度。最后,每个染色体的顺序是根据丝粒位置(短到长臂)确定的,与Faba Bean的核型图相匹配。

  如前所述55,通过流式细胞仪估计核基因组大小。简而言之,V。Faba登录Hedin/2和Secale Cereale CV的完整叶组织。dankovske(2C = 16.19 pg DNA)56(作为内部参考标准)被切成玻璃培养皿中,其中包含500μlOttoI溶液(0.1 M柠檬酸和0.5%V/V eween 20; Otto,1990)。通过50μm尼龙网滤波粗悬浮液。然后将细胞核颗粒(300g持续2分钟),并重悬于300 µL Otto I溶液中。在冰上孵育15分钟后,加入了600 µL的Otto II溶液,并补充了50 µg ml -1 RNase和50 µg ML -1碘化丙肽。使用配备有532 nm绿色激光器的Cyflow空间流式细胞仪(SYSMEX Partec GmbH)分析样品。调整了仪器的增益,以使代表参考标准的G1核的峰值在使用512通道尺度时的相对丙烯荧光强度的直方图上大约位于通道100上。低水平阈值设置为通道20,以消除直方图荧光强度最低的颗粒;记录所有剩余的荧光事件,没有进一步的门控。采样了十二种Hedin/2植物,每次在不同的一天中分析了每个样品三次。通过FLOMAX软件(SYSMEX PARTEC GMBH)分析了每个样品至少5,000个核,并通过应用公式:2C核DNA含量=(样品G1平均值)×(标准的2C DNA含量)/(标准的2C DNA含量)(标准的2C平均G1峰)来计算2C DNA含量(在Pg中)。然后,使用转换因子1 pg DNA = 0.978 GB(参考文献57),将平均核DNA含量(2C)计算为每个物种的平均核DNA含量(2C),并将DNA含量(以BP为bp)转换为碱基对数(BP)。

  使用水母v2.2.10(参考文献58)估算了从PACBIO HIFI读取K-MER(K = 101)频率的分布。使用Findgse V1.94(参考文献52),使用输出直方图来估计基因组大小和杂合性。通过两种独立的方法评估了组件的完整性:(1)HIFI读取对组件的自我对准minimap2 v2.20 v2.20,然后是使用sniffles v1.0.11调用单个变体(SV)(参考文献59);(2)BUSCO v3.0.2B60分析具有胚胎数据库9。

  根据制造商的说明,使用Qiagen dneasy植物96套件提取用于甲基甲基测序的DNA,并根据1%琼脂糖凝胶进行了完整性,并使用Thermo Fisher Quant-It-It-It-It-It-It-Picogreen DSDNA分析进行定量。在Hedin/2基因组DNA中,将200 ng与0.001 ng的CpG-甲基化PUC19对照DNA和0.02 ng的未甲基化噬菌体lambda对照DNA结合,然后使用EB缓冲液将50 µL的体积带到50 µL。使用以下方案将输入DNA剪切至S220聚焦 - 脱心仪仪(Covaris)上的350–400 bp:占名因子= 10;峰值事件功率= 175;每次爆发的周期= 200;时间= 2次30 s。按照制造商的说明(https://wwwww.neb.com//media/media/nebus/files/manuals/manuals/manuals/manuale7120.pdf),剪切的DNA用于制备大型插入NEBNEXT酶甲基 - seq库。用不同的测序索引构建了四个库。用五个PCR循环进行索引PCR,以包括索引并放大库。通过定量PCR对最终文库进行定量,以等摩尔浓度合并,并在Novaseq6000系统(Illumina)的SP-Flow细胞上对500个周期(2×250 bp配对末端读数)进行测序。

  使用KAT v2.4.2(参考文献61)从PACBIO HIFI读取K-MER的分布(K = 51)。输出直方图使用Findgse V1.94估计基因组大小和杂合性。使用HIFIASM V0.15.5-R350进行组装。通过对齐HIFI读取重叠群并使用Sniffles v2.0.7调用结构变体来评估组件的完整性。尽管K-MER图上没有明显的杂合峰,但我们观察到蒂法尼(Tiffany)中的Busco重复基因比Hedin/2中的比例更高,并且与Findgse的基因组大小略有高估。此外,我们还注意到了许多简短的重叠群,读取覆盖率约为预期的一半,这表明在原本纯合基因组中存在杂合性区域。因此,我们使用purge_haplotigs v1.1.2(参考文献62)进行了单蛋白酶清除(purge_haplotigs cov -l 3 -m 7 -h 25)。使用Merqury V1.3进一步评估了被清除组件的质量。使用单倍型式组件构建染色体水平的支架(参考文献63)。为了确认脚手架的成功,使用gsalign v1.0.22对齐Hedin/2和Tiffany染色体(参考文献64)。我们比较了蒂法尼注释的两种方法,以选择一种最适合比较分析的方法:(1)基因组的个体注释;(2)“转移和间隙填充”方法(补充图15)。我们观察到,当使用同一管道分别注释基因组时,一定比例的同步基因具有不同的外显子结构。当将Hedin/2注释转移到蒂法尼(Tiffany)上时,这些差异大大减少了,这表明它们可能无法反映出真正的生物学差异。即使使用相同的管道(可能混淆比较分析),在注释中的人工差异也已报道65,66。因此,我们使用了转移和间隙填充方法, 其中使用升降v1.6.1(参考文献67)将Hedin/2注释转移到蒂法尼。为了防止形成嵌合基因模型,例如由SVS引起的,用框内终止密码子转移的模型被去除并用Tiffany基因代替。蒂法尼(Tiffany)独有的基因模型也被添加到注释中。总体而言,我们观察到,传递和间隙填充方法在两个登录中都产生了更多的同步基因和更多具有相同编码序列(CD)长度的基因。

  从Nevo重复发现是在Hedin/2伪分子上进行的,具有重复模型v2.0.1(参考文献68),样本量为1,000,000 bp,ltr_retriever v2.9.0(参考文献69)和ltrharvest70。从头元素用CD-Hit-test v4.8.1(参考文献71)聚集;通过与Repbase Release 20181926,GYDB 2.0(参考文献72)和RexDB Viridiplae v3.0(参考文献73)进行比较(参考文献73),可以帮助元素分类。对于逆转录座,LTR_RETRIEVER和LTRHARVEST指定了SLTR和全长元素。使用repotmasker v4.2.1(http://www.repeatmasker.org)进行重复掩模。还基于使用Dante V0.1.1(https://github.com/kavonrtep/dante),基于与REXDB V3.0数据库的相似性来鉴定编码保守蛋白质结构域的转座元件序列。使用相似性搜索与我们先前研究中描述的卫星DNA系列的自定义数据库进行注释。18,31,74,75。使用荧光原位杂交(FISH)检查了V. Faba的中期染色体上卫星重复序列的分布。如前所述进行染色体制备,探针标记和鱼类,并调整了杂交和洗涤温度,以说明探针AT/CG含量,以允许10-20%的不匹配。用4',6-Diamidino-2-苯基吲哚(DAPI)对染色体染色,安装在Vectashield培养基(Vector Laboratories)中,并使用Zeiss axioimager.z2显微镜与AxioCam 506 Mono相机进行检查。使用ZEN 3.2软件(Carl Zeiss)捕获图像并处理图像。

  使用RepotMasker v4.1.1(http://www.repeatmasker.org)掩盖重复序列,并使用Repotmodeler v2.0.1生成的自定义重复库(使用Hedin/2汇编)。使用Braker v2.1.6(参考文献76)(ETPMODE,MIN_ConTIG 10000)进行基因注释。使用Star 2.7.8a77,78对齐RNA测序文库(补充表2)。蛋白质数据库viridiplantae orthodb v10.1(参考79)(https://onlinelibrary.wiley.com/doi/10.1111/tpj.14546merged),并与先前发布的V. Faba Transcriptome组装的序列相结合。GMAP V2020-10-14(参考文献80)。此外,使用GMAP V2020-10-14对齐,将截短基因(MT4.0V2_GENES’)和P. sativum基因('Pissa.cameor.gnm1.ann1.7szr')对准。生成的比对用于抛光Braker基因模型。为了说明Braker预测错过但存在于Hedin/2转录组组件中的任何基因模型,使用BedTools v2.30.0比较了GMAP FABA转录组比对和Braker的基因模型,仅保留与Braker基因模型没有相交的GMAP基因。对于这些基因,进行了进一步的过滤,以消除任何短(小于50个氨基酸)翻译的蛋白质,框内终止密码子或低(少于200读)表达式特征,SubRead v2.0.1(参考文献81)。

  通过对齐一个ISO-Seq DataSet82和为Faba Bean品种Hiverna,Dozah和Farah制作的一个ISO-SEQ DATASET82和组装转录组,评估了Hedin/2和Tiffany的注释的完整性。使用GMAP V2020-10-14映射转录组,这些映射和注释之间的比较是使用BedTools83进行的。如果转录本不是推定的转换元件,则通过抛光去除但相交的映射转录本的基因模型被救出。使用rgaugury v1.0(参考文献84),在未抛光和抛光的注释上检测到R基因。还救出了未经抛光注释但没有在抛光注释中存在的R基因。用CPC2 V2.0计算每个成绩单的编码潜力(参考文献85)。将低编码势的mRNA重新分类为长的非编码RNA。去除了至少50%的基因重叠一个可转座元素结构域。最后,还去除了任何含有框架终止密码子的蛋白质。最终基因集的完整性是使用buscov5.2.2与embryophyta_odb10和fabales_odb10数据库一起评估的。

  每个条件进行三个生物学重复的总RNA测序。制备了18个库,并由Genewiz进行了配对的Illumina Hiseq mRNA测序(2×100 bp RNA测序),Genewiz平均每个库的读数约为2×7000万。使用CLC基因组工作台11(CLC Bio Workbench,Qiagen)去除适配器序列。仅保守至少30 nt的插入以进行进一步分析。根据制造商的建议,使用CLC基因组工作台11将读数映射到Hedin/2基因组。将每个转录本的映射读数归一化为总数,并用于计算基因表达。完整和破碎的对被计为一个。使用基于基于比例的测试统计量进行比较,在CLC基因组工作台套件中实施的每个成绩单的总数进行了比较。该β-二项测试比较了一组样品中计数的比例与另一组样品的比例。根据样品的大小(总数)给出了不同的权重。通过假设一组比例的β-分布获得,并通过矩的方法估算了这些权重,并估算了这些权重。结果是加权T型测试统计量。然后,我们计算了多种假设测试的错误发现率校正87。在分析中,仅考虑了所有比较条件的至少十次读取的基因。

  将19种豆类物种的基因(补充表6)聚集以确定直系同源物的关系。使用BLASTP v2.2.26(参考文献88)( - 评估1×10-5)将来自这些物种的蛋白质序列相互对齐。然后,将结果通过orthomcl v2.0.9(参考文献89)聚集基因家族。

  从Orthomcl v2.0.9中选择了从19种豆类物种(补充表6)鉴定的单拷贝基因进行系统发育分析。提取了四倍退化的同义位点(4D基因座),以通过Phyml v3.0(参考90)和TreeBest V1.9.2(https://github.com/ensembl/treebest)构建进化树。使用系统发育树和已知物种的发散时间(来自已知文献或使用时间表(http://wwwww.timetree.org/),使用McMctree v4.4估计分子时钟和发散时间。

  使用每个基因组中的截线估算V. Faba,M。truncatula和P. sativum的全基因组重复。首先,使用MCSCANX v2.0(参考文献92)确定了同步区域。然后,使用同步区域中的基因对进行4DTV(四倍退化横向)计算。通过HKY93模型校正了横向速率。通过KAKS_CALCULATOR v1.2(参考文献94)估算了同义词(KS)和非同义词(KA)替换。

  还使用CRBHITS v0.0.4 package95函数串联发现了串联重复的基因。为了确认结果,还使用dupgen_finder v25apr2019(参考文献96)对基因进行了分类,而A. thaliana则作为外组。V. sativa由于怀疑其结构注释的碎片化而被排除在TD分析之外,这可能导致注释为串联重复的基因数量(TDS)(补充表17)。使用T = KS/2R,r = 1.5×10-8估计重复年龄。使用方法“ li”使用CRBHIT计算KS。使用CRBHITS v0.0.4包装函数RBH2Dagchainer(type ='idx',gap_length = 1,max_dist_lowled = 20)分析了Hedin/2和Tiffany基因之间的同步,该函数在内部使用了Dagchainer AlgorithM97。通过使用Hedin/2和Tiffany之间的同步基因对连接TDG簇,通过连接单个基因组中的TDG簇在单个基因组中连接TDG簇,发现了同步串联重复的基因(TDG)簇。为了最大程度地减少未找到基因对拷贝数变化分析的影响,因为未找到的基因可以导致虚假的拷贝数变化调用,我们证实了基于同步的结果与Orthofinder v2.5.4(参考文献98)分析。仅根据同步和矫形器结果(对于矫正器,仅考虑匹配的染色体上的基因和未地位的重叠群),仅在同一基因型中具有相同或更高的拷贝数的簇被保留,以进一步分析。使用Prot-Scriber V0.1.0(https://github.com/usadellab/prot-scriber)对人类可读描述进行功能注释。

  使用Qubit 2.0荧光计(Invitrogen)进行量化的基因组DNA进行库制备,并采用Allegro靶向基因分型方案(Nugen Technologies),该方案依赖于一组探针。在溶液中的DNA中,按照制造商的说明,将20 ng µl -1用作输入。使用Qubit 2.0荧光计对所有库进行量化,并使用来自生物分析仪(Agilent Technologies)的高灵敏度DNA测定或Caliper LabChip GX(Caliper Life Sciences)的高灵敏度DNA测定进行验证。还使用CFX96触摸实时PCR检测系统(Bio-Rad Laboratories)对库进行定量PCR来量化库。样品在IGA技术服务(IGATECH)上进行了测序。DNA测序在2×150的PE配置上在Illumina Novaseq 6000(Illumina)上进行,平均每个登录的测序读对773万。

  使用Marvin种子分析仪(Marvitech)在2019年(试验23),2020年(试验26)(试验26)和2021年(试验30)以及Norordic Seed,2019年,在Norordic Seed,2019年11月9日(55.96°N,10.555.96°e)中,使用Marvin种子分析仪(Marvitech)对种子特征进行定量。(试验22)和2020年(试验25)。通过视觉检查对Hilum颜色进行评分。

  用Cusadapt v1.15对SPET RAW读数进行修剪,并使用miniMAP2 v2.20对齐Hedin/2基因组。使用NovoSort v3.06.05(http://www.novocroft.com)对对齐进行排序,并使用BCFTools v.1.8来调用SNP和Short Indels。VCF文件中缺少数据是使用Beagle V5估算的。用混合物v1.3.0(参考99)进行种群结构分析,k值范围从2到十。每个K的五倍交叉验证误差用于选择最佳K。使用Plink V1.90B6.9进行了原理分析,并使用LDBLOCKSHOW V1.40识别链接不平衡(LD)块。GWAS使用估算的SNP矩阵使用Gemma V0.98.5(参考文献100),Blink101,FarmCPU102和Emmax+EMMA200(参考文献103)进行。使用Gapit3 v3.1 R包和三个主要组件的Gapit3 v3.1 R包进行眨眼和FarmCPU。只有至少两种方法发现的SNP被视为候选物,进一步要求在多个试验中发现该信号。GWAS所使用的值是每个试验中每个基因型的均值,最佳的线性无偏估计量(蓝色)。首先使用该模型,使用R中的LME4软件包计算蓝色:

  如果yijk是块k中环境j中的登录i的得分,则µ是特征的总体平均值,gi是登录i的效果,eJ是环境j,gi×ej的效果,是登录i和环境j,bjk,bjk的相互作用效果,bjk是块k块在环境j中的效果,而εijk是残留的。除平均值外,所有效果都是随机效应。然后,使用R中的Lmertest软件包一次测试每种随机效应的显着性。只有P值大于0.05的效果才包含在最终模型中。最终模型具有G和µ作为固定效应,所有其他模型都是随机的。然后从G中提取蓝色。

  使用基因组最佳线性无偏预测(GBLUP)方法研究了种子大小相关性状的预测精度。矩阵符号中的拟合模型的形式为y =1μ + Zu + e的形式,其中y是观察到的表型记录的向量(blues)(blues),μ是截距,1是一个媒介,z是一个链接记录的矢量,U链接到附属物与附件的us us u是(基因组)的变化(基因组)的属性(基因组),是遗传的一般(基因组),是遗传的(0),是gensem and centiviention n is centivientian n is centivientian n is centivientian n is centiviantive and centivientian n es n is centivientian,是G)。矩阵(GRM)。GRM被构造为G = ZZ'/2Pi(1- Pi)104,其中z是以等位基因频率为中心的SNP矩阵,PI是标记i的等位基因频率。最后,e是假定的en(0,i)的随机残差的向量,其中i是一个身份矩阵,是残留方差。通过更改GMR计算的可用标记来研究三种预测方案:(1)仅候选基因组关联信号,(2)与以前重复100次相同的随机样品,以及(3)所有可用的SNP标记。复制交叉验证十次,平均值±标准偏差。RRBLUP v4.6.1(参考105)r软件包的“混合。解决”函数用于所有计算。

  SNP和Indels被过滤以保留双重变体。提取了被SNPEFF v4.3(参考文献106)注释为“停止”的变体,并且仅保留了至少一个纯合子参考和一种纯合替代基因型的多态性变体。使用Rgaugury V1.0 Pipeline84鉴定了抗性基因类似物。使用Regionerr v1.18.1(参考文献107)和1,000个排列(随机尺寸= runction.function.function.function.function.function.function.function.funiate.funiate.function.function.function.function.function.function.function = numoverlaps),使用permertest v1.18.1(参考文献107)和1,000个排列来计算抗性基因类似物中过早终止密码子的富集。所有基因均作为重新平台功能的宇宙提供。

  将与种子大小相关的最重要和稳定的SNP的位置与Hedin/2蛋白质编码基因的位置进行了比较。使用Orthofinder v2.5.4(-M MSA -S -S Diamond -A Mafft -t FastTree)鉴定了基因重叠变体的直系同源物。使用Clustal Omega V1.2.4进行选定蛋白序列的多序列比对。使用最大似然方法和基于JTT矩阵的模型推断出进化历史记录,并在Mega X V10.2.6(参考文献108)中实现了100个Bootstrap重复。用于Hedin/2的九种不同组织的公开表达数据16用于使用Kallisto V0.44.0(参考文献109)来量化基因表达。使用LDBLOCKSHOW V1.40(参考文献110)研究了围绕候选基因的基因组间隔中的LD模式。

  为了检查Hilum形态,从成熟的干燥种子中剖析了来自近交系的Hedin/2(深色Hilum)和Tiffany(淡hilum)的含种皮的Hilum,并在真空下用2%蔗糖溶液饱和1 h,并嵌入了冷冻凝胶介质(Cryo-Gel Leica)中。如前所述41,111,将样品切成15 µm横截面中的冷冻机(Leica CM1950),并用甲苯胺蓝O(0.01%,w/v; Sigma Aldrich)染色。41,111。观察和摄影是在明亮场上的Olympus BX 51显微镜(Olympus)上进行的,并使用Apogee U4000数码相机(Apogee Imaging Systems)记录了数字。为了通过激光解吸 - 离子化成像质谱法(LDI-MS)研究HILUM表面层的代谢物含量(LDI-MS),将种子机械裂开,并使用周围组织的一小部分分离出HILA,并使用其其他种子涂料(microsupport)与Maldiped胶带上的固定胶带分离,将其与其他种子套管与其他种子涂料(以前的固定)分开描述了41,112。使用高分辨率串联质谱仪(HRTMS)突触G2-S(Waters)进行LDI-MSI实验。使用的真空源使用的真空源配备了350 nm 1-kHz ND:YAG固态激光器。质谱仪的参数如下设置:在10 V时提取电压,碰撞能量:陷阱碰撞能量(TRAPCE)在4 eV处,并在2 eV处转移碰撞能(转移)。在25 eV处的诱捕器和低质量(LM)分辨率在10时进行MS/MS实验。使用红磷(1 mg.ml -1,丙酮中的悬浮液)进行仪器校准。质量成像数据收集是由HDimimaging 1.5软件(Waters)驱动的。激光束尺寸为60μm。在300 ARB处的激光能以正电离模式收集光谱。激光重复率定为1,000 Hz。质量范围为50–1,200 da。为了绘制HC基因座,在近交系(♀pale)和Hedin/2(♂dark)之间进行了一个十字架。通过侧翼标记物分析显示的21个F2个体的F4种子在HC间隔中均具有杂合子的侧面分析,以hillum颜色为杂合子,导致253个深色至84个浅色hilum比率(χ2= 0.00098,p = 0.9749,适合预期的3:1:1:1:1:1:1:1:1:1。创建了由84个隐性伪F2个个体中每个中每个人的等摩尔量的DNA组成的池,并与母线的DNA样品一起进行了SPET重新测序。为了研究PPO基因家族在中期至晚期填充物中的表达,Hedin/2和Tiffany的单个植物在温室中种植,直到下节点上最成熟的豆荚几乎达到成熟,而最上面的节点仍然在花中,从而提供了种子发育的梯度。然后将所有豆荚收集并剖析到豆荚壁,睾丸,子叶,凹槽和胚胎轴样品中(补充图16);记录每个组织的新鲜重量。因为给定节点上的所有POD均未同步受精,并且不一定会以相同的速率进行开发,并且是基于我们先前对Faba Bean Seed Develoption113的研究的见解113,因此我们将单个POD分为中期和晚期的Pod填充阶段。

  为了鉴定Hedin/2和Tiffany蛋白质组中的PPO同源物,将来自PEA PPO1/PL基因(PSAT1G206360)的蛋白质序列用作BLAST v2.12.0查询。PPO蛋白序列的多序列比对使用Clustal Omega V1.2.4进行。使用最大似然法和基于JTT矩阵的模型在MEGA X中实现了100个Bootstrap重复的基于JTT矩阵的模型来推断进化历史记录。从两侧提取完整的PPO区域(从第一个开始到最后一个PPO基因的末尾,两侧的10,000 bp侧翼序列)并使用miniMAP2 v2.24-R1122提取并对齐。然后,提取了PPO-2转录开始的20,000 bp和上游,并使用Flexidot V1.06(参考文献114)可视化序列之间的相似性。

  根据制造商的指示,使用Sigma Spectrum Kit(STRN250)从100 mg闪烁的解剖组织(Testa和子叶)中提取RNA,除了在DNA消化后在室温下孵育。尽管完全按照制造商的规格进行了从子叶中提取RNA,但在由CTAB,PVP,2 M TRIS PH 8,0.5 M EDTA PH 8,4 M NaCl,4 M NaCl,Phermidine和β-固醇和β-Mercaptoethanol的提取缓冲液中破坏了Testa组织,并在8 m lithioum chloride中(而不是kit)。使用Qubit RNA IQ分析对总RNA进行定量,并在使用标准方法制备定向mRNA测序文库之前进行标准化。每个库中的4.1至560万个Illumina PE150简短读数(3×重复,2×组织和2×基因型)。Hedin/2和Tiffany基因表达使用Kallisto V0.44.0通过伪对准RNA测序读取到相应的参考转录本。使用TXimport将转录水平的丰度转化为基因级丰度。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。