2025-06-24 08:09来源:本站
Baishiya Karst Cave(BKC; 35.45°N,102.57°E,海拔3,280米)位于藏族东北部高原4(扩展数据图1和补充信息2)中。它是一个karstic洞穴,位于山洞前的江谷河河床上方约20 m处。Xiahe下颌骨(Xiahe 1)于1980年在这个洞穴中发现,并通过在下颌骨上的碳酸盐壳约会至少可追溯到至少160 ka。Xiahe 1个个体已被古蛋白质组分析确定为Denisovan3。在2018年和2019年的这个洞穴中挖掘了两个连接的单元(分别为1 m×2 m),揭示了11层。由光学刺激的发光(OSL)和放射性碳年期方法构建的层2–10的时间顺序框架表明,史前人类蛋白从约190 ka到30 ka占据了洞穴(参考文献4)。从4和7层的沉积物中提取的Denisovan mtDNA表明,该地点是由Denisovans占据约100 ka,约60 ka,可能迟到的45 ka(参考文献4),这提供了BKC丹尼索支持的进一步明确的证据。此外,从第2层和第3层还回收了Denisovan mtDNA,并且其年龄仍在详细的计算和评估中。
先前的研究4使用OSL和放射性碳日期来建立T2 2-10层的时间顺序框架。在这项研究中,我们将此框架应用于T2和T3,但使用最大年龄范围来表示每一层的年龄(补充表2.2)。有关详细信息,请参见补充信息第2节。
在2018年和2019年发掘期间,总共从T2和T3系统地收集了3,642个骨标本,其中3,582个以三维坐标记录,所有这些都存储在兰州大学西部环境系统(西部环境系统)的主要实验室中。其中,我们选择了超过20 mm(n = 2,407)的几乎所有骨骼,以及一些适用于形态分类学分析的形态特征(n = 160)的较小的骨碎片(较短小于20 mm),总计为2,567个标本(补充表2.1)。在这些标本中,从1到11层发现了2,407个标本,从两个历史时代的凹坑(H1和H3)得出的138个标本,22个标本缺乏特定的层信息。由于1-10层被两个历史凹坑(H1和H3)严重破坏,因此仅保留了这些层的部分,因此从1-9层收集的少量骨骼(n = 764)。因此,大约64%的分析骨组件源自第10和11层(n = 1,643)。在此组合中,我们选择了1,857个标本进行缩放分析,其中包括53个标本,基于形态学分析,用于蛋白质组学确认其分类学分配(补充表2.1)。
当前的变焦参考数据库由西欧亚大陆的动物群主导,并补充了特定于家庭的参考数据集。此外,基于可用的基因组资源,存在来自Col1序列的各种预测的肽质量标记序列。然而,这些资源中的任何一个可能存在于BKC可能存在的大量哺乳动物分类单元。因此,我们收集了39个标本,这些标本具有已知的分类信息,代表39种和29种属,这些标本目前已居住在较宽的喜马拉雅地区,或已知已在该地区存在于更新世或全新世(补充数据3)中。在这些参考标本中,十个是更新世或全新世的年龄,而其他标本则是现代标本。The 39 reference specimens also included 6 specimens from species for which genomic sequences are available but for which no reference matrix-assisted laser desorption ionization time-of-flight mass spectrometry (MALDI-TOF MS) collagen type I peptide mass fingerprints have been reported before, such as the giant panda (Ailuropoda melanoleuca) and the Tibetan antelope (PantholopsHodgsonii)。参考标本是从兰州大学,动物学研究所,中国科学院(CAS)和西北高原生物学研究所(补充数据3)收集的。
在为每个参考试样获得肽质量指纹(请参阅下面的提取方法)之后,选择了14种代表14属的物种进行LC -MS/MS分析以验证(新颖的)肽标记质量。
使用现代和古老的比较脊椎动物标本从中国西部环境系统(教育部)的现代和古代比较脊椎动物标本(兰州大学教育部)和比较骨学地图集31,32,32,334,35,35,36,37鉴定出诊断骨骼元素。根据先前建立的标准38:I类(Marmota himalayana,Lepus oiostolus,Hystrix sp。,Hystrix sp。,Mustelidae,Mustelidae,Fulpes ferrilata),已确定的分类单元分为六个身体大小的类(0级V)。II类(Procapra sp。,Moschus sp。,Panthera sp。,canis lupus);III类(伪Nayaur,Ovis Ammon,Cervus Elaphus,Crocuta crococuta);IV类(Equus sp。,Bos Mutus);和V类(Coelodonta sp。)。对于食肉动物,大动物对应于II级或III类,小动物对应于I级。对于草食动物,大型,大型,中和小动物,分别对应于V,IV,III或II和I类。此外,鸟类被归类为0类。
使用倾斜的光源在便携式低磁化手镜(20×)下观察到每个样品,并在必要时使用钥匙vhx-7000n数字显微镜观察并使用钥匙vhx-7000n数字显微镜拍照。骨表面的修饰,包括人为修饰(切割和切碎的标记,打击乐标记和缺口以及冲击骨薄片),动物gnawing痕迹(坑,穿刺,分数,分数,皱纹等),践踏和现代的机械修饰是由发掘工具产生的。根据经典标准,将骨表面的风化阶段分为四个水平(I – IV)。我们还根据暴露于Fire44的宏观颜色变化记录了燃烧的骨标本。记录了超过20 mm的骨碎片类型,并根据先前所述的标准45记录并分类。本文的五个解剖区域是头部(包括角和鹿角);轴向柱(包括椎骨,肋骨和骨盆);前肢和后肢(包括肩cap骨,Humeri,Radii和Ulnae,metacarpi,股骨,胫骨和meta骨);腕带和焦油;脚,基于上一报告中定义的结构46。
根据先前描述的标准47鉴定骨骼清洗剂。根据先前描述的定量标准,识别出权宜之计的骨工具。48,49。具体而言,骨碎片标本具有四到六个以上的片状疤痕,该标本是由刀具和/或修饰而产生的,以高频率的连续性和/或散布排列,可以解释为已通过有目的的打击乐形成,并被识别为方便的骨骼工具。
在我们的研究中,分类丰度的度量是基于已识别标本(NISP)的数量,而不是个体数量(MNI)。一方面,可以将NISP定量地与缩放数据进行定量比较,这本质上是NISP计数。另一方面,每一层中大多数分类单元的MNI是1或2(补充数据5A),这对于分类丰度的估计没有导电。我们的研究中的NISP计算为鉴定到物种(例如Aquila chrysaetos)和属(例如,Coelodonta sp。)的标本数量,有时是(例如Sub)家族(例如Caprinae)50。
我们对每个样品进行了大约10–30毫克的采样。将两种方案应用于BKC骨样品以及参考样品:非破坏性碳酸氢铵缓冲液(AMBIC)提取方法51和酸 - 不溶性(酸)提取方法19。以前提供了两种协议的详细信息12,19。将酸方案应用于所有参考样品和所有BKC样品。此外,将AMBIC方案应用于所有参考样本和192 BKC样本。简而言之,在提取之前,将所有骨样品储存在100 µL的Ambic溶液中过夜,以去除任何可溶性污染。去除该溶液后,对于AMBIC方案,将100 µL碳酸氢铵(50 mm)添加到骨样品中,然后在65°C下孵育一小时。然后,将含有可溶性蛋白的上清液的50 µL转移到新的96孔板或Eppendorf管中,并在37°C下用胰蛋白酶(Promega,v115a)消化过夜。用1 µL的5%三氟乙酸(TFA)终止消化。在C18 Ziptips(Thermo Fisher Scientific)或C18板(Thermo Fisher Scientific)上进行了清理和纯化,分别在50 µL或100 µL中洗脱,并用0.1%TFA洗涤溶液和0.1%的TFA洗涤溶液和0.1%TFA,在50%乙腈作为条件和溶液中。对于酸方案,将骨样品在0.6 M盐酸(HCL)溶液中脱矿一到两天。将HCL丢弃,并用50 mM Ambic洗涤颗粒,直到pH左右为8次。随后的步骤与Ambic方案相同。所有参考样品均在单个Eppendorf管中处理,并使用96孔板处理BKC骨样品。
生成了四种蛋白质组学消化物,并用于Xiahe 2肋样品的LC – MS/MS分析,这些样本来自该标本的总共两个骨样品。首先将这两个样品存储在50 mM Ambic中,以去除骨表面上可能存在的任何可溶性蛋白质污染。随后,第一个样品的第一种蛋白质提取涉及Ambic缩放提取,其中将样品在50 mm Ambic中在65°C下孵育一小时。随后在37°C(胰蛋白酶,Promega,v115a)中在溶液中进行消化的溶解蛋白的消化。随后将其余的小球和第二个骨样品在0.6 M HCl中脱矿,持续一两天,直到观察到去矿化为止。离心提取物,并去除含酸性蛋白的酸性溶液,将其干燥在SpeedVac中,并重悬于50 mm的Ambic中。随后,使用胰蛋白酶在37°C下过夜进行蛋白质消化。最后,第四个提取物涉及在50 mm ambic中的第一个样品中其余的,脱矿化的蛋白质颗粒的重悬。同样,使用胰蛋白酶在37°C下进行蛋白质消化。在每种情况下,肽都被酸化以使用1%TFA终止消化过程,并短暂离心以颗粒以颗粒任何剩余的矿物或蛋白质残基,并使用上述缩放的C18 Ziptips纯化。在四个肽洗脱液中的10 µL上进行LC – MS/MS分析。
对于MALDI-TOF MS分析,将1 µL洗脱的肽与1 µL基质溶液(条件溶液中的1%α-Cyano-4-羟基苯甲酸)混合,并将其发现在384-Well MALDI目标板上。每样本三次三份发现。使用自动速度速度LRF MALDI-TOF(BRUKER),在Fraunhofer Izi(Bruker)上获得了所有MS光谱数据。使用Maldiquant v.1.22.1和Maldiquant Foreign V.0.14软件包52,53,54在R中进行频谱复制合并。在MMASS55中观察到肽标记质量,并与更新的变焦数据库相比(补充数据4)。
使用哥本哈根大学使用LC -MS/MS分析来处理14种(补充数据3)的十微粒(补充数据3)。
对于液相色谱,使用Thermo Fisher Scientific的易于纳米C,在补充表3.1中指定的梯度以每分钟250 nl的使用。加载以每分钟500 nl的速度进行。移动相为A:5%乙腈,0.1%甲酸;B:95%乙腈,0.1%甲酸。发射极由一个内径75 µm的多颗粒柔性熔融二氧化硅毛细管组成,长度为20厘米,并用直径为1.9 µm的C18有界二氧化硅颗粒(reprosil-pur,c18-aq,Maisch博士)。将色谱柱安装在电喷雾源上,柱烤箱设置为40°C。
对于质谱法,源电压为+2,000 V,离子转移管设置为275°C。Thermo Fisher Scientific的Exploris 480在数据依赖性模式下运行,该模式由第一个MS1扫描组成,分辨率为120,000个M/z值350至1,400。如果高于2×104的强度在2到6之间,则选择前十个单异位素前体,然后在一次出现后与同位素(±20 ppm)进行动态排除20 s。以60,000的Orbitrap解析能力获取了所选肽,其归一化碰撞能(HCD)设置为30%,四极杆隔离宽度为1.2 m/z,第一个m/z的第一个m/z为100。
使用Peaks v.7.0(参考文献56)从LC -MS/MS原始数据中获取肽序列,并具有与可用的胶原序列形成参考数据库的密切相关物种。将脱氨酸(NQ),羟基化(P)和氧化(M)设置为可变修饰,不包括固定的修饰。母体质量误差耐受性设置为10 ppm,片段离子耐受性为0.07 DA,而胰蛋白酶作为蛋白酶。根据先前对骨骼古蛋白质组的峰值分析提出的保守建议,将肽的错误发现率(FDR)过滤为0.5%,并使用包装使用包装v.2.0.0.2.0.0(58),v.2.2.2.2.2.2.2.2.0(ref。59),cor.59和2.68在R52中进行序列重建。MSA61。在峰中手动验证了肽标记中的参考和重建序列之间的多态性。
使用Peaks v.7.0(参考文献56)从LC-MS/MS数据中鉴定出肽序列,该数据库由一个由人类参考蛋白组组成的数据库(UP000005640(UP000005640),每个基因一个蛋白质序列,下载了22-02-2022),并从Neanderthals62和Denisovan63中添加了添加的古老变异。父质量误差耐受性设置为10.0 ppm,片段质量误差耐受性为0.07 Da。将脱氨酸(NQ),羟基化(P),氧化(M)和Pyro-Glu(E和Q)设置为可变修饰。将肽过滤为0.5%FDR,并导出以进行进一步加工。
For proteomic data from the Xiahe 2 individual, protein sequences were reconstructed for all proteins with five or more peptides (Supplementary Table 4.1 and Supplementary Data 6) in R52 using the packages Janitor v.2.2.0 (ref. 59), Biostrings v.2.68.1 (ref. 60) and Tidyverse v.2.0.0 (ref. 58).从峰值导出的蛋白质。CSV文件用于获取数据集中存在的蛋白质及其丰度的概述,而蛋白质肽。CSV文件用于序列重建。对于每个氨基酸位置,在肽计数的基础上都达成了大多数共识。此后,使用Geneious Prime V.2023.2.1与参考蛋白质组列表进行对齐,并在峰中手动验证所有多态性。所使用的参考蛋白质组是人类参考蛋白质组UP000005640(从Uniprot 17-01-2022下载),三个尼安德特人基因组的翻译和Denisovan Genome63的翻译。
使用上面概述的参考蛋白质组以及来自大猩猩大猩猩,Pongo Abelii和Pan Troglodytes的相应蛋白质构建系统发育。将序列在基因素数中对齐,以识别和校正参考之间的同工型变化。简而言之,尼安德特人和troglodytes的Col4a5位置为1264–1270(基于P29400)。所有个体的COL11A1的位置261–313(基于P12107)均被删除;由于参考序列的缺失部分,G. gorilla的Col18a1的位置219(基于P39060)的位置219(基于P39060)后增加了235个未知数;Go.gorilla的COL27A1的位置3-21(基于Q8izc6),由于主要序列差异而取代了未知数。蛋白质序列由个体连接,偶联蛋白长度为31,781个氨基酸位置。
使用Dayhoff替代模型进行系统发育分析,并通过蛋白质分配。Abelii序列被用作外组。使用Mrbayes v.3.2.7(参考文献64)生成贝叶斯树,并在先前的Report3之后进行设置,除了分析仅运行100,000代,因为截止频率的标准偏差已经到此为零。RAXML v.4.0(参考文献65)分析是通过Geneious Prime进行的,带有1,000个引导程序(通过搜索最佳得分ML树的快速引导)。使用APE V.5.7.1(参考文献66)将系统发育绘制在R中。
为了更好地比较通过形态学观察和变焦获得的数据集,我们将所有结果团结在缩放分类学组水平下,因为这些结果通常不如通过形态学分析获得的物种名称具有特异性。例如,我们分配了分类单元BOS cf。从形态分类群中的mutus和bos grunniens进入了BOS sp。,因为这些物种不能使用变焦分离。但是,为了更好地显示形态学数据,我们通过使用Bos Grunniens或Bos CF等物种名称来保留某些标本的物种信息。Mutus,必要时在某些地方。文本中使用的分类单元名称是根据特定数据集(形态,缩放和合并)的,并且在必要时指示源数据集信息。组合数据集是形态学和变焦分类学识别的混合体,用于分析BKC上动物群体的组成,并计算多样性指数。在该数据集中,我们将鸟类,啮齿动物和分类学分配等组排除到互阶或子顺序水平。
根据先前描述的Method67计算了Shannon -Weaver和Simpson指数,包括置信区间(97.5–2.5%),以评估每个地层学单元的社区生态学。这些是在R52中使用素食v.2.6-4软件包68计算的。Shannon -Weaver和Simpson指数的值与多样性成正比成正比,这表明较高的指数值表明多样性更高。
在骨标本中,谷氨酰胺(GLN; Q)脱氨酸对谷氨酸(GLU; e)是考古背景下常见的翻译后修饰之一。根据先前的研究69,70,已经提出了一种有效的方法来计算选定的I型肽肽的谷氨酰胺脱胺。在这里,我们计算两种肽COL1α1508-519(GVQGPPGPAGPR; P1105)和COL1α1435–453(DGEAGAQGPPGPGPAGPAGPAGER; p1706)的两种肽脱氨酸的脱氨酸。它们通常也存在于BKC MALDI-TOF MS光谱中,并且它们的肽序列对于大多数陆生哺乳动物19都是相同的。脱氨基在0到1的尺度上表示,其中1表示没有脱氨基,0表示完全脱氨基。
有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。