肠道微生物组在孤立的乡村社交网络中

2025-06-22 23:25来源:本站

  我们与当地居民密切合作,寻求洪都拉斯卫生部(MOH)官员的批准和反馈,并努力为当地社区提供实际利益。当我们开始在2013年设计基础队列项目(在176个村庄中,包括此处使用的18个村庄)时,Bill and Melinda Gates Foundation将我们介绍给了美洲国际开发银行(IDB),该银行(IDB)一直在拉丁美洲提供支持和工作,而IDB则又向我们介绍了MOH。由于该项目启动的途径,我们与当地和地区公共卫生机构以及当地领导者而不是学术合作伙伴合作。

  我们选择在洪都拉斯西部高地工作的地区非常孤立。多年来,随着我们在Copan建立数据收集团队,我们与当地社区,当地乡村领导人以及那里的少数当地卫生诊所以及当地的运输和基础设施提供者建立了深厚的联系。由于这些关系以及我们对当地社区的承诺,我们在完成各种项目时会定期直接向这些选区介绍结果。

  我们为当地社区提供了其他物质利益,而不仅仅是向他们提供信息。当我们测试人们的粪便寄生虫时,我们给了他们他们的测试结果,并安排了他们的治疗。当我们测试人们的视力时,我们提供了矫正眼镜。我们从当地社区征求了有关我们可以进行哪些基础设施改进的想法,因此我们修复了许多当地的游乐场和诊所。我们安排一家美国公司为当地的卫生诊所提供免费的便携式手持超声设备,这受到当地提供商的赞赏。在能力建设方面,我们雇用并培训了100多名当地人,我们的许多以前的数据收集者都为其他公共卫生和发展实体工作了。最后,我们在美国提供了一个有才华的年轻人的职位,是美国的博士生。

  在我们在洪都拉斯的整个工作中,以及我们在地方和国家一级的广泛参与,我们一直在努力在所有关系中以正直,好奇和尊重行事。

  这项研究在美国不会被禁止。这项工作不太可能导致参与者的污名化,罪名或歧视或个人风险,我们已经将所有数据免于威胁到参与者的隐私或安全性。

  所有参与者均提供了知情同意,我们的工作得到了耶鲁大学人类受试者委员会的批准(参考号2000020688)。

  乡村级网络的绘制为整个村庄的标准“名称生成器”。在为每个村庄进行了摄影人口普查(所有青少年和成年居民的摄影人口普查之后),我们在每个村庄进行了主要的网络调查,包括一个详细的,一个小时的调查7,结合了人口统计和健康措施,以及受访者的一系列受访者,与之相关的社会关系(朋友,家人,与我们的置于名称和照片)相关的社交关系(朋友,家人,与我们相关的人)(在我们的名称和照片中),这是我们的trellis(我们在nevers上)trellis.yale.edu)45。所有名称生成器问题均在补充表1中列出。

  对于一对报告的相同变量的不同级别的问题,例如问候类型或空闲时间量,我们对变量对称如下:对于问候类型,我们报告了涉及最物理接触的问候类型。对于一对两对之间的空闲时间和共享餐的频率,我们通过选择表明更频繁接触的响应来对称。我们在这里的关系层面上对所有其他回答进行了对称(也就是说,当两个人中的任何一个互相提名为“密友”时,我们将其计算在内)。当计算程度分布,中心和聚类时,我们简化了我们的网络以删除多重性(即,我们将所有关系串联在成对的人之间)并对称性(也就是说,即,我们忽略了谁在每对中提名的人)。

  分析了社交网络图,并用IGRAPH(v.1.3.5)46计算地球距离,并使用Fruchterman -Reingold算法绘制。为了保护我们研究村的匿名性,这些村庄被更名为来自另一个国家的随机城镇名称。

  参与者被指示如何使用在村庄亲自交付的训练模块自我收集粪便样本,并被要求迅速将样品返回当地团队。收集后立即将样品在收集物中立即冷藏,然后在收集后的12小时内将样品存储在液氮中,并移至洪都拉斯Copan Ruinas的-80°C冰箱。所有村庄都遵循相同的程序。将样品以随机分配的形式运送到美国的干冰上,并以-80°C的冰柜储存。

  使用Qiagen的Tissuelyzer匀浆粪便材料,并制备裂解物以使用化学粪便GDNA提取试剂盒(Perkin Elmer)提取,并按照制造商的规程在Chemagic 360仪器(Perkin Elmer)上提取。使用KAPA Hyper Library制备试剂盒(KAPA Biosystems)制备测序文库。在Illumina Novaseq 6000上进行了shot弹枪宏基因组测序。未达到所需测序深度的50 GBP的样品在单独的运行中重新计算出50 GBP。使用默认参数的Prinseq Lite47(v.0.20.2)对原始的元基因组读数进行了重复。用bmtagger筛选了所得的读数(HG19),然后用Trimmomatic48过滤质量(v.0.36,参数'Illuminaclip:nextera_truseq_adapters.fasta:2:30:30:10:8:8:true slidingwindow:4:15:4:15领先:3轨:3分钟:3分钟:3分钟:50’:50’:50’:50’:50’:50’。这导致了总共1,787个样本(平均大小为8.6×107读取)。

  使用jan21数据库和默认参数使用速兰426进行物种级分析。使用菌株phlan 426的参数为“ -marker_in_n_samples 1 -sample_with_with_with_n_markers 10-phylophlan_mode cocigrate”,对至少50个样品中存在的物种进行了应变级分析。这导致了总共841个物种水平的基因组垃圾箱(SGB)和339,137个分类菌株。菌株“ atran_transmission.py”脚本用于使用生产的树来评估传输事件,该树总共产生了513,177个确定的事件。对于强大的计算,仅计算出至少十个SGB的对的应变率。

  使用素食r套件(v.2.6-2)49的VEGDIST函数计算Beta多样性指数。

  通过使用纯素食包装中的Adonis函数进行验证差异分析(Permanova),通过纯素食函数从纯素食包装套件中进行了999个排列来测试通过乡村成员资格的距离分离。

  所有统计分析均在R(v.4.1.3)中进行。在适当的情况下,对多次测试(Benjamini -Hochberg程序,标记PADJ)进行了校正,并在PADJ <0.05时定义了显着性。除另有规定外,所有测试均为双面。所有以自我为中心的回归(即,当我们评估网络位置和应变共享的关系时)涉及线性混合效应模型与此通用公式规范:

  也就是说,我们控制了年龄,性别,财富,布里斯托尔凳子量表和体重指数(BMI),以及样本特性(例如,DNA浓度)和乡村固定效果。我们还包括家庭水源,上个月的个人药物使用以及饮食多样性(每天消耗的食物类别数量)。药物类型包括:止痛药,抗生素,抗Diarrhoeal,抗寄生虫,抗真菌,抗糖尿病,抗糖尿病,抗酸剂,泻药和维生素。使用Lmertest软件包(v.3.1.3)50创建了混合效应模型。

  混合效应的逻辑回归模型用于样本外网络预测。通过向下采样不相关的对以等于相关对的数量来构建类平衡的数据集,我们使用k = 3的k折交叉验证训练了模型,并组合了三个单独的测试集中的预测。ROC曲线是由五组三重交叉验证的平均值构建的。使用PROC软件包(V.1.18.0)51计算ROC曲线和置信区间,并使用二项式家庭链路功能和每个村庄随机坡度构建Lmertest Package(v.3.1.3)逻辑回归模型。

  包括所有协变量在内的预测模型由以下公式指定:

  其中“微生物组相似性”是应变共享率,Jaccard指数或Bray-Curtis差异,在一对成员之间计算出来。

  根据CAR R软件包(v.3.0),根据置换特征的重要性度量计算可变的重要性指标。当单个特征值随机lasterly 52时,置换特征的重要性被定义为模型得分的降低。此过程打破了功能与目标之间的关系;因此,模型得分的下降表明该模型取决于该功能。在每种功能的1,000个随机排列后,分析了可变的重要性指标。计算可变通胀因子值,以确保对变量共线性的结果可靠性,并且均低(小于2)。

  微生物组无效排列在任何两个人之间创造了应变分共率的零分布,同时考虑(仅)网络结构。根据宿主的微生物组组成和社交网络是独立的零假设,我们可以通过随机将村庄每个人的微生物组随机定位并重新计算感兴趣的指标,例如,按程度或聚类rand rand rand indices切断他们的关系。这样可以确保网络的固有结构模式保持不变,但是节点值是随机的。如果人类微生物组独立于任何主机社交互动而培养,这使我们可以观察统计数据的分布。

  使用地球距离和聚类结果来计算乡村范围的微生物组排列来计算应变率的空分布。对于补充图1中关系特定的排列,在关系层面上进行了排列,而不是完整的村庄排列。将观察到的特定关系共享的分布与观察到的共享分布进行了比较,例如,将某人与他们的朋友与某人与同一村庄中的人和100个随机人的朋友之间的共享进行比较。对于丈夫/妻子和孩子的母亲/父亲的固有性别关系,我们占了自我的性别,但是对于所有其他不一定是性别的关系(例如,空闲时间),我们没有。

  2年后,随访了来自四个村庄的301人的子集,并要求提供第二个粪便样本。使用用于分析先前处理的1,787个样品的相同管道一致处理样品。

  我们通过使用初始波浪中的相同社交网络来定义关系关系,并评估以下线性混合效应模型公式:

  其中ssrt1和ssrt2分别是成对在时间点T1和T2成对的人的应变率。我们显示标准化系数。

  为了分解所有物种共享的效果,我们使用了指定的混合效应逻辑模型公式:

  在其中的所有物种合并的所有物种,在时间点T1或T2上是否观察到单个物种在时间点T1或T2上观察到单个物种的应变共享。添加了每个物种以及乡村成员和人的随机截距。

  在这两个模型中,“关系”都是一个虚拟变量,表明两人之间的关系存在(或不存在),M是根据以下协变量计算的Mahalanobis距离:

  成对的Mahalanobis距离是在Biotools R Package53(v.4.2)的D2.D2.D2.D2.D2.D2.D2.矩阵上计算的。我们还使用组成变量而不是Mahalonobis距离(补充数据2)指定了此模型。

  我们使用在IGRAPH软件包中实现的Louvain和Leiden方法,以沿社会和微生物组线聚集参与者。Louvain聚类基于贪婪的模块化优化。模块化是与社区外部边缘相比,在-0.5(非模块化聚类)和1(完全模块化聚类)之间的比例值(非模块化聚类)。理论上优化此值会导致给定网络节点的最佳分组。如果一对共享SGB太少而无法计算稳健的应变率(少于10),则估算了0%的应变共享率,以允许适当的基于体重的聚类。这发生在0.45%的成对比较(3,560,769个比较中的16228个)中,而同一村庄的人们中只有16,228个比较中只有838个。调整后的RAND索引是使用McLust软件包(v.6.0.0)54计算的。

  为了通过Kruskal – Wallis测试测试各个网络社区的物种差异丰度,稳健性检查确保了每个社交集群都有五个以上的人,并且该物种在村庄中进行了五个以上的人,并且没有满足该标准的情况。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。