COVID-19的移动网络模型解释不平等并通知重新开放

2025-06-24 11:54来源:本站

  该方法的结构如下。我们描述了我们在“移动网络”部分中这些数据集派生的“数据集”部分和移动性网络中使用的数据集。在“模型动力学”部分中,我们讨论了在移动网络上覆盖的SEIR模型。在“模型校准”部分中,我们描述了如何校准该模型并量化其预测中的不确定性。最后,在“分析详细信息”部分中,我们提供了有关用于降低移动性,重新开放计划和人口差异的实验程序的详细信息。

  我们使用Safegraph提供的数据,Safegraph是一家从众多移动应用程序中汇总匿名位置数据的公司。Safegraph数据捕获了CBG之间人员的运动,CBG是通常包含600至3,000人口的地理单位,以及餐馆,杂货店或宗教机构等毒品。具体来说,我们使用以下Safegraph数据集。

  首先,我们使用了Plotes模式39和每周模式(V1)40个数据集。这些数据集包含每个POI,每小时访问者的数量计数,估计中位数访问时间为几分钟(“停留时间”),以及每周和每月估算访问者的CBG的估计。我们使用访问者Home CBG来自“位置”模式数据集的数据集:出于隐私原因,如果在本月的过程中,该数据集记录了POI,Safegraph不包括该数据集中的家庭CBG。对于每个POI,Safegraph还提供其北美行业分类系统类别,并估计其物理面积为平方英尺。该区域是使用分配给POI41,42的足迹多边形安全图来计算的。我们分析了从2019年1月1日到2020年2月29日的“位置模式数据”,并从2020年3月1日至2020年5月2日的每周模式数据。

  其次,我们使用了社会遥远的指标数据集43,其中包含每个CBG中居住在家的人的每日估计。我们分析了2020年3月1日至2020年5月2日的社会距离指标数据。

  我们专注于美国最大的都会区中的10个(扩展数据表1)。我们通过获取Safegraph模式数据的随机子集并选择数据中最多的10个都会区域来选择这些都市区域。本文中描述的方法应用于原始安全数据中其他都会区域的应用应该很简单。对于每个都会区,我们包括满足以下所有要求的所有POI:(1)POI位于都会区;(2)Safegraph从2020年3月1日的00:00到2020年5月2日的00:00,每小时都会访问此POI的数据;(3)Safegraph从2019年1月到2020年2月,至少一个月记录了该POI的访问者的Home CBG;(4)POI不是“父母” POI。父母POI在数据集中占一小部分POIS,它们重叠并包括其“孩子” Pois的访问:例如,数据集中的许多购物中心都是父pois,其中包括商店的访问是他们的儿童pois。为了避免双重访问,我们从数据集中删除所有父po。应用了这些POI过滤器后,我们包括所有至少对剩下的pois中至少进行一次访问的CBG;这意味着,如果CBG经常访问该地铁区,则可能包括来自都会区外部的CBG。在扩展数据表1中显示了后处理数据的摘要统计数据。总体而言,我们分析了10个都市区域的56,945个CBG,从这些CBGS到552,758 POIS访问了超过31.1亿次。

  Safegraph数据已用于研究消费者偏好44和政治两极分化45。最近,它已被用作美国的主要流动数据来源之一,用于跟踪COVID-19大流行26,28,46,46,47,48的影响。在补充方法第1节中,我们表明,在实施全家措施之前和之后,Safegraph Mobility数据的总趋势与Google移动性数据的总趋势相匹配。先前对Safegraph数据的分析表明,它是地理位置代表性的,例如,它不会系统地过度代表来自不同县的CBG或不同种族组成,收入水平或教育水平50,51。

  我们关于CBGS人口统计数据的数据来自美国人口普查局的美国社区调查(ACS)52。我们使用5年的ACS数据(2013- 2017年)来提取家庭收入中位数,白人居民的比例以及每个CBG的黑人居民的比例。对于每个CBG的总人口,我们使用最重视的一年估算值(2018年);一年的估计值更嘈杂,但我们希望通过使他们的最新可能使我们的总人口总数(由于人口增长)最小化。

  我们使用The New York Times32发布的COVID-19数据集校准了我们的模型。他们的数据集包括在美国和县一级在美国的案件和死亡的累积计数。对于我们建模的每个都会区,我们将估计县级计数,以生成整个都会区的总体计数。如“模型校准”部分所述,我们将累积病例和死亡计数转换为每日计数。

  《纽约时报》的数据集由共同证实的案件和死亡计数组成,由公共新闻会议和公共数据发布的记者收集。对于移动性数据,通过收集数据的第三方来源获得了同意。Safegraph从移动应用程序中汇总了数据,这些数据从其用户获得选择加入同意以收集匿名位置数据。Google的移动性数据由选择打开位置历史记录设置的用户的汇总,匿名的数据集。此外,我们从西北大学IRB办公室获得了IRB豁免IRB豁免。

  我们考虑具有随时间变化的边缘的完整的无向二分图。这些顶点分为两个不相交的集合,代表M CBG,代表N POI。从美国人口普查数据中,每个CBG CI都标有其人口,收入分配以及种族和年龄人口统计的标签。从Safegraph数据中,每个POI PJ都以其类别(例如,餐厅,杂货店或宗教组织),其身体大小为平方英尺的类别以及访问者到PJ的中间时间。在时间t时,边缘上的重量(CI,PJ)代表了我们对CBG CI访问POI PJ的个体数量的估计。我们记录每个都会区的边缘数量(具有非零重量),从2020年3月1日至2020年5月2日的所有小时,在扩展数据表1中。在所有10个都会区中,我们研究54亿个边缘在56,945 CBG和552,758 POI之间。

  构建该网络的核心技术挑战是估计来自Safegraph数据的网络权重,因为此访问矩阵无法直接从数据中获得。我们进行网络估计的一般方法如下。

  首先,从Safegraph数据中,我们得出了对访问矩阵的时间无关的估计,该估计从2019年1月到2020年2月,捕获了从CBG到POI的访问的总分布。

  Second, because visit patterns differ substantially from hour to hour (for example, day versus night) and day to day (for example, before versus after lockdown), we used current SafeGraph data to capture these hourly variations and to estimate the CBG marginals U(t), that is, the number of people in each CBG who are out visiting POIs at hour t, as well as the POI marginals V(t), that is, the total number of visitors present在小时t时的每个poi pj。

  最后,我们应用了迭代比例拟合程序(IPFP)来估计每小时访问矩阵W(t)与每小时的边缘u(t)和v(t)和v(t)是一致的,但其他与“尽可能相似”与汇总访问分布的“尽可能相似”,就kullback -backback -leibleibleiblebleibler the Matrix而言。

  IPFP是一种经典的统计方法31,用于调整关节分布以匹配预先指定的边缘分布,并且在文献中也称为双膜片拟合,RAS算法或Raking53。在社会科学中,它已被广泛用于从总数据中推断局部亚群(例如,在每个CBG中)的特征54,55,56。IPFP通过在缩放每一行以匹配每行(CBG)边缘U(t)和缩放每列以匹配每小时(POI)边缘V(t)之间,估计从CBG到POI的访问的联合分布。补充方法第3节中提供了有关估计程序的更多详细信息。

  为了模拟SARS-COV-2的传播,我们覆盖了“移动性网络”部分定义的移动性网络上的综合疾病传播模型。传输模型结构遵循先前的工作15,20在SARS-COV-2的流行病学模型上,但在传输速率的计算中结合了细粒度的移动性网络。我们为每个大都市统计领域构建单独的移动网络和模型。

  我们使用具有易感性,暴露(E),感染性(i)和拆除(R)隔室的SEIR模型。易感人士从未感染过,但可以通过与传染性人接触来获得病毒,这可能发生在POIS或其家中CBG。然后,他们进入裸露的状态,在此期间被感染但尚未感染。个人从暴露于感染性的人以与平均潜伏期成反比的速度过渡。最后,他们以与平均传染时期成反比的速度过渡到已移除的状态。被删除的状态代表无法再感染或感染他人的个人,例如,他们已经恢复,自我隔离或死亡。

  每个CBG CI都保持着自己的SEIR实例化,并且在每小时t时,CBG CI中有多少个人在每个疾病状态中,并且。在每小时t时,我们对状态之间的过渡进行采样如下:

  时间t的POI PJ的感染率在哪里;,从移动性网络(请参阅“移动网络”),访问矩阵的第三条是从CBG CI到POI PJ的访问者的数量;是独立于访问POI的感染率的基本感染率;ΔE是平均潜伏期;ΔI是平均传染周期。

  然后,我们更新每个状态以反映这些过渡。同样让和。然后,我们进行以下更新:

  我们将时间t中CBG CI中的新暴露量分为两个部分:从访问POI的案例中,这些案例是从访问POI中进行采样的,而其他案件未通过访问POI捕获的其他情况,这些POI被取样。

  首先,我们计算来访POI的新暴露次数。我们假设在时间t时对POI PJ的任何敏感访客都具有被感染和从易感(s)过渡到暴露(e)状态的独立概率。由于在时间t时有从CBG CI到POI PJ的访客,我们假设其中的一小部分是易感的,因此这些访问者之间的新暴露数量被分配为。因此,从CBG CI中所有即将离任的访问者中的新暴露次数分布为上述所有毒药的总和。

  我们将时间t的感染率建模为其传播率和传染性个体比例的产物,在时间t访问PJ的总数。我们将时间t的POI PJ的传输速率建模为

  PJ的物理区域在哪里,并且ψ是我们适合数据的传输常数(在所有POI中共享)。带有区域的传输速率的逆缩放是标准简化假设57。停留时间分数是在任何小时内将普通访问者的平均访问者的一小时(补充方法第3节);它对POI传输率有二次影响,因为它降低了易感访客在PJ上花费的时间和PJ访问者的密度。使用此表达式以传输速率,我们可以计算时间t时POI PJ的感染率为

  对于足够大的ψ值和足够大比例的感染个体,上面的表达有时可以超过1。要解决这一点,我们只需将感染率夹至1。但是,对于我们使用的参数设置和仿真持续时间,这很少发生。

  最后,为了计算时间t的PJ感染性个体的数量,我们假设来自CBG CK访问者中传染性个体的比例反映了该CBG感染的总体感染密度,尽管我们注意到缩放因子ψ可以考虑到访问POIS的感染性人比率差异。这给了

  除了POIS感染的新暴露外,我们还对独立于POI访问活动的新型暴露率进行了CBG特异性基础率。这捕获了其他感染的来源,例如,Safegegraph数据中缺乏的POI中的家庭感染或感染。我们假设每小时,CBG CI中的每个敏感人都有受感染并过渡到暴露状态的基本概率

  是基本传输速率βbase的乘积和CBG CI中传染个体的比例。βbase是我们适合数据的常数(在所有CBG中共享)。

  通过将所有上述所有内容添加在一起,在时间t时CBG CI中新暴露总数的分布的表达式变为

  我们以与平均潜伏期δe成反比的速度形成传染性的个人建模。在每个时间步骤t,我们都假设每个暴露的个体都有恒定的,与时间无关的可能性,可以发挥感染性,并具有

  同样,我们以与平均感染周期成反比的速率,与平均感染周期ΔI成反比的速率,将传染个体建模为过渡到去除状态

  我们根据先前的研究估计ΔE= 96 h(参考文献20,58)和ΔI= 84 h(参考文献20)。

  在我们的实验中,t = 0是2020年3月1日的第一个小时。我们近似感染性I,并在t = 0时删除了R室,最初是空的,所有受感染的人都在暴露的E室中。我们进一步假设每个CBG CI中都会发生相同的预期初始患病率P0。在t = 0时,地铁区域中的每个人都具有相同的独立概率P0被暴露为E而不是易感S。我们因此通过设置来初始化模型状态

  为了测试详细的移动性网络是必要的,还是我们的模型是否仅仅利用总迁移率模式,我们测试了一个替代的SEIR模型,该模型使用每小时对都会区域中任何POI进行的总数访问数量,但不使用特定CBG对特定POI的特定CBG之间的访问分解。像我们的模型一样,总体机动性模型还捕获了访问POI和与POI访问活动无关的基本感染率的新病例。因此,这两个模型具有相同的三个自由参数(ψ,POIS的扩展率;βbase,基本传输速率; P0,受感染个体的初始部分)。但是,总体机动性模型没有特定于POI的感染率,而是仅捕获了任何CBG易感人会因访问任何POI的访问而被感染的单一概率;我们之所以进行简化,是因为总体机动性模型不再可以访问CBG和POI之间的访问分解。此概率定义为

  其中m是CBG的数量,n是pois的数量,i(t)是时间t的传染性个体的总数,而n是地铁区域的总人口大小。对于CBG中感染的基本感染率,我们假设与网络模型相同的过程:CBG CI中易感人会在时间T中在其CBG中感染的概率等于CI的当前感染分数(方程(11))。将其放在一起时,总迁移率模型定义了时间t中CBG CI中的新暴露次数

  所有其他动力学在聚合迁移率模型和我们的网络模型之间保持不变,我们以相同的方式校准模型,我们在“模型校准”部分中描述了模型。我们发现,我们的网络模型在预测样本外病例中的总体移动性模型基本上优于总体移动性模型:平均而言,整个都会区域,样本外R.M.S.E.在我们最佳拟合网络模型中,只有58%的拟合总迁移率模型(扩展数据图1)。这表明,不仅是一般的移动性模式,而且特别是移动性网络,使我们的模型可以准确地拟合了观察到的情况。

  接下来,为了确定移动性数据可以有助于对案例轨迹进行建模的程度,我们将模型与不使用移动性数据的基线SEIR模型进行了比较,并只是假设地铁区域内的所有个人都均匀地混合。在这个无动力基线中,一个人被感染并过渡到裸露状态的风险是

  我(t)是时间t的传染性个体的总数,而n是地铁区的总人口大小。如上所述,其他模型动力学是相同的,对于模型校准,我们对βbase和p0进行了类似的网格搜索。正如预期的那样,我们发现网络和汇总移动性模型在样本外病例预测上的表现优于无运动模型(扩展数据图1)。

  我们的大多数模型参数可以从Safegraph和US人口普查数据中估算,也可以从以前的研究中获取(有关摘要,请参见扩展数据表2)。这留下了三个模型参数,这些参数在文献中没有直接类似物,因此我们需要用数据进行校准:(1)POIS,ψ中的传输常数(等式(9));(2)基本传输速率,βbase(等式(11));(3)在时间t = 0,p0(等式(16))时暴露的个体的初始比例。

  在本节中,我们描述了如何将这些参数拟合到《纽约时报》报道的确认案例中。我们分别为每个都会区安装了模型。

  我们通过检查模型输出是否与锁定前基本繁殖数R0相匹配的传输速率因子ψ和βbase选择参数范围,因为R0是对SARS-COV-259的实质性研究的研究。在我们的模型下,我们可以分解R0 = Rbase + RPOI,其中RPOI描述了POIS和Rbase引起的传输,描述了剩余的传输(如等式(12)中所述)。我们首先建立Rbase和RPOI的合理范围,然后将其转换为βbase和ψ的合理范围。

  我们假设Rbase范围为0.1至2。Rbase模型的传输与Safegraph数据集中的POI无关,包括在Safegraph DataSet中未捕获的POI类别内的内部传输和传输。我们选择了0.1的下限,因为超出该点,基本传输只会对整体R造成最小的贡献,而先前的研究表明,房屋内部传播是总体传输的重大贡献者60,61,62。仅估计单独的家庭传播就足以使总R0高于1的倾斜度;例如,据估计,单个受感染的人平均导致0.32(0.22-0.42)次生内部感染60。但是,由于Rbase还可以捕获在Safegraph数据集中未捕获的POI上的传输,因此要保守,我们选择了Rbase的上限= 2;如下所述,所有10个都会区的最佳合作型号的Rbase <2,而10个中的9个型号的Rbase <1。我们允许RPOI从1到3不等,这对应于允许R0 = RPOI + Rbase至1.1至5。这是一个保守的范围。

  为了确定Rbase和RPOI的值,一对βbase和ψ暗示,我们播种了一小部分索引病例,然后从3月的第一周开始将模型运行,以捕获锁定前的条件。我们通过设置P0,时间t = 0的曝光个体的初始比例,为p0 = 10-4,然后按照公式(16)进行采样,从而初始化了模型。令n0为初始暴露的个体的数量。我们计算了这些N0索引案例继续通过基本传输,Nbase和POI传输感染的个体数量,该案例npoi npoi提供了

  我们将这些数量平均而不是每个都会区的随机实现。补充图6显示,正如预期的那样,Rbase在βbase中是线性的,RPOI在ψ中是线性的。当βbase的范围为0.0012至0.024时,Rbase位于合理范围内,而RPOI位于合理范围(至少一个都会区)时,ψ范围为515至4,886;因此,我们在拟合模型时考虑这些参数范围。

  SARS-COV-2感染在我们的模拟开始时(2020年3月1日)在美国的传播程度尚不清楚63。为了解决这种不确定性,我们允许P0在10-5和10-2之间的较大范围内变化。如下一部分中所述,我们可以使用该范围内的βbase,ψ和P0的参数设置来拟合所有大都市区域的案例计数数据。

  使用上述参数范围,我们对ψ,βbase和p0进行了搜索,以找到最适合纽约Times32报告的确认病例数的模型。对于每个都会区,我们在上面指定的参数范围内测试了ψ,βbase和p0的1,500个不同的组合,其中参数线性间隔为ψ和βbase,并以P0的差异分布。

  在“模型动力学”部分中,我们直接对感染的数量进行建模,而不是确认病例的数量。为了估计确认病例的数量,我们假设RC = 0.1比例为20,58,64,65,6666,将确认感染的速度,此外,它们将在感染性后准确确认ΔC= 168 h(7天)20,66。从这些假设中,我们可以计算出大都会区所有CBG的新确认案件的预测数量,

  其中m表示都会区中CBG的总数,并且为了方便起见,当小时τ时新传染性人的数量为0时为0。

  从《纽约时报》的数据集中,我们每天有据报道的新案件数量,总结在都会区的每个县。我们比较了报告的病例数量和模型通过计算R.M.S.E.的预测案例数量的数量。在模拟的d = t/24天之间,

  对于模型参数和每个都会区的每种组合,我们通过运行30个随机实现并平均其R.M.S.E.量化模型与来自《纽约时报》的数据拟合。请注意,我们根据新报告的病例的每日数量(而不是报告案件的累积数量)来衡量模型拟合。67。

  我们的仿真跨越2020年3月1日至5月2日,我们使用该时期的移动性数据。但是,由于我们假设病例将在个人传染性后7天证实ΔC=,所以我们预测从2020年3月8日至9月9日,有7天偏移的病例数量。

  在整个本文中,我们报告了来自不同参数β,βbase和P0的汇总预测,以及多个随机实现。对于每个都会区,我们:(1)找到最佳合适的参数集,即,平均R.M.S.E.关于随机实现的每日事件案件;(2)选择所有实现R.M.S.E.的参数集(对随机实现的平均)在R.M.S.E.的20%之内最佳拟合参数集;(3)将这些参数集及其所有随机实现的所有预测汇总在一起,并报告其平均值和2.5-97.5个百分位数。

  平均而言,每个都会区都有9.7个参数集,可实现R.M.S.E.在最合适的参数集的20%之内(补充表6)。对于每个参数集,我们都有30个随机实现的结果。

  该过程对应于近似贝叶斯计算框架中的拒绝采样15,我们假设一个误差模型是具有恒定方差的高斯。我们根据最佳拟合模型的成就来选择一个接受阈值;并且我们使用统一的参数网格,而不是从均匀的先验中进行采样。它量化了两个来源的不确定性。首先,多个实现捕获模型之间使用相同参数运行的随机变异性。其次,使用R.M.S.E.的20%以内的所有参数集进行模拟。最佳拟合物可捕获模型参数ψ,βbase和p0中的不确定性。该过程等同于假设真实参数的后验概率在20%阈值之内均匀分布在所有参数集之间。

  我们通过证明他们可以访问相应的移动性数据时可以预测模型的模型来验证我们的模型。对于每个都会区,我们将可用的数据集从《纽约时报》(The New York Times)分为培训集(从2020年3月8日至2020年4月14日)和一个测试集(跨越2020年4月15日至2020年5月9日)。如“移动性网络”部分中所述,我们符合模型参数ψ,βbase和P0,但仅使用训练集。然后,我们在测试集上评估所得模型的预测准确性。在测试集上运行模型时,我们仍然使用测试期间的移动性数据。因此,这是对模型是否可以在未用于模型校准的时间段内准确预测案件的数量的评估。扩展数据图1显示,我们的网络模型非常适合样本外情况数据,并且我们的模型基本上优于使用汇总移动性数据(无网络)或根本不使用移动性数据的替代模型(请参阅“总计移动性和无动力性基线模型”)。请注意,我们仅使用此火车/测试拆分来评估样本外模型的准确性。如上所述,使用最适合整个数据集的参数集生成所有其他结果。

  在本节中,我们包括有关本文中数字基础的实验的其他详细信息。我们不包括对主要文本中完全描述的数字的解释。

  与图2a和补充表4、5相关联。为了模拟如果我们更改降低移动性的幅度或时机会发生的事情,我们从2020年3月1日至5月2日修改了真实的移动性网络,然后在假设数据上使用我们的模型。在图2a中,我们报告了在模拟结束时,每10万人的人口总数(即在暴露的,传染性和去除状态)中。

  为了模拟较小的迁移率降低,我们从模拟的第一周(2020年3月1日至7日)之间插入了移动性网络,我们用来表示典型的活动水平,以及每周的实际观察到的移动性网络。令W(t)表示在模拟的第t小时内观察到的访问矩阵,然后在模拟的第一周,f(t)= t mod 168映射t到相应的小时,因为一周内有168小时。为了代表人们致力于α[0,1]实际观察到的移动性降低的情况,我们构建了一个访问矩阵,该矩阵是W(t)和WF(t)的α-Convex组合

  如果α为1,则我们使用实际观察到的迁移率网络进行仿真。另一方面,如果α= 0,那么我们假设人们根本没有通过在整个模拟过程中循环访问矩阵来降低访问矩阵。任何其他α[0,1]在这两个极端之间插值。

  为了模拟改变移动性降低的时机,我们将移动性网络转移到D [-7,7]天。令t表示我们的仿真中的最后一个小时(2020,23:00),让f(t)= t mod 168映射t到上述模拟的第一周,将其映射到相应的小时,同样,在模拟的最后一周(2020年4月27日至2月2日),将g(t)映射到其相应的小时。我们构建时移访问矩阵

  如果d是正的,则对应于几天后开始降低移动性D;如果我们想象时间在水平线上,这将使时间序列向右移动24D小时。但是,这样做的前24小时没有访问数据,因此我们通过在模拟的第一周重复使用访问数据来填写。同样,如果d为负,则对应于几天前开始降低移动性D,并且我们在仿真最后一周的访问数据中填写了最后24天。

  与图2B,扩展数据图2和补充图10相关联。我们从2020年3月1日至5月2日观察到的迁移率数据上运行模型,并记录每个POI处发生的预测感染的数量。具体而言,对于每个小时t,我们通过吸收在该小时访问PJ的易感人数乘以POI感染率(等式(9))来计算每个POI PJ发生的预期感染数量。在图2B和补充图10中,我们按POIS按预测的感染数量(总小时)进行了分类,并在此POI订购的情况下绘制感染的累积分布。在扩展数据图2中,我们选择了对预测感染最大的POI类别,并绘制了随着时间的推移,每种类别的POI感染的每日比例(在类别内的POI中概括)。

  与无花果相关。2C和扩展数据图3。我们实施了两种部分重新开放策略:一个将POI统一的访问降低到一小部分全部活动,另一个将每个POI的小时访问量限制在该POI的最大占用率的一小部分中。对于每种重新开放策略,我们将于2020年3月1日开始模拟,直到2020年5月30日,使用观察到的移动性网络从2020年3月1日到30日,然后使用假设后的撤销后移动网络,从2020年5月至3020年5月30日,对应于该重新打开策略的预计影响。因为我们仅观察到从2020年3月1日至5月2日观察到的移动性数据,所以我们通过从3月的第一周开始循环移动性数据来估算丢失的移动性数据,就像上述分析有关过去移动性降低的效果的分析。令t表示我们观察到的移动性数据的最后一个小时(2020,23:00)。为了简化符号,我们定义

  如上所示,f(t)= t mod 168。如果在时间t上观察到的迁移率数据,则此函数会保持t不变,否则将t映射到我们模拟的第一周中的相应小时。

  为了模拟重新开放的策略,该策略均匀地减少了其原始水平的γ比例的访问,其中γ[0,1],我们构建了访问矩阵

  其中τ表示重新开放的第一个小时(2020年5月1日,00:00)。换句话说,我们使用实际观察到的移动性网络直到小时τ,然后随后模拟了完全迁移率水平的γ级数。

  为了模拟减少的居住策略,我们首先估计每个POI PJ的最大占用MPJ是2020年3月1日至5月2日在整个3月1日至2020年5月2日。那是, 。我们通过构造访问矩阵的β[0,1]模拟了最大占用率的β限额,其中ijth输入为

  这对应于以下过程:对于每个POI PJ和时间t,我们首先检查T <τ(重新开放尚未开始)还是(时间t时访问PJ的总数低于允许的最大值)。如果是这样,我们保持不变。否则,我们计算将在时间t下将PJ的总访问降低到允许的最大值,然后将每个CBG CI的所有访问缩小到PJ的缩放系数。对于两种重新开放的策略,我们计算了与重新开放期开始(2020年5月1日)相比,重新开放期结束时(2020年5月30日)的累积发生率的预计增加(2020年5月1日)。

  与图2D相关,扩展数据图5和补充图。11,15–24。我们分别研究了在Safegraph数据中访问最多的20个POI类别的重新开放。在此分析中,我们遵循以前的研究28,并且不研究四类:“儿童日托服务”和“小学和中学”(因为13岁以下的儿童并未受到Safegraph的好处);“饮酒场所(酒精饮料)”(因为Safegraph似乎降低了这些位置28)和“自然公园和其他类似机构”(因为边界和地区的确保范围并不明确定义)。我们还排除了“通用医疗和外科医院”和“其他机场运营”(因为医院和航空旅行都涉及许多其他危险因素,这些风险因素并非旨在捕获)。在模型拟合期间,我们不会过滤这些毒药(也就是说,我们假设人们访问这些pois,并且在那里发生传输),因为包括它们仍然会增加数据集捕获的整体移动性的比例;我们根本不分析这些类别,因为我们希望保持保守,只关注我们最有信心忠实地捕获传输的类别。

  这种重新开放的分析类似于先前关于减少最大占用率与均匀重新开放的实验(请参阅“通过限制最大占用率降低移动性”)。如上所述,我们将重新开放时间τ设置为2020年5月1日,00:00。为了模拟重新开放POI类别,我们将pois集中在该类别中,并在重新开放后将其活动水平设置为3月的第一周。对于不在类别的POI中,我们将其活动水平保留在重新打开相同的情况下,也就是说,我们只需重复数据的最后一周的活动水平(2020年4月27日至5月2日):这使我们访问了带有条目的访问矩阵

  与上述重新开放分析一样,f(t)映射到3月的第一周的相应小时,而g(t)映射到我们数据最后一周的相应小时。对于每个类别,我们计算(1)在重新开放期结束后感染的人的累积部分(2020年5月30日)和(2)(2)2020年5月30日感染的人的累积分数,如果我们不重新开放POI类别(如果我们简单地重复了最后一周的数据活动水平)。这试图在5月底重新开放POI类别之前对累积发生率的增加进行建模。在扩展数据中,图5和补充图。15–24,右下面板显示了整个类别的预测增加,左下图显示了预测的每个POI增加(即总增加除以该类别中的POI数量)。

  与图3D,扩展数据相关联,图6和补充图3。每组CBG(例如,最低收入十分)构成了一组符合相应标准的CBG。在图6和扩展数据图6中,我们显示了不同对组的每日人均迁移率(被收入和种族分解)。为了衡量第D天组的人均流动性,我们将这些CBG进行的访问总数与任何POI进行,并将其除以该组中CBG的总人群。在补充图3中,我们显示了每个小组对每个POI类别进行的访问总数,在整个数据期间积累(2020年3月1日至5月2日),然后除以该组的总人口。

  与图3E和扩展数据表相关

  如上所示,即小时t的POI PJ的传输速率(等式(8))是小时t小时CBG CI的访问者数量,而T是我们模拟中的最后一个小时。这代表了从CBG组中的某人访问中遇到的预期传输率,类别为POI。

  有关研究设计的更多信息可在与本文有关的自然研究报告摘要中获得。

左文资讯声明:未经许可,不得转载。