神经景观扩散解决了整个时间之间需求之间的冲突

2025-06-23 16:43来源:本站

  女性野生型(C57BL6/J,JAX 000664)或RXFP1EM1(CRE)NGAI(RXFP1-P2A-CRE,J。Ngai的礼物)小鼠用于实验。从6-12周开始对小鼠进行了实验程序。所有动物程序均根据斯坦福大学的实验室动物护理行政小组(APLAC)和美国国立卫生研究院指南批准的指南进行了所有动物程序。

  在整个手术程序期间,都使用了无菌技术。用1-2%的异氟烷​​麻醉小鼠,并在手术前持续释放丁丙诺啡(0.5 mg kg -1)。立体定位粘连后,用贝达丁杀菌溶液(BETADINE)和70%异丙醇湿巾清洁头部。去除头皮和骨膜,并用3%过氧化氢溶液和盐水彻底清洁头骨。一旦头骨完全干燥并且水平,将定制的不锈钢头绑在小脑上固定在小脑上,并带有透明的牙科水泥,并将一层薄薄的透明牙齿水泥涂在颅骨表面上,形成一个带有头腰的碗。核子的位置被标记为以后参考。对于用于光遗传学实验的受试者,如上所述制备RXFP1-P2A-CRE小鼠。此外,将AAV5-EF1A-DIO-HCHR2(H134R)-EYFP49(350 nL的5×1012 NL每毫升滴定病毒基因组注入了sfo,–0.65 a/p,0 m/p,0 m/l,–2.75 d/v ins to bregma for bregma; bregma ins coord;使用汉密尔顿注射器。在撤回注射器之前,允许注射注射剂10分钟进行扩散。注射后,将带有1.25毫米套管的400 µm光纤从SFO上方的背腹轴植入30°角(–0.65 A/P,+1.4 m/l,–2.76 d/v),并与牙科水泥一起粘附在颅骨上。

  如上所述,在神经偶像记录之前的一天,用异氟烷麻醉小鼠,并在颅骨上的4个位置钻了颅骨:额叶皮层:2.25-2.5 a/p,1.5 m/l;背纹状体:0.3-0.5 A/P,3.15 m/L;下丘脑:2.2 A/P,2.2 m/L;中脑:3.05–3.3 A/P,1.5 m/L。最初选择神经固定插入轨迹将先前据报道与刺激值缔合(额叶皮层),稳态需求和消耗有关的样本区域(下丘脑,尤其是下丘脑),动作选择和行为选择和行为起始(Striatum)以及运动的执行和奖励(中脑)。鉴于这些区域,我们根据区域之间的远距离轴突投影数据(Allen Brain Institute Arteroverade投影数据集50)来完善坐标,以最大程度地提高我们从电路的多个互连节点同时记录的机会。用盐水清洁颅骨,并用kwik-cast(世界精密仪器)覆盖,直到录音为止。在视觉皮层上插入参考电极(直径0.002毫米,直径为0.002毫米,A-M系统),并用牙齿水泥固定。

  允许小鼠至少一个星期以手术手术后恢复。将小鼠保持在反向黑暗的时间表上,并在黑暗时期或早期的时期进行实验。在行为训练前约1周,将小鼠放在食物和水限制时间表上。每天同时,小鼠接受大约3 g的干粮和1毫升的水,调整量以使小鼠保持在80%的基线体重上。一旦小鼠可靠地执行了行为任务,就会在行为会议期间获得每日水分配,并且根据体重和行为过程中收集的食物量补充了其他干粮(0.5-2 g)。

  对小鼠进行了自定义行为钻机的培训,该行为钻机由两种燃烧器组成,由两型嗅觉仪,一个头部固定装置,两个奖励送出喷嘴 - 一个送出盐(0.5 m NaCl最终浓度)液体香草确保(Abbott)(Abbott)(Abbott),另一个交付饮用水,以及使用高速(200 fps)的供应量(BASLER ACE ACE ACA ACA1300-200-usb3)Bonsairx51,测得的检测潜伏期为5-10 ms(1-2个相机帧))。行为方案由Arduino(MATLAB 2019中的BPOD 2代和相关代码)控制。将气味剂(乙酸乙酯,2-戊酮)稀释到约4%V/V矿物油中,并通过放置在小鼠鼻子前的特氟龙气味管将其输送到小鼠中。干净的空气连续流过气味管,并通过将给定的气味混合到气流中,以长达1.5 s的持续时间来传递气味。将小鼠头部延伸到行为设备上,并通过磁性底座放置,以使两个奖励递送喷嘴位于口腔下方和前方。对喷口位置进行细小调整,以维持每只鼠标的等距。

  一旦建立了食物和水限制,小鼠就开始在两个阶段进行行为训练。在第一阶段,食物和水限制的小鼠学会了自愿舔喷口以获得食物或水上奖励,两种奖励都同样可用。在食物喷口处检测到的舔味导致了约5μl的食物奖励,在水喷口处检测到舔舔,导致〜5 µl的水奖励。每次试验之后,审判间隔(ITI)为1-3 s,最大试验时间为10 s(如果没有发生舔)。小鼠执行了这项简化的两回报收集任务,直到收集到足够的食物和水奖励以达到满足为止。在第一个训练阶段,ITI逐渐从1 s增加到3 s。在第一个训练阶段熟练下,将小鼠引入了整个任务结构,作为第二个训练阶段。在变量ITI周期(最小2 s,最大8 s,均匀分布)之后,将GO或无气味呈现给鼠标,最大为1.5 s;在检测到的舔舔后立即终止气味。在往返期间舔的小鼠将食物或水喷嘴奖励到该水口(约5 µL)的食物或水。在不进行时期产生的舔舔导致了更长的ITI时期,并且没有得到奖励。对小鼠进行训练,直到他们持续获得足够的食物和水奖励以满足两种需求,在饥饿或口渴时可靠地响应了go气味,并在基线前的淘汰前倾斜了舔,并正确拒绝了对禁忌气味的反应(> 90%的正确拒绝率)。从小鼠中收集了与第二个训练阶段所述的任务结构相同的任务结构的行为会话的数据。

  我们从经验上选择食物(液体可确保添加盐)和水奖励,以减少食物奖励减少口渴的程度,以减少需求之间的串扰。添加的盐还减少了食物奖励的享乐值,因为当不饿时,小鼠不会消耗盐(图1b的扩展数据),但会在没有饥饿的情况下消耗平淡(数据未显示)。随着时间的流逝,液体食品奖励的额外盐含量可能会导致口渴的增加。但是,在Buridan测定的时间表上,似乎没有联系收集的食物奖励量与随后的水奖励收集之间没有联系:食物选择和水选择之间没有明显的时机关系(图1E的扩展数据),与在水上收集的量和少量数据(分别收集的量)中(分别收集到的量)(分别是在附近收集的量),该量(均在附近收集了一部分)。这表明,我们观察到的转换行为不能简单地通过咸食物的渴望诱导的渴望来解释。

  我们注意到,在试验开始时,我们的老鼠通常并不完全渴和饥饿。但是,在进行测定时,根据我们对口渴和饥饿的定量行为定义,小鼠经常遇到大致“同样渴望和饥饿”。也就是说,他们将经历与水的试验一样多的食物收集试验,直到两者达到满足的态度为止(示例参见扩展数据图1D)。还请注意,我们的Buridan的测定法不同于“ Buridan的范式”,这是果蝇中的一项视觉运动任务,模仿了一种犹豫不决的状态,不涉及需求之间的选择52。

  在至少2周的病毒表达表达后,筛选了用AD LIB食物和水的rxfp1-p2a-cre小鼠,以筛选其家用笼中的光遗传学诱导的饮酒行为(刺激范式:30-S ON,30-S折,20-Hz,20-Hz刺激,用450 nm Laser(Doric)(Dorcor)(Doric)(Doric)(Doric)(Doric)(Doric)(Doric)(Dorcic)(Dorcior)(Doric)(Doric)(Dorcic)(Doric)(Dorcic)(Dorcic)(Doric)(Doric)(Doric)(Dorcic)(Dorcic)(Doric)为20毫秒20毫秒20 ms,在15 mW的范围内,在15 mW的范围内均可使用。在Buridan的测定中,使用具有清晰光遗传学的饮酒行为的小鼠进行了实验。没有明显的光遗传学诱导饮用的小鼠(可能是由于缺乏足够的转导细胞或与转导细胞的光遗传学纤维未对准的小鼠被停止进一步研究。在行为训练之后,小鼠在光遗传实验之前将小鼠返回到aD lib食物和水(条件)。小鼠进行了Buridan的测定法(图1M)或受食物限制(图1N),并接受了20个刺激时期,每个刺激时期在20 Hz时持续10 s,2毫秒脉冲宽度为450 nm,15兆瓦激光光;大约每2分钟重复一次时期。在测定的ITI阶段触发刺激时期。

  在Buridan's Assay的自由移动版本中,小鼠受到食物和水的限制,然后放置在一个四面定制操作室(Panlab,Harvard Appratus)中,其中包含两个杠杆和两个相应的奖励端口,提供增量的盐液液体食品(在自由移动的分析中,液体食品是SOYLENT SOYLENT SOYLENT SOYLENT SOYLENT SOYLENT SOYLENT TOS SOYLENT TOS SOYLENT TOS SOYLENT添加到0.5 M NACL浓度)或水。杠杆和奖励端口在对角壁上布置在对角墙上,并且需要小鼠从给定端口收集奖励,然后才能在同一端口触发更多奖励(扩展数据图1i)。因此,要反复收集给定类型的奖励,小鼠必须在整个腔室中来回向对角线运行,从而用杠杆按下触发奖励(〜5 µL)并在相应的奖励端口收集。与头部固定的嗅觉GO/NO-GO任务不同,自由移动的测定是在没有任何基于CUE的乐器条件的情况下进行的,因此小鼠可以免费选择收集奖励以及何时收集奖励的奖励。由于每个奖励收藏后的小鼠穿过竞技场的中心,因此它们与食物和水植物的一再等距。在训练几天后,收集了行为会话数据(扩展数据图1J,K),其中小鼠精通触发和快速收集两种奖励类型的奖励。行为会议通常在饱食前持续1小时。

  使用Neuropixels 1.0探针和相关的硬件获取所有记录。用饱和的Tergazyme洗涤剂溶液(Alconox)在记录之前清洁电极,并用纯水洗涤,并完全干燥。在每次记录之前,将电极尖端涂在可固定的染料CM-DII(Thermo Fisher)中并干燥。去除每个颅骨切开术上的kwik铸造涂层,并在将小鼠放在实验设备上之前,用无菌盐水冲洗颅骨。一旦进入实验设备,将每个探针的参考和接地接触彼此连接到鼠标的参考电极和头条。在光遗传记录实验的情况下,将光纤电缆连接到小鼠颅骨上的光纤套管。使用圆形定位设备(多探针操纵器,新的比例技术)将四个神经固定剂放置在鼠标头骨上方。将探针放在前轴周围(左前探头,–30°;前右探头, +30°;后左探头,–150°;后右探针, +150°)。所有探针均位于距背腹轴的角度+15°角。微型手持剂(新的比例技术)用于将每个颅骨切开术在大脑表面上定位探针尖端。将四个探针以3.33 µm s -1的速度同时插入大脑。插入深度范围为3.85 mm至6 mm,但距脑表面4至5 mm之间。探测插入完成后,在记录开始之前,允许约10分钟的时间经过,以允许探针周围的任何残留脑运动沉降。使用SpikeGLX(B。Karsh)使用默认设置获取数据并将数据写入磁盘(AP增益= 500,每个探针的底部384电极位点获取的记录)。使用0.5 s持续时间脉冲以1秒为单位对探针的采集进行同步。在NIDAQ(Texas Instruments)上同时获得了探针同步信号,行为信号和任何光遗传刺激信号,后来与探针同步信号(Tprime,B。Karsh)保持一致。在录音过程中获得了鼠标脸,头部和身体的视频,并使用红外LED与NIDAQ上记录的试验启动的TTL脉冲结合进行同步。

  在所有实验中,进行了实验设置周期(在记录开始之前)进行,从小鼠的口腔和气味气流关闭时,吐出的喷嘴降低了。在行为分析开始之前,将喷嘴升至可访问的位置,并打开气流气流。老鼠在录音期间进行了Buridan的测定,直到饱满。随后,行为会议终止并完成了记录。In the case of optogenetic stimulation experiments performed during recording (Fig. 4k–o and Extended Data Fig. 10), spouts remained lowered and airflow remained off after the start of recording until the completion of optogenetic stimulation epochs (10-s stimulation at 20 Hz with 2-ms pulse widths of 15-mW 405-nm laser light, 20 stimulation epochs per session spaced 1 min apart);在休息了5分钟之后,升起喷口,打开气流,而小鼠进行了Buridan的测定,没有进一步的光遗传学刺激。

  实验完成后,将小鼠安乐死,并用冰冷的磷酸盐缓冲盐水(1×PBS,Thermo Fisher)和4%多聚甲醛(PFA,电子显微镜科学)灌注。从头骨中解剖大脑,并在4%PFA下在4°C下过夜。如前所述清除大脑。清除后,在二苯唑醚中的Lavision Lighet显微镜上,在水平面的两个半球上成像大脑。收集了两个图像量:488 nm自动荧光体积和532 nm CM-DII体积。使用单个浅层水平焦点以0.8倍的放大倍数在Z轴上以4 µm步长以4 µm的步长以4 µm的步长收集体积。

  将两个结果的体积下采样至25 µm。使用仿射变换进行了488-nm自动荧光体积的注册,然后是向Allen Brain Atlas CCFV353进行翘曲B-Spline变换(Elastix)(可在https://allensdk.readthedocs.io/en/latest/上获得)。所得转换用于将532 nm cm-DII体积变形到参考地图集。参考图集与自动荧光体积和CM-DII体积之间的比对在结构之间是否有良好的一致性检查。python图像体积查看器Napari54用于沿电极区标记点。每个轨道的每组积分都有一个唯一的名称,并保存每个大脑。自定义Python代码用于将探针集集转换为插入轨道并将电极位置映射到大脑区域(请参阅Github上的代码存储库,https://github.com/erichamc/erichamc/brainwide-npix)。使用自定义代码,从每个探针中提取了本地现场电位(LFP)数据,并针对颜色编码(遵循Allen Institute Brain Atlas Color Map)进行区域注释,并对最低点标记给定轨迹的位置进行了很好的调整,直到LFP活动和区域性界限之间的质量相位良好,直到有一个令人满意的质量范围。

  使用CATGT工具(B. Karsh,https://billkarsh.github.io/spikeglx/#catgt)对所有录音进行预处理,以每次播放的电压(CAR)记录的电压轨迹每次播放的电压轨迹,并在零暂时的电气段(均值)后置于pressitient facterient fellifatient trifacts(mottanient flastient tline trifacts car(mottanient flastient tline trifacts)(强制性电气工件)。在使用CATGT进行预处理后,使用Kilosort3(https://github.com/mouseland/kilosort)对数据进行了分类。使用tprime(Karsh,https://billkarsh.github.io/spikeglx/#tprime)将簇尖峰时间(来自kilosort3的输出)和NIDAQ事件(通过CATGT检测到)与参考探针同步信号对齐。使用C_Waves(B. Karsh)计算群集波形平均值。eCephys_spike_sorting管道的代码(J. colonell,https://github.com/jennifercolonell/ecephys_spike_sorting)用于组织管道可执行文件和输入/输出文件,并进一步用于计算Kilosort3 Clusers上的QC Metrics 3 clusers in Kilosort3 Clusers and qulosort3 clusters and tagin3 clusters and qulosort3 clusicter and cantical sealital sealital noye clusters clusters。在所有预处理,尖峰排序和后处理步骤之后,使用PHY2(https://github.com/cortex-lab/phy)手动检查所有簇,并根据需要重新布置为噪声或非NOISE群集。基于手动噪声集群标签和QC指标设置了一个自动阈值(跨间隔违规行为) <0.1, signal-to-noise ratio >2,每个群集峰值> 500)。这些阈值的结合在定性上与隔离良好的和多单元活动群集的手动注释很好地吻合。所有未通过这些阈值的集群都被排除在分析之外。

  所有数据分析均使用Jupyter Ipython56笔记本中的Python代码进行。这些分析在很大程度上依赖于numpy57,scipy58,pandas59和scikit-learn60。使用JAX61组成计算模拟。Seaborn62用于酒吧图,弹盘图和KDE地块。Matplotlib63用于所有其他图。STATSMODELS64和SCIPY用于所有未使用自举进行的统计分析。

  我们将选择性指数计算为奖励选择的平均水平(累积水选择 - 累积食品选择的累积选择)/(累积水选择+累积食品选择的否。图1A)。

  两国马尔可夫过程的持久计数分布遵循几何分布。我们将几何分布拟合到持久性使用Scipy计数数据(图1G和扩展数据图1K)。

  我们分别定义了对行为口渴或饥饿的每次初步测量,因为该小鼠在整个会议中会收集的水或食物奖励总数减去当前收集的水或食物奖励的数量。我们进一步使这些“行为口渴”或“行为饥饿”值分别通过总水或食物奖励的中位数,即小鼠在Buridan的测定中收集的食物和水限制。例如,行为渴望=(在本次试验中收集到的水奖励中的总水奖励)/(在一个会话中最初饥饿和口渴的小鼠收集的总水奖励的中位数,在所有会话中都计算出来)。We then further defined the relative level of behavioural thirst and hunger as an index ranging from −1 (maximally hungry versus minimally thirsty) to +1 (minimally hungry versus maximally thirsty), which we refer to as the relative need of the mouse and calculated as [(behavioural thirst − behavioural hunger)/(behavioural thirst + behavioural hunger)] (Extended Data Fig. 1d).

  为了分析每次初步选择的边缘或条件概率,我们首先将所有试验从行为疗程中整理到每个试验结果表中,其中每个进行的审判都以会话中的位置标记,以前的审判,先前的审判,随后的Go-trial选择,随后的审核性选择,每次会话累积累积奖励,以及当前的食物和水的数量。在任何给定试验中选择水的边际概率是使用线性回归拟合的,以预测相对需求值的奖励审判结果,用于对小鼠受到食物和水限制的会话的试验(图1H)。通过自举估计这些拟合的95%置信区间。我们还计算了在奖励试验中选择水的边际概率的最大似然估计值(MLE),这是奖励试验的一部分,其中小鼠选择了水,评估了落入给定5%宽的相对需求值bin内的试验(图1H,黑点,黑点)。MLE估计值的置信区间为95%,并将其绘制为垂直线。

  使用表的试验选择结果及其相关的先前试验或随后的试验选择结果,我们计算了MLE MARKOV过渡矩阵,用于所有行为会议的试验。对于给定需求相对平衡的过渡矩阵(图1K),我们仅使用具有相对需求值–0.25和+0.25的试验。我们从这些分析中排除了会议,在这些分析中,小鼠仅在单个限制范式下(仅食物或仅水),我们排除了小鼠的试验,其中小鼠的剩余奖励少于10个以收集给定类型的奖励(以避免采样问题)。还通过对每次试验的相对需求值进行线性回归来预测食物选择是否会遵循以前的食物选择,可以估算食物选择和水选择的自我过渡概率(图1J);应用了等效程序进行水试验。估计每种自我转变概率拟合的95%置信区间通过引导概率。计算自我过渡概率的MLE值是给定选择类型的自我转变的比例,仅限于试验的相对需求值落在给定5%范围内的桶内,而通过Boottrapping估计的MLE置信区间为95%。

  我们通过拟合和评估具有径向基核的支撑向量机(L2正则化重量C = 1.0,根据特征方差缩放的伽玛; Scikit-Learn默认默认为gamma ='scale'),比较了需求和先前选择的选择预测。在评估需求的预测性时,我们仅使用行为口渴和行为饥饿(请参见上文)在数据的50%训练分配中拟合两场模型。在评估先前选择的预测性时,我们仅使用先前选择的二进制结果拟合支持向量机,以预测数据的50%训练分配。在每个会话上分别拟合的模型的测试数据中评估了预测性(AUC),在所有会话中设置的每个参数(n = 15只小鼠,22个会话)的中位数和第95个百分位置信区间值。

  对于所有光遗传学刺激时期,附近的进行审判开始时间被选择结果(食物,水,错过)标记,并且相对于最近的光遗传学刺激时期的开始时间。这些食物和水选择试验相对于刺激时期的发作时间,使用核密度估计量(KDE)(Seaborn,Scipy)在时间上平滑,以产生食物或水选择响应的概率密度估计,这是相对于光学遗传学刺激发作的时间的函数。对于小鼠,没有做出食物的选择,因此省略了KDE分析。

  将每个神经元的尖峰以10毫秒的分辨率进行了归纳,并使用100毫米的向前移动平均窗口将bin的计数除以垃圾箱宽度,并通过因果宽度平滑,以以10毫秒的分辨率产生平滑的射击速率。这些速率在神经元内的一个会话期间z得分。为了进行试验的相对分析,将Z尺寸的速率连接到每次试验矢量410箱长(4.1 s,最小试验时间),并与试验启动触发信号(记录在NIDAQ上,并校正为NIDAQ并校正为参考探针同步时间),从而使每个试验对应于10毫秒的第一个试验对应于10毫秒的试验辅助启动时间启用。每次试验的基线活性率定义为在气味发作前1 s中给定神经元的平均峰值数。

  对单个神经元的所有分析均使用通过kilosort3鉴定的良好分离簇和后处理分析(请参阅“ Spike分类和预处理”)。每个神经元都使用相应的解剖位置标记,使用电极的地图集的位置,该电极在该位置上检测到的波形最大。这些解剖位置用于从Allen Institute CCFV3注释量和关联的结构树中提取相应的区域名称。根据分析水平,所使用的区域名称是结构树的叶节点或更高阶的结构。在所有数字中,按照艾伦研究所的小鼠大脑图集设定的结肠纪念,并使用allensdk提取区域。

  对单个神经元的以下分析仅使用了显着任务和状态调节的细胞:图2E,F和扩展数据图。3–5。显着的调制定义为在五个措施上进行的逻辑或操作,分别由双面t检验评估:食物选择试验和水选择试验之间的气味发作前1 s(基线发射率)的平均点火率差异;GO试验响应(HIT试验)和GO试验非响应反应(错过试验)之间的基线射击率差异;气味发作后的基线射击速率和平均射击率0-1、1-2和2-3 s之间的差异。每种调制度量的P值是校正细胞总数的Benjamini – Hochberg误解率。这种显着性量度被用作细胞的预滤波器。随后的分析采用了针对相关无效分布的其他显着性措施(请参见下文中的无分布)。

  通过在气味发作之前1 s中的即将到来的选择身份及其平均基线射击速率的相关性对神经元进行分类,并在每次试验加入在一起之前的1 s中可视化,平均发射速率在1 s中进行了可视化(图2C)。

  对于显着调制的细胞,将每次试验射击速率平均(食物选择,水选择,错过/陈述)和条件平均的点火率载体被串联。这些串联的,每个细胞状态平均速率被视为多维测量值,其中每个串联的点火率bin是一个特征。使用库scanpy65,首先使用主组件分析在维度中缩小了特征矩阵的单元格,然后使用n = 5邻居计算观测值的邻域图,然后计算出均匀的歧管近似值和投影66歧管,最后使用Leiden Clustering 67在此歧管上鉴定了clusters。通过这些簇身份订购细胞,其条件平均的Z尺寸发射速率可视化(扩展数据图3A,b)。

  每个试验的行为变量构建了一系列二元回归器:选择结果(食物与水);早期(一次会议中的第三个试验)与食物选择的晚期(最后三分之一);早期(第三个)与水选择的晚期(最后三分);击中小姐;Go-odour试验与无行为试验。从这些回归变量中,与选择结果相比,每个细胞的每次试活动(1 s前的杂物),对每个细胞的每次试活动进行了8次测量的点火率差异,与选择结果相比,早期食品与晚期食物试验,早期与晚期水试验相比,以及命中率与错过的回归剂相比;与GO与No-go和选择结果回归器相比,平均气味活动(气味发作后的300毫秒窗口);与选择结果相比,与无关回归器相比,平均响应活动(1-S活动窗口开始1 s)与选择结果相比(扩展数据图3C)。为了解释的方差分析,为给定的回归变量可视化神经元在区域内解释的方差分布。区域的平均值通过记录的区域记录的射击率方差的平均值,对于有记录的神经元超过30个区域。

  对于所有单细胞回归分析,构建了每单元素无效分布,并将每个单元格的真实测量值(例如,为给定回归器解释的方差)与相应的空作物进行了比较,其显着性取决于所得的单侧尾巴统计量,P≤0.05作为阈值。对于解释的方差,每个单元的无效分布都是通过相对于回归器时间序列循环置换射击率时间序列来构建的。我们注意到,对于时间序列的随机(非结构化)置换的无效分布的显着性测试未能消除虚假的长时间尺度相关性,尽管我们还指出,长时间的相关性可能与我们感兴趣的某些状态现象有关,因此循环置换可能过于保守。未来的研究能够在多个会话中跟踪相同的神经元,这将增加相应的无效分布的统计能力。对于考虑了每个区域解释的平均方差的分析,使用了每个区域中细胞的圆形排列null的额外的空分布引导平均值(图2E中的虚线和扩展数据中的虚线图5)。

  所解释的区域方差均值的以下p值与图2E和扩展数据相关联,并通过引导(10,000个样本)获得区域内的平均每个细胞差异值,并比较单侧尾巴统计量,并比较单侧的尾巴统计量与类似引导的区域无效的区域无效的区域无效分布方差(如上所述)。然后对这些P值进行FDR校正,以进行大脑区域的多次比较:MRN,0.000;科学,0.000;APN,0.000;CP,0.000;OLF,0.000;FF,0.000;FS,0.000;ORBL5,0.000;VTA,0.006;ACB,0.008;PEF,0.010;LHA,0.016;ORBL1,0.124;AIV5,0.127;ORBL2/3,0.130;SSP-M6A,0.130;ORBL6A,0.130;Zi,0.130;aon,0.272;PO,0.279;VPM,0.279;Val,0.279;RN,0.279;SI,0.279;AAA,0.327;EPD,0.336;VM,0.417;AID6A,0.520;SCIG,0.603;CA1,0.748;MOS6A,0.828;帖子,0.834;LP,0.834;PRNR,0.955;PPN,1.000(扩展数据表1中提供了大脑区域缩写)。

  为了分析即将到来的选择的人口预测性,这可能与神经活动中的长时间相关性混淆,我们采用了两种方法:(1)我们将所有分析与循环的null分布和循环置换的零分布进行了比较,并且与perm的无效分布进行了比较(图2G中的两个虚线都给出了相似的结果;(2)我们评估了一组持有的测试试验数据侧面行为开关的预测性(奖励试验–5至–2,奖励试验+2至+5相对于第一个试验,其奖励选择更改为试验0);因为这种测试集将每种奖励类型的配对选择与附近的等效设置配对,所以它有助于消除了虚假的长时间相关性与选择的混淆。

  从回归方差解释×单元格矩阵中计算出8×8的回归信息相关系数矩阵。欧几里得成对距离在所得的相关系数值之间评估,随后估计了距离之间的链接。相关系数矩阵的条目是根据层次链接的叶子重新排序的(扩展数据图3E)。

  在所有记录中汇总细胞(n = 7只小鼠或记录,扩展数据表1中给出的每个区域的细胞数量)。对于每个单元,在给定选择结果中的跨节点平均点火率在每个审判的1 s前基线期间,在10 s前的基线基线期间进行了折点,然后将整个会议的试验串联在一起进行试验。然后,使用这些串联的点火速率计算细胞之间成对噪声相关的基质。如上所述(单细胞分析的无效分布),将细胞归类为目标 - 重要或非目标 - 显着性,并且根据扩展数据图3Q中给出的类别进行了噪声相关矩阵,以产生绘制的分布。

  所有人口选择预测分析均使用线性判别分析(LDA)分类器进行,并通过分析确定的协方差矩阵进行收缩。在持有的测试数据上评估了模型预测精度(接收器操作特征(ROC)AUC)的所有量化。用于人群解码的特征向量使用单性bin活性向量,用于同时记录的神经元(图4E和扩展数据图8B)或在1-S前射基线基线周期中平均每个神经元的活性向量(图2G和4C)(图2G和4C)以及扩展数据图8A)。对于即将到来的选择分类器(“目标维度”分类器),排除了在淘汰前基线期间舔舔的试验,以避免行为污染。沿区分轴的神经活动的可视化使用了逻辑回归分类器的决策功能,其逆正则化强度设置为0.02。在光遗传实验的情况下,使用行为测定过程中平均水和食物试验基线活动的差异构建了目标维度,并且在每个结果的试验中,重量通过总和的标准偏差归一化39。将每个光遗传学刺激时期(–10 s至+20 s)的一秒钟的神经活动投射到该目标维度上(图4i – O和扩展数据图10F,G)。或者(扩展数据图10c – e),在光遗传刺激(在10 s的刺激中平均)或平均活性在刺激开始前的3 s中使用平均活性构建了“口渴”分类器,以预测刺激与非刺激周期。行为过程中神经活动在此“口渴”维度上的投影用于在不同行为时期沿着这种光遗传学的渴求度测量活性。

  使用logistic回归构建了即将使用的选择分类器,该分类器是使用Logistic回归构建的,其线性特征由气味开始前1 s的平均神经活动组成。正则强度设置为0.05。分类器接受了70%的奖励试验培训,其中30%被淘汰。然后,对每个会话的所有试验进行评估,对此分类器的决策功能进行评估,以产生沿目标维度的人群活动投影。为了预测在给定试验中开关的概率,使用一维LDA分类器在所有试验的开关结果上拟合,将即将到来的选择决策函数的零零距离评估(对1 s)进行了评估(图4G,h)。为了测量目标活动投影在预测会话中的即将到来的开关时,接收器操作特征AUC是使用距即将到来的选择决策函数的零距离的距离进行测量的(图4i,j)。

  为了评估有关气味发作后获得的选择的信息,使用基线提取的点火率活动在该时间箱中以每个时间箱进行了选择的人群解码器(扩展数据图11a)。从每次垃圾箱中消除的基线活性由气味发作前1 s的平均活性组成,每次审判。消除每个细胞的基线活性消除了即将到来的选择的平均基线预测性,因此预测性的增加只能来自超出每个试验平均基线速率的神经活动的变化。使用给定区域内同时记录的种群活动向量构建了每个区域的分类器(扩展数据图11A)。可视化的基线提取后预测性使用了AUC在持有测试试验中首先在会话中评估,然后在会话重复的情况下平均。没有多个会话重复或少于30个神经元的区域用星号标记。

  为了评估基线目标活动调制后选择后选择性动力学的波动,我们使用同时​​记录的所有记录的神经元(扩展数据图11b,c)或从给定的区域中(扩展的神经元)(扩展的数据)(扩展的数据)(扩展的数据)(扩展的数据图11f)中使用同时记录的点火速率活动构建了选择的分类器。对于这些分析,我们使用了具有线性特征的逻辑回归分类器,正则化因子为0.1(Scikit Learn)。在50%的试验数据集上对分类器进行了培训,并在50%的试验集中评估了随后的预测。使用每个区域分类器决策函数构建了对区分选择选择尺寸的预测,我们在气味开始前的100 ms中使用每次试验投影值进一步提取基线。对于行为会议中的每个相应的选择试验,我们在目标维度中计算了基线活动(使用经过训练的逻辑回归分类器的决策功能,以预测所有同时记录各个区域的神经元的1 s前神经活动的即将进行的选择)。目标维度的活性和选择选择尺寸中的活动均使用二级线性分类器函数从–1到1进行标准化,以消除行为会话之间决策函数幅度的系统差异。对于扩展数据中提出的分析图11b,d,f,对选择选择尺寸的投影被纳入0-33、34-66和67-100%的基础基线目标维度,并在会话内和选择中计算得出的百分位数。线性回归分析(扩展数据图11c,e)直接使用每个试验目标维度幅度,而不是百分位数。为了通过选择性基线目标活动对淘汰后选择选择运动活性动力学的调节分析, 选择选择活动从二射后0.1 s求和到欧德后0.9 s。

  面部和身体的视频每秒以每秒100帧的速度获取,并从RGB转换为感兴趣的区域(ROI),并转换为Greyscale。将ROI转换为运动能(从框架到框架的像素强度的变化),并使用FaceMAP68通过单数值分解来提取每个ROI的前500个主组件。主成分视频数据在每个行为试验开始时使用框架内LED触发信号同步到行为数据。使用与接收器操作员特征区域(ROC AUC)定量下的LDA进行了行为解码和解码性能评估,使用用于解码神经数据的方法。

  数学模型由几个耦合的差分和随机微分方程组成。这些方程描述了需求的能量格局的形状,这是口渴和饥饿幅度的函数。整个景观的运动动力学随时间的函数;渴望和饥饿的更新动力学是气味呈现(采样时间)和景观(行为选择事件)的当前位置的函数(图3B和扩展数据图6C – F)。我们选择了一个简单的三维能量景观形状(一个在每个位置定义的具有景观深度的二维空间),将谐波井放在以平衡距离为中心的三个位置的谐波井;这些位置代表了与渴望相关,与饥饿相关和其他需求相关的神经活动的手段。为了在井之间提供平滑的马鞍,我们根据以下公式表示景观为高斯概率密度函数的对数 - 概率密度函数(扩展数据图6e,f):

  其中每个井的形状由多元正常分布的以下负概率密度函数定义:

  其中μW是渴望相关空间的井中的中心;μF是与饥饿相关空间的井中的中心;μo是与“其他需求”相关空间的井中的中心;是每个正态分布的协方差矩阵,并且在所有井之间都是等效的。是时间t的口渴的大小;h(t)是时间t的饥饿程度;S是一个缩放因素,它可以使实验观察到的标准化口渴和饥饿幅度与模型中适当的尺度相提并论。因此,随着渴望和饥饿的大幅度随时间的变化,能量景观中各个井的深度被缩放,从而导致随着时间的推移,景观的梯度随着每种需求的函数而变化(图3b,c,扩展数据图6C -F和补充视频1)。为简单起见,我们假设其他需求的规模持续,因此口渴和饥饿被视为对其他需求的相对幅度。

  神经活动在此简化的二维子空间上的行为通过以下公式中抑制过度阻尼的langevin动力学近似(另请参见扩展数据图6C,d):

  在每个离散的时间步骤中,我们添加到当前位置x(t)当前能量界面的负梯度,由因子G缩放,与时间无关的白噪声N(零中心的正态分布与协方差I标识矩阵,指示每个维度之间的噪声之间的零依赖性)。在景观上运动的行为在很大程度上取决于G和N之间的关系以及它们相对于井中心与井形的尺度的幅度。n的较高值驱动景观上的空间之间的更频繁过渡,并且在极限下,能量格局对动力学的贡献不堪重负;较高的G值增加了能量景观在噪声造成的动力学上的优势,并降低了过渡频率,因为景观上的运动倾向于将其朝向最接近的能量。U(x,t)中的比例因子s修改了系统倾向在食物或水寻求区域而不是“其他需求”区域的倾向。S和G的幅度增加增加了区域之间过渡的速度。

  这些动力学的行为排放是通过将子空间分配到区域中给出的,根据该区域,未量化的负概率密度函数在每个位置都具有更大的幅度,从而产生标准的最大似然决策函数。我们为简单起见选择此最大似然分区,但是我们建议在特定环境或环境中学习可以塑造该子空间对行为的更复杂的分区。因此,行为选择排放由位置x(t)和时间t'的采样提示定义,并具有以下方程式:

  根据以下等式,渴望t(t)和饥饿H(t)的大小分别由固定量的RW和RF减小,并在食物或水选择后进行固定的反馈延迟l。

  RW和RF对应于给出的鼠标的奖励大小,并近似收集奖励时需求的增量变化;我们基于高初始口渴T0和Hunger H0值设置这些值,以使Buridan分析中的模拟行为导致收集的累积奖励数量相似,直到饱受尊敬(主要是“错过”结果)与实验性行为相似。我们根据文献的粗略审查将反馈延迟l设置为2分钟,但没有根据实验数据微调值。为简单起见,我们在口渴和饥饿幅度的更新中没有包含任何滞后,除了更新中的固定延迟时间。我们注意到,一个更详细的模型可能包括滞后,例如收集奖励的速度或特征动态的速度,以改变景观的速度;稳态缺陷的感觉可能的预期动态;奖励和需求之间的更复杂的相互作用(例如,如果奖励会减少一个需求,但会增加较长的时间尺度上的相互作用,那么盐的情况下可能会确保确保)。沿目标维度的所有可视化或测量模拟活动都使用当前位置投射到由单位向量上的投影

  在我们的参数中,这很简单。

  上述数学模型具有几个相互关联的固定参数,其值会在模拟行为会话中改变系统行为。我们寻求一组参数,其值最能通过汇总统计数据与行为实验的统计数据产生模拟。我们选择将模型拟合到行为数据而不是神经数据上,原因有两个:(1),以便我们可以评估模型匹配和预测行为结果的程度,与神经数据的约束无关(图3);(2)使我们可以评估该类别的模型对行为结果的程度,可以预见神经数据的各个方面(图4)。由于我们提出的模型是一个运动方程式,可以从初始位置和初始口渴和饥饿幅度进行离散的,随机的前进模拟,并且对一组参数的任何给定的会话模拟都将在重复模拟运行中有所不同,因此模型的输出无法直接调谐行为轨迹的轨迹。从计算角度来看,该模型被离散到良好的时间时间步长(1/100秒的1/100),因此,拟合也使拟合变得复杂,因此每个模拟试验之间都评估了约1,000个模型步骤。

  最佳模型拟合过程最大程度地提高了观察到的数据的可能性,从模型及其参数进行了预测,但要受任何约束。为了执行此优化,我们利用了实验数据和模型的几个方面:

  First, recognizing that the behavioural sessions exhibited a strong Markov property (conditional independence), we transformed behavioural sessions (chains of 100 s of trials) into a collection of pairs of sequential rewarded trial outcomes, for example, food-to-food, food-to-water, water-to-food, and water-to-water, and we tagged each trial by their current thirst and hunger magnitudes and the time elapsed between reward choices.然后,我们将每对试验独立于所有其他试验。然后,优化模型参数的问题成为鉴于模型和参数集的每个试验对的概率的共同优化概率的问题。

  其次,尽管上述随机微分方程对此试验对数据没有给出概率估计,但来自非平衡统计力学和过渡状态理论的领域的结果给出了与Langevin方程状态之间的过渡概率率相关的近似方程,其形式与我们上面所述。具体而言,我们改编了Kramers的第一个段落问题33,34,它描述了在谐波井中扩散粒子的能量屏障上的逃逸率,以给出理论表达选择,从而为选择作为口渴,饥饿和试验之间时间的函数之间的过渡概率。该理论表达方式利用相同的模型参数和能量格局作为运动的正程,因此将模型参数与观察到的行为事件联系起来。我们还利用了景观和噪声之间的平衡关系,以限制配件。我们提供这些理论表达的推导,如下所示。

  遵循过渡状态理论,我们可以写下一组一般的时间依赖性微分方程,以使系统处于一种状态(在我们的情况下,是食物井或水周围的区域周围的区域):

  其中PW是在水带上的概率;PF是进入食品区的概率。ωfw是从食物区到水区的过渡概率率。ωWF是从水带到食物区的过渡概率率。作为一个简化的假设,我们忽略了向“其他需求”区域的过渡,只会考虑在奖励之间没有错过的试验。所以,

  和

  在观察以前的食物或水的观察时,随着时间t = 0给出边界条件:

  因此,PW(t)成为一种自我传输概率PWW(t),在时间t = 0处在水带上在时间t中在水带t处于水区的概率,而对于Pf(t)作为自我转移概率PFF(t)的概率(t)在时间T = 0的食物区域t = 0. 9)和替代(9)中的食物区域t在食物区域中存在的可能性(t)。

  切换的过渡概率是:

  和

  集成公式(12)和(13)并解决初始值问题给出:

  和

  这产生了全职依赖性过渡矩阵:

  为了评估这些概率表达式,我们需要指定ωfw和ωwf的速率方程。克莱默斯(Kramers)的第一个段落问题描述了驻留在谐波潜力中的粒子的平均时间,以便在能量屏障上首次逃脱。如果屏障的另一侧是具有高屏障的第二势孔34,则第一个逃逸时间的倒数大约是过渡速率ω。对于满足波动耗散定理34的一维Smoluchowski方程,该从状态A到B的过渡速率具有以下形式:

  在过渡状态(井之间的马鞍)在哪里评估了潜力;UA是在源状态的最小(井中心)评估的潜力;KBT是玻尔兹曼的常数乘以温度,γ是摩擦项,νa是谐波孔的近似频率,其中心是谐波孔的近似频率,νT是过渡态的近似频率。为了利用此方程,我们将模型的运动方程式视为沿Y轴(食物和水井之间的界线)的一维Smoluchowski方程。我们将摩擦项γ= 1(噪声项)设置为噪声项,并将梯度尺度G视为能量景观的一个比例因素,而不是运动方程中景观梯度的比例因子(对梯度产生同等效果,因为它在运动方程中会产生,但要避免使用Smoluchouchowskieequy的γ来解释γ)。因此,我们将需求格局视为潜力,在上一个奖励收集时评估了渴望和饥饿的功能,并且在上述奖励收集时评估了渴望的功能,而公式(1)中指定的景观u(x)在内部取决于s,并通过用g乘法来缩放。在(19)中的谐波近似之后,我们将景观的井中中心近似为高斯平均值(μW或μF)的概率密度函数的对数,并采用第二个衍生物以获取频率ν:

  和

  (请注意,我们将过渡状态的频率近似为源状态的双倍,该值与数值评估近似一致)。

  因此,我们从食物和水的过渡速率获得以下表达,这是渴望和饥饿的函数:

  和

  将这些方程插入(18)及其相应的表达式中,每种行为试验对的过渡概率方程,作为时间,渴望,饥饿幅度以及在我们的运动方程中使用的模型参数的函数。该方程用于评估图3H和扩展数据图7f的理论预测。我们注意到,该方程仅是近似的,并且需要(1)源状态的电势相对于过渡状态很深,并且(2)系统遵循Equilibrium34的Boltzmann分布34。遵循要求(2),我们通过共同优化实验行为数据集中观察到的每个奖励对的过渡概率以及所有单个奖励选择试验的概率来限制优化:

  和

  XW和XF分别是景观的水和食物区域。这些方程用于评估扩展数据的理论预测图7b,d。最后,为了限制相对于“其他需求”的渴望和饥饿的刻度缩放和饥饿的尺度,我们添加到联合优化的一个专门针对围绕饱满的试验的玻璃体衍生的方程式,包括错过(等式(公式(24)和(25)),并且在没有奖励试验中进行了评估,没有奖励试验,而无需进行奖励试验。

  分母是整个景观空间的集成,而XO是景观的“其他需求”区域。

  上面的推导产生了三组表达式,以实验数据的概率作为模型的函数及其参数:(i)两个顺序奖励试验之间的过渡概率的表达式,取决于时间,口渴,饥饿和先前的选择身份;(ii)给定奖励的可能性,独立于时间或以前的选择,但取决于口渴和饥饿的表达;(iii)表达(i)中的表达方式,但对于附近或饱食期间的试验,包括错过。然后,我们通过拟合比例参数n,g和s来最大程度地减少了这些理论模型衍生方程中所有实验会话中数据的负面样品可能性,同时作为固定参数留下固定参数,井中和形状是简单的解释(井中心都放置在每个副标中,并将其放置在每个钢辅水旁边的标准偏差。数据分为三组,对应于(i),(ii)和(iii):如上所述的顺序奖励试验对;每个审判时的奖励审判结果以及渴望和饥饿的大幅度,不包括与错过相邻的试验;以及个人进行审判的结果,包括近乎饱食的错过(口渴和饥饿<0.5)。我们分开了对非习惯(i,ii)和SAIT(III)试验的评估,以避免过度拟合早期的错过,这也可能是由于行为任务的错误,而不是鼠标的需求或目标。所使用的关节损耗函数是在这三组中的每一组中每次试验的平均负模样。由于计算(II)和(iii)中使用的玻尔兹曼源性表达式涉及更多计算昂贵的数值集成,因此(ii)和(iii)的试验数据分别为整个数据集的大小的1/50(分别为〜8,000和〜11,000个试验)。所有方程均使用使用JAX60库的自定义Python代码表示,从而使自动差异化, 及时的汇编,自动矢量化以及相应优化库Optax69和Ardabelief Optimizer70(带有学习率10-1)的使用,该库消耗了相对于N,G和S计算的关节损耗函数的梯度。进行损失函数的最小化直到收敛为止。

  在图3和扩展数据图7中,使用上面的过程对所有行为数据集进行了拟合所有分析的参数,该过程在图1中进行了分析。对于光遗传学仿真实验,添加了3.3(通过网格搜索获得的额外比例率),添加到梯度术语G中,以与实验性光源刺激结果最佳重叠。我们注意到,由于该实验利用了一小部分小鼠,因此梯度量表的附加调整可能解释了在平均值中未考虑的这些参数的动物到动物的差异。对于图4和扩展数据图。9和10,使用上面的步骤拟合参数,用于用于神经固定记录的小鼠子集,然后将这些相同的拟合参数用于所有分析,不包括光遗传学分析,其中使用上述3.3的附加缩放系数。

  上述数学模型的模拟使用JAX Library60在定制的Python代码中实施,以进行即时编译(加快模拟)和自动分化(用于景观梯度计算)。所有模拟都使用以下固定参数集:,,,20,L = 180,初始位置(口渴和饥饿井之间的鞍点),dt = 0.01,rw = 0.006,RF = 0.004。对于图3C – H和扩展数据的分析图7a – I,如上所述,G,N和S参数适合图1中分析的所有行为会议的试验数据,并且使用了单个参数值(G = 2.4383774,N = 2.74393,并且使用了S = 6.487449355)。对于行为光遗传学仿真分析(图3J,K和扩展数据图7J – L),使用了与上述相同的拟合参数值,除了G乘以上述3.3倍的倍数。如上所述,对于图4D – J和扩展数据的分析,图9E,H,参数G和N适合于Neuropixels录音的一系列行为会议的试验数据,如上所述,以及单个结果的参数集(G = 2.5563507,n = 2.5563507,n = 2.807799,以及s = 6.487494949355)。对于比较模拟轨迹和神经数据的光遗传学仿真分析(图4M,O和扩展数据图10F),我们使用了与图4D -J和扩展数据相同的参数集图9E,H,G乘以上述3.3因子为3.3。我们注意到,在两组光遗传学分析(行为和神经)中,与基本参数集(数据未显示)观察到定性相似的现象,但是与附加的缩放系数观察到了更紧密的定量匹配。

  进行行为试验的每个模拟运行都使用了一个独特的随机生成的GO和No-Go试验时间,它们的分布与实际行为分析中使用的试验时间分布相匹配。对Buridan测定法的模拟(图3和扩展数据图7)进行了2小时的模拟时间(720,000步,DT = 0.01 s)。为了可视化,进行模拟,直到观察到连续失误的门槛为止,此时模拟终止。该阈值在30-50次误差之间以可视化的目的而变化。用“高渴” T0值和“高饥饿” H0值初始化模拟,与实验的初始值相匹配。根据上述动力学方程,参数,初始条件(X0,T0,H0)和试验时间自动运行模拟会话。模拟数据集由一组匹配相应实验数据集大小的模拟行为会话组成。为了分析模拟中摘要统计数据与实验的摘要统计数据的分布(图3),每个数据集仿真都使用不同的随机数生成器键重复128次,因此所有模拟会话均包含一组独特的试验时间和独特的会话轨迹。在神经数据的模型预测的情况下,会话模拟的模拟时间为1.5 h(图4和扩展数据图8)或2 h或模拟时间(扩展数据图9)。对于这些模型预测的分析,模拟会话的数量与实验会话的数量相匹配。

  To illustrate the how the scaling terms on the gradient and the noise ( and ) alter behavioural stickiness (Extended Data Fig. 7m,n), we ran model simulations with either a ‘too decoherent’ set of parameters (g = 2.0, n = 8.0 and s = 6.4874935) or a ‘too persistent’ set of parameters (g = 8.0, n = 0.5 and s = 6.4874935).

  如上所述进行了仅使用光遗传学渴求的饥饿行为的模拟,但饥饿H0的初始值设置为0.5,渴望T0的初始值设置为0.05(图3i – k和扩展数据图7J – L)。我们注意到,由于系统更有可能保留在水带,口渴后很长一段时间内,口渴的非零值往往会随机驱动持续的水选择。通过固定的“刺激”因子为18(10 s,10 s或1,000个模拟步骤),通过固定的“刺激”因子为18(对检测到的口渴刺激的口渴刺激剂量的固定刺激刺激,以hunim the and the nunim的限制;对数与所得景观梯度幅度相关)。图3i显示了模拟的口渴扰动对食物和水能井中心之间的界线的影响。在饥饿的小鼠的背景下,在1小时长的模拟会议上模拟了25个刺激时期的光遗传学刺激,并以奖励反馈设置为0,以简化分析。重复模拟会话以匹配相应的实验数据集中的行为会话数量。

  我们在没有行为的情况下模拟了饥饿和口渴小鼠中的光遗传学口渴实验(图4K,M,O和扩展数据图10F)。如上所述进行了这些模拟,但饥饿H0的初始值设置为2.25,而口渴的T0设置为0.8,而在18持续时间为10 s的额外的光遗传学口渴。这些模拟的光遗传学扰动重复了25次,其时间与实际实验相同的时间(每1分钟一次光遗传脉冲发作)。对3个模拟运行进行了模拟参数,产生了75个模拟的口渴刺激时期。

  为了评估选择动力学的替代模型(扩展数据图9),其中开关是由外部强迫函数驱动的(而不是通过噪声和梯度之间的平衡自主),我们保留了能量景观结构,但修改了噪声量表,以使得在模拟的持续时间内没有自发地发生开关。这种变化的效果将我们的模型减少到多稳定的吸引子系统,在该系统中,过渡完全依赖于系统的外部输入。然后,我们加入了一个随机出现的输入力,足以将系统从一个景观中推动到另一个景观。我们没有向这种力量添加噪声,因为它将减少成功的过渡次数以下。通常,增加增加力上的噪声需要增加外部力量事件的频率,以便该替代模型与我们寻求将其比较的扩散景观模型的区别程度不大。

  使用沿目标维度的位置的当前试验值(通过在实验数据中进行模拟或测量的阶段肖像(扩展数据图9),通过将基线活性预测到山脊回归拟合的目标维度上,与正则化的目标变化(沿着试验的距离沿距离的距离,沿距离距离的位置变化),生成了当前的位置值(通过在实验数据中进行模拟或测量)(在实验数据中进行测量或测量)。试验之间的平均时间)。根据奖励选择与以前的奖励(停留)或其他(Switch)相同,将试验分配给了停留或切换类别。如图9的传说中所述,对过渡区的停留和开关试验的密度进行了量化,并将其标准化为1。对于模型密度量化,对模型密度量化进行了1,000倍的重新采样1000倍,以使其数量和开关试验的数量(在所有模拟会话中)与实验数据集中的分数相匹配。该重新采样控制对量化密度的系统偏置(扩展数据图9g,h),这是由数据集开关速率的随机差异产生的。

  统计参数在图例中描述。盒子图横跨下四分位数;线表示中值值;晶须,值范围在四分位间范围内的1.5倍以内。除非另有说明,否则通过引导会产生置信区间。

  有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

左文资讯声明:未经许可,不得转载。