Prefrontal D1和D2受体对基于风险的决策的可分离贡献(2011)

 J Neurosci。 2011 Jun 8; 31(23):8625-33。

St Onge JR,Abhari H,Floresco SB。

来源

英属哥伦比亚大学心理学与脑研究中心,不列颠哥伦比亚省温哥华V6T 1Z4,加拿大

抽象

已经提出由不同量级的某些和不确定的奖励之间的选择由额叶和中脑皮质边缘多巴胺(DA)系统介导。 在大鼠中,DA活动的系统性操作或内侧前额叶皮层(PFC)的失活扰乱了关于风险和奖励的决策。 但是,目前还不清楚PFC DA传输如何促进这些过程。 我们通过检查D1和D2受体在内侧(前肢)PFC中的药理学操作对小,某些和大的概率奖励之间的选择的影响来解决这个问题。 对大鼠进行概率贴现任务训练,其中一个杠杆以100%概率递送一个小丸,另一个递送四个小丸,但是在试验块(100,50,25,12.5%)中接收奖励的概率降低。 内侧PFC中的D1阻塞(SCH23390)降低了对大/风险选项的偏好。 相比之下,D2封锁(eticlopride)降低了概率贴现并增加了风险选择。 D1激动剂SKF81297对大型/危险杠杆的偏好略有增加,但没有显着增加。 然而,D2受体刺激(喹吡罗)在决策制定中引起了真正的损害,使贴现曲线变平,并且当分别或多或少有利时,偏离或偏向风险期权。 这些研究结果表明,PFC D1和D2受体对风险/奖励判断做出了可分离但互补的贡献。 通过在D1 / D2受体活动之间取得良好平衡,DA可以帮助完善这些判断,促进对当前有利环境的利用或在条件变化时探索更有利可图的情况。

介绍

中脑皮质多巴胺(DA)系统的畸变与某些精神疾病相关的决策严重缺陷有关。 这些包括患有精神分裂症的人(Hutton等人,2002),帕金森氏病(Pagonabarraga等人,2007)和兴奋剂成瘾(Rogers等人,1999)。 决策的动物模型表明,DA传递的操纵可以深刻地改变小而容易获得的奖励与大而昂贵的奖励之间的选择。 对D1或D2受体的系统性阻断降低了等待更长或更努力工作以获得更大奖励的偏好,而增加的DA传播对基于努力或延迟的决策产生了不同的影响,增加或减少了对更大奖励的偏好。成本更高(Cousins等,1994; Cardinal等,2000; Denk等,2005; van Gaalen等,2006; Floresco等,2008a; Bardgett等,2009)。 类似地,当大鼠在概率性折扣任务中选择小的,某些的和大的但风险的奖励时,D1或D2拮抗剂的系统性管理降低了对大的,有风险的选择的偏好 (St. Onge和Floresco,2009)。 相反,D1或D2激动剂偏向大型风险选择。 然而,鉴于许多大脑区域涉及风险/奖励判断(例如,额叶,腹侧纹状体,杏仁核)(Floresco等,2008b),DA可能作用于影响这些过程的终端区域仍不清楚。

DA调节由前额叶皮层(PFC)的不同区域介导的多种认知功能,例如行为灵活性,工作记忆和注意过程(Williams和Goldman-Rakic,1995; Granon等,2000; Chudasama和Robbins,2004; Floresco等,2006), 通常采用“倒U”形曲线,其中DA活动太少或太多会损害某些执行功能。 然而,相对较少的研究调查PFC DA传播对不同形式的成本/效益决策的贡献。 减少前扣带回的DA活动改变了基于努力的决策(Schweimer等,2005; Schweimer和Hauber,2006),而内侧PFC D1受体的阻断或刺激降低了对更大,延迟奖励的偏好(Loos等,2010) )。 值得注意的是,没有研究调查不同PFC DA受体对基于风险的决策的贡献。

最近的工作已经确定了前肢内侧PFC作为概率折扣调解的关键区域,而其他子区域(前扣带,眶前,岛)的活动似乎没有促成这种行为(St. Onge和Floresco,2010)。 内侧PFC的失活增加了对较大的概率奖励的偏好,当获得它们的几率在一个疗程中减少时,但当奖励概率在一个疗程中增加时选择减少。 这项研究的结果使我们得出结论,内侧PFC用于整合有关改变奖励概率的信息,以更新有助于更有效决策的价值表示。 鉴于中脑皮层DA在其他形式认知中的重要作用(Floresco和Magyar,2006),本研究使用概率折扣任务研究了前额D1 / D2受体活性对基于风险的决策的贡献。

材料和方法

动物。

在行为训练开始时,雄性Long-Evans大鼠(Charles River实验室)重275-300 g,用于实验。 到达后,给予大鼠1周的时间使其适应菌落,并且在进行行为训练之前,再将食物限制在其自由进食重量的85–90%的范围内。 在实验期间,大鼠自由饮水。 在实验当天结束时,在大鼠的家笼中进食,并每天监测体重,以确保食物限制和维持过程中体重稳定减少或在其余实验中体重增加。 所有测试均根据加拿大动物保护委员会和不列颠哥伦比亚大学的动物保护委员会进行。

仪器。

在12操作室(30.5×24×21 cm; Med Associates)中进行行为测试,所述室内封闭在声音衰减盒中,每个室都配有风扇以提供通风并掩盖外来噪音。 每个腔室配有两个可伸缩的杠杆,一个位于中央食物容器的每一侧,其中通过颗粒分配器递送食物增强物(45 mg; Bio-Serv)。 腔室由位于与杠杆相对的壁的顶部中心的单个100 mA室内灯照明。 四个红外光束安装在每个腔室的侧面。 通过在会话期间发生的光束断裂的数量来指示运动活动。 所有实验数据由通过接口连接到腔室的IBM个人计算机记录。

杠杆训练。

我们的初始培训方案与St. Onge和Floresco(2009)相同,改编自Cardinal等。 (2000)。 在他们第一次暴露于室内的前一天,在他们的家笼中给予大鼠~25糖奖励颗粒。 在训练的第一天,将2-3颗粒递送到食物杯中,并且在将动物放入室中之前将压碎的颗粒置于杠杆上。 首先在固定比率1计划下训练大鼠至60 min中的30按压标准,首先针对一个杠杆,然后针对另一个杠杆重复训练(在受试者之间平衡左/右)。 然后在完整任务的简化版本上训练大鼠。 这些90试验会议开始时杠杆缩回,操作室在黑暗中。 每个40,一个试验是在室内灯光照射和两个杠杆中的一个插入腔室的情况下开始的。 如果大鼠未能在10内对杠杆做出反应,则杠杆缩回,腔室变暗,试验被评为遗漏。 如果大鼠在10内响应,则杠杆缩回并且以50%概率递送单个颗粒。 该程序用于使大鼠熟悉完整任务的概率性质。 在每对试验中,左或右杠杆被呈现一次,并且这对试验中的顺序是随机的。 对大鼠进行~5-6 d训练至80标准或更成功的试验(即≤10遗漏)。

概率贴现任务。

之前已经描述了这些研究中使用的主要任务(Floresco和Whelan,2009; Ghods-Sharifi等,2009; St. Onge和Floresco,2009,2010; 圣 Onge等人,2010),最初是由Cardinal和Howes(2005)描述的(图。 1)。 简言之,大鼠每天接受由72试验组成的会话,分成4试验的18块。 整个过程完成48分钟,动物每周训练6-7 d。 会议在黑暗中开始,两个杠杆都缩回(交互状态)。 每个40都开始试验,照明室内灯,然后3 s将一个或两个杠杆插入腔室(单个试验的格式如图1所示)。 1)。 一个杠杆被指定为大/危险杠杆,另一个杠杆被指定为小/一定杠杆,其在整个训练期间保持一致(平衡左/右)。 如果老鼠没有通过在10的杠杆呈现内按下杠杆来响应,则腔室被重置为交互状态,直到下一次试验(遗漏)。 当选择杠杆时,两个杠杆都缩回。 小/特定杠杆的选择总是提供一个100%概率的颗粒; 大型/危险杠杆的选择提供了4颗粒,但具有特殊的可能性。 当食物被送出后,房屋灯在做出响应之后仍然继续用于另一个4,之后房间恢复到了间隙状态。 将多个颗粒分开递送0.5。 4块由8强制选择试验组成,其中仅呈现一个杠杆(每个杠杆的4试验,成对随机化),允许动物了解在每个块中获得更大或更小奖励的相对可能性。 接下来是10自由选择试验,其中两个杠杆都被呈现,动物选择小/一定或大/风险杠杆。 在按下大/危险杠杆后获得4颗粒的概率在块之间变化:对于每个连续的块,它最初分别是100%,然后是50%,25%和12.5%。 每次试验获得大额奖励的概率来自一组概率分布。 使用这些概率,选择大/危险杠杆在前两个区块中是有利的,并且在最后一个区块中是不利的,而大鼠在25%区块期间响应任一杠杆之后可以获得相同数量的食物颗粒。 因此,在该任务的最后三个试验块中,选择较大的奖励选项会带来在给定试验中未获得任何奖励的固有“风险”。 还记录了启动选择的潜伏期和整体运动活动(光束破裂)。 对大鼠进行任务训练,直到作为一组,他们(1)在第一次试验阻滞期间(100%概率)在成功试验的至少80%中选择了大/风险杠杆,并且(2)证实了稳定的基线水平选择,使用类似于Winstanley等人描述的程序评估。 (2005)和圣 Onge和Floresco(2009)。 简而言之,使用具有两个受试者内因子(白天和试验阻滞)的重复测量ANOVA分析来自三个连续会话的数据。

图1。

任务设计。 与概率折扣任务的任何杠杆(A)和单一自由选择试验(B)的格式相关的成本/收益突发事件。

奖励幅度歧视任务。

正如我们之前所做的那样(Ghods-Sharifi等,2009; Stopper和Floresco,2011),我们先验地确定,如果特定治疗特别降低了对概率性折扣任务的大/风险杠杆的偏好,则单独的动物群将在奖励幅度辨别任务上进行训练和测试,以确定这种影响是否是由于区分与两个杠杆相关的奖励幅度的损害。 在这些实验中,如在概率折扣任务中那样训练大鼠按压可伸缩杠杆,之后他们接受歧视任务的训练。 在这里,老鼠选择一个提供一个颗粒的杠杆和另一个提供四个颗粒的杠杆。 在以100%概率的单个响应之后立即递送小奖励和大奖励。 会话由四个试验块组成,每个试验块由2强制选择和10自由选择试验组成。

手术。

一旦该组显示3连续天的稳定选择模式,对大鼠进行手术。 在达到稳定性标准后,给大鼠随意提供食物,然后2 d进行立体定向手术。 用100 mg / kg盐酸氯胺酮和7 mg / kg甲苯噻嗪麻醉大鼠,随后将双侧23规格不锈钢导管插入内侧PFC的前肢区域(扁平颅骨;前后位,+ 3.4 mm;内侧 - 外侧,±来自前囟的0.7 mm;和dorsoventral,来自硬脑膜的-2.8 mm)。 与引导插管末端齐平的30个测量仪罩住器保持在原位,直到进行输注。 给予大鼠至少7 d以在测试前从手术中恢复。 在该恢复期间,每天处理动物至少5分钟,并且将食物限制为其自由进食重量的85%。 每天连续监测体重,以确保在该恢复期间稳定的体重减轻。

微量输注方案。

在从手术中恢复之后,随后对概率折扣或奖励幅度辨别任务重新训练大鼠至少5 d,并且直到作为一组,他们显示出稳定的选择行为水平。 对于在第一次微量输注测试日之前的3 d,取出拇指导管并进行模拟输注程序。 将不锈钢注射器放置在引导插管中2 min,但不进行输注。 该程序使大鼠习惯于输注常规以减少随后测试日的压力。 在显示稳定折扣后的第二天,该组接受了第一次微量输注测试。

所有实验均使用受试者内设计。 使用以下药物:D1拮抗剂R - (+) - SCH23390盐酸盐(1.0μg,0.1μg; Sigma-Aldrich),D2拮抗剂盐酸依地普利(1.0μg,0.1μg; Sigma-Aldrich),D1受体激动剂SKF81297(0.4μg,0.1μg; Tocris Bioscience)和D2激动剂喹吡罗(10μg,1μg; Sigma-Aldrich)。 将所有药物溶解在生理0.9%盐水中,超声处理直至溶解,并避光。 我们小组和其他人都已经充分记录了所选择的剂量,以便在脑内给予时具有行为活性(Seamans等,1998; Ragozzino,2002; Chudasama和Robbins,2004; Floresco和Magyar,2006; Floresco等, 2006; Haluk和Floresco,2009; Loos等,2010)。

D1和D2拮抗剂,激动剂和生理盐水的输注通过连接到PE管和30测量套管的微量注射泵双侧输送到内侧PFC中,0.8测量套管以0.5μl/ 75的速率突出1 mm超过导向器末端秒。 将注射套管留在适当位置再施加10 min以允许扩散。 在行为测试之前,每只大鼠在其家笼中保持另一个XNUMX分钟。

使用四组单独的大鼠来测试四种化合物(D1拮抗剂,D2拮抗剂,D1激动剂,D2激动剂)中每种化合物的作用。 在特定治疗组的所有大鼠中,治疗顺序(盐水,低剂量,高剂量)是平衡的。 在第一个输液测试日之后,大鼠接受了基线训练日(无输液)。 如果对于任何单个大鼠而言,这一天选择的大/高杠杆与其输注前基线相差> 15%,则该大鼠在第二次输液测试之前要接受额外的训练。 在第二天,大鼠接受了第二次平衡输注,随后是另一个基线日,最后是最后一次输注。

组织学。

在完成所有行为测试后,在二氧化碳室中杀死大鼠。 取出脑并固定在4%福尔马林溶液中。 将大脑在50μm切片中冷冻并切片,然后安装并用甲酚紫染色。 参考Paxinos和Watson(1998)的神经解剖图谱验证了放置。 内侧PFC中可接受输注的位置显示在图2的右侧面板中。

图2。

组织学。 大鼠脑冠状切片的示意图显示了通过所有大鼠的内侧PFC的延髓 - 尾部范围的输注的可接受位置的范围。

数据分析。

兴趣的主要相关度量是针对每个自由选择试验的大/风险杠杆的选择百分比,其中包括试验遗漏。 对于每个区块,计算方法是将大型/风险杠杆的选择次数除以成功试验的总数。 使用双向(ANOVA)受试者内部方差分析分析每个药物组的选择数据,以治疗(盐水,低剂量,高剂量)和试验阻滞(100%,50%,25%,12.5%)作为受试者内部因素。 在所有折现实验中,选择数据块的主要作用均很显着(p <0.05),表明大鼠在较大的风险概率跨越四个块时都改变了选择大/风险杠杆的选择。 此效果将不再赘述。 用单向方差分析分析反应潜伏期,运动活动(光束断裂)和试验遗漏的次数。

上一节下一节

成果

最初在单独的实验中训练四组动物并将其分配给四个药物​​组中的一组。 指定用于D16和D1拮抗剂实验的前两组2在达到稳定选择性能和接受平衡微量输注测试之前需要平均28 d训练。 用于D14和D14激动剂的第二组1和2大鼠在达到稳定选择性能之前需要平均34 d的训练。 表1中显示了在所有四组的测试日获得的响应潜伏期,运动和试验遗漏数据。

表1。

在盐水或药物输注到内侧​​PFC后获得的运动,试验遗漏和响应潜伏期数据

D1和D2受体拮抗作用和概率折扣

D1封锁

最初,训练了16只大鼠用于该实验。 一只动物在手术中死亡,其他三只的数据由于放置不正确而被淘汰,最终n =12。对选择数据的分析表明,P1内输注D23390拮抗剂SCH2,22的PFC产生了显着的主要治疗效果(F(3.26)= 0.05,p = 6,66),但未进行任何处理×嵌段相互作用(F(0.92)= 23390,ns)。 高剂量的SCH1(0.05μg)显着降低了后三个区块中较大/风险较大的杠杆的偏好性(p <3;图0.1A),而低剂量(1μg)在选择行为上没有产生可靠的变化。 D2,22封锁对反应潜伏期(F(0.18)= 2,22,ns),试验遗漏(F(0.54)= 2,22,ns)或运动次数(F(1.66)= XNUMX,ns)无影响)。

图3。

内侧PFC中DA受体操纵对概率折现的影响。 在自由选择试验期间,通过概率块(x轴)根据大/小杠杆的百分比选择来绘制数据。 符号代表平均值±SEM。 灰星表示显着的主要作用(盐水与高剂量相比,p <0.05)。 黑星表示在特定概率块主效应期间治疗条件之间的显着差异(p <0.05)。 A,1.0μg剂量的D1拮抗剂SCH23390的输注会加速概率折现,从而减少风险选择。 B,相反,输注1.0μg剂量的D2拮抗剂依替普利能减缓贴现并增加风险选择。 C,D1激动剂SKF81297引起风险选择的轻微但无显着增加。 D,10μg剂量的D2激动剂喹吡罗的输注消除了折价,减少了初始阻断期间的风险选择,而增加了最终阻断期间的选择。

D2封锁

最初,训练了16只大鼠用于该实验。 一只动物在手术过程中死亡,另外三只的数据由于放置不正确而被剔除,最终n =12。对选择数据的分析还显示出治疗的主要效果(F(2,22)= 3.76,p <0.05)但无治疗×阻断相互作用(F(6,66)= 0.84,ns)。 但是,与D1受体阻滞作用相反,高剂量的埃替普利德(1μg)显着增加了所有剂量块对较大/风险杠杆的偏好(p <0.05;图3B),而低剂量(0.1μg) )会产生轻微但不明显的选择增加。 依替普利特对响应潜伏期(F(2,22)= 0.63,ns),试验遗漏(F(2,22)= 1.45,ns)或运动计数(F(2,22)= 0.99,ns)没有影响。 因此,内侧PFC中D1或D2受体的阻滞对概率折扣具有定性相反的影响。 降低D1受体活性会增加较大的不确定奖励的折现,而D2受体拮抗作用则减少折现,分别反映为明显的减少和危险选择的增加。

D1和D2受体刺激和概率折扣

D1刺激

最初,训练14大鼠进行该实验。 一只动物在手术期间死亡,并且排除了来自一只大鼠的数据,因为他的基线选择数据是2 SD低于该组其余部分的平均值,导致最终n = 12。 在将D1激动剂SKF81297施用到内侧PFC中后,大鼠倾向于显示出与D1拮抗剂诱导的效果相反的效果,显示出对大/危险杠杆的偏好的适度增加,这种效果在数值上更大。较低,0.1μg剂量。 尽管存在这种趋势,但选择数据的分析并未显示出治疗的显着效果(F(2,22)= 2.05,ns)或治疗×阻滞相互作用(F(6,66)= 0.10,ns;图3C),尽管是直接的低剂量和盐水治疗条件之间的比较确实显示出统计学显着性的趋势(p = 0.086)。 D1激动剂对响应潜伏期(F(2,22)= 0.67,ns),试验遗漏(F(2,22)= 0.06,ns)或运动计数(F(2,22)= 0.36,ns)也没有影响。

D2刺激

再次,训练14只大鼠用于该实验。 排除了一只大鼠的数据,因为他的基线选择数据在训练34天后没有出现明显的折衷,而另一只大鼠的数据由于放置不准确而被消除,最终该组的n = 12。 与DA受体拮抗剂或D2激动剂诱导的选择相比,用D1激动剂喹吡罗治疗可产生独特的选择效果。 选择数据的分析显示,没有显着的主要治疗效果(F(2,22)= 0.05,ns),但是存在显着的治疗×嵌段相互作用(F(6,66)= 2.33,p <0.05,Dunnett's p <0.05)。 简单的主效应分析进一步表明,尽管低剂量(1μg)喹吡罗对选择没有影响,但高剂量(10μg)导致贴现曲线明显“展平”。 具体而言,相对于生理盐水注入,该剂量显着(p <0.05)减少了最初100%阻滞中大/高风险杠杆的选择,但显着增加了最后一个阻滞期间(12.5%)的风险选择(图3D)。 此外,在输注盐水或1.0μg剂量的喹吡罗后,大鼠显示出较大/风险选项的显着折扣,因为获得更大奖励的几率在整个疗程中均降低(p <0.005)。 相比之下,在用10μg喹吡罗治疗后的四个区块中,该选项的选择比例没有显着变化(p> 0.25)。 喹吡罗对试验遗漏(F(2,22)= 0.84,ns)或运动计数(F(2,22)= 1.72,ns)没有影响,尽管高剂量显着增加了四个区块的选择潜伏期(F( 2,22)= 3.54,p <0.05和Dunnett's,p <0.05;表1)。

赢得/失败 - 转移分析

将选择性D1或D2受体激动剂或拮抗剂输注到内侧​​PFC中,每次都会对决策产生明显的影响。 为了进一步了解这些处理方式如何影响选择模式以及折价变化,我们对选择数据进行了补充分析。 具体来说,我们进行了选择选择分析,以识别行为变化是否是由于获得更大的奖励(获胜者表现)后选择风险杠杆的可能性改变或负反馈敏感性的改变(损失转移)引起的。性能)(Bari等,2009; Stopper和Floresco,2011)。 根据先前每次自由选择试验的结果(奖励或不奖励)分析任务期间动物的选择,并以比例表示。 获胜保留试验的比例是根据大鼠在先前的试验中选择有风险的选项并获得大额奖励(获胜)后选择大/高风险杠杆的次数除以自由选择总数得出的老鼠获得更大奖励的试验。 相反,根据先前试验中选择有风险的选项后,大鼠将选择转移到小杠杆/特定杠杆上的次数乘以自由选择试验的总次数,则计算出损失转移性能。造成损失。

由于任务的概率性质,在四个实验中至少有4-5个体,其中个体动物要么没有选择大/有风险的杠杆(因此,在获胜后不能“停留”或“转移”或损失)或在某个概率块(特别是后两个块)期间根本没有获得大的奖励。 因此,在这些情况中的任何一种情况下,用于计算这些比率的等式中的分母对于至少一个块将是零,这使我们无法对这些数据进行逐块分析。 为了解决这个问题,正如我们之前所做的那样,对四个区块内的所有试验进行了分析(Stopper和Floresco,2011)。 获胜 - 保持绩效的变化被用作获得大的,有风险的奖励对后续选择行为的影响的一般指标,而失败性能的变化在整个测试期间作为负反馈敏感度的指标。会话。

鉴于四种化合物中的每一种都会对选择行为产生不同的影响,我们对直接比较每种化合物相对于盐水处理的影响特别感兴趣。 对于此分析,我们使用了每种药物的最有效剂量和相应的媒介物注射治疗后获得的数据(对于SKF81297,我们使用了0.1μg较低剂量治疗后获得的数据)。 对获胜和失访试验的分析显示,试验类型(获胜与失访)×治疗(盐水与药物)×受体(D1与D2)×药物类型(拮抗剂与激动剂)之间存在显着的四向相互作用。 )(F(1,44)= 11.92,p <0.05;图4,表2)。 正如对整体选择行为的分析所观察到的,这种四向相互作用是由以下事实驱动的:每种药物都对胜任/失败转变趋势产生了明显的影响。 关于获胜保持表现,在控制条件下,大鼠表现出很强的趋势(80%至90%),在先前的试验中选择此杠杆并获得奖励后,就选择了风险杠杆,正如我们先前所观察到的(Stopper和Floresco ,2011)。 相反,在对照条件下约有25%至30%的试验中,选择大/高风险杠杆后,动物倾向于在“损失”后转向小/特定杠杆。

图4。

PFC DA受体操作对获胜(灰色条)和失效(白色条)倾向的影响。 为了清楚和比较的目的,这里根据药物与盐水处理获得的比率之间的差异得分来呈现数据(正值表示增加的比率,负值表示药物处理后相对于对照输注的减少)。 在获得这些值的整体分析中使用的原始数据列于表2中。 Win-stay比率指示在先前试验中获得较大奖励后,大鼠选择大/危险杠杆的试验比例。 失去比率指数大鼠/选择大型/危险杠杆后,大鼠将选择权转移到小/某个杠杆的试验比例。 星号表示与0.05水平的盐水有显着差异。 ns,并不重要。

表2。

输注生理盐水和最高或最有效剂量的D1和D2拮抗剂或激动剂后进行概率贴现任务的大鼠的获胜/失败率

对四向相互作用的简单主效应分析表明,D1拮抗剂SCH23390不会影响获胜保持表现,但确实会显着增加失移趋势(邓尼特,p <0.05),表明这些治疗方法诱发的风险选择降低可能部分归因于对负面反馈的敏感性提高(即,奖励遗漏)。 相比之下,用艾替洛必利(2μg)进行的D1阻断显着增加了在“获胜”之后选择风险选项的可能性(p <0.05),同时导致失移趋势没有明显降低。 因此,由D2封锁引起的风险选择的增加似乎主要归因于获得较大奖励的后续选择的增强影响。

与盐水相比,D1激动剂SKF81297(0.1μg)显着提高了获胜保持性能(p <0.05),但也具有SCH23390的相反作用,减少了因大/高风险杆损失而移位的趋势(p <0.05) 。 相比之下,喹吡罗(10μg)对D1激动剂的获胜倾向有相反的影响,显着降低了“获胜”后选择大/高风险杠杆的可能性(p <0.05),表明对接收的敏感性降低更大但不确定的奖励该处理对丢包率没有显着影响。 这些发现表明,D1对D2受体的调节引起选择性能的差异性变化,似乎表现为获得较大奖励或负反馈敏感性的影响发生明显变化。

奖励幅度歧视

在贴现任务的某些试验块期间,阻断D1受体或刺激D2受体降低了对较大的,不确定的奖励的偏好。 为了评估这些影响是否归因于区分不同大小的奖励的普遍中断,我们进行了另一个实验,其中两个独立的大鼠组在更简单的任务上进行训练。 大鼠在两个杠杆之间选择,其递送一个或四个颗粒,两者都具有100%概率。 在接受高剂量SCH11(23390μg)或喹吡罗(1μg)和盐水的平衡微量输注之前,对该任务训练15只大鼠进行10 d训练。 由于放置不准确,移除了一只动物的数据,在SCH6组中留下了23390的最后n个,在喹吡罗组中留下了8。

D1封锁

输注盐水后,大鼠表现出对更大奖励的强烈偏见,在近100%的试验中选择了此选项(图5A)。 输注SCH23390(1μg)后,对四丸选项的偏好没有变化(F(1,5)= 1.72,ns)。 与选择相反,我们确实看到在D1封锁后反应潜伏期略有增加(生理盐水= 0.81±0.1 s,SCH23390 = 0.98±0.1 s; F(1,5)= 7.18,p <0.05)。 运动能力(F(1,5)= 4.86,ns)和试验遗漏(F(1,5)= 1.0,ns)不受SCH23390的影响。 因此,即使在概率折扣任务中输注此剂量的SCH23390会减少对较大奖励选项的选择,但这种效果似乎并不归因于较大奖励的主观价值的普遍下降。

图5。

内侧PFC中DA受体调节对奖励量级鉴别的影响。 训练大鼠以选择两个杠杆,其在单次按压后立即以100%概率递送四个或一个颗粒奖励。 A,D1阻断(SCH23390,1μg)在自由选择试验期间相对于盐水处理没有显着破坏对较大的四颗粒奖励的偏好。 B,D2受体刺激(喹吡罗,10μg)也没有改变对大奖励的偏好。

D2受体刺激

对于在内侧PFC中接受高剂量(10μg)喹吡罗的大鼠,观察到类似的选择。 同样,在输注盐水后几乎所有的自由选择试验中,大鼠都选择了四粒药。 D2受体的刺激并没有改变这种偏好(F(1,6)= 0.53,ns;图5B)。 喹吡罗尔对潜伏期,运动或遗忘也没有显着影响(所有F值<1.76,ns)。 注意,在第一个100%的概率块中,相似的处理确实减少了对概率性折现任务选择较大奖励的选择(图3B)。 对此差异的可能解释是,与接受奖励幅度歧视训练的老鼠不同,接受贴现任务训练的老鼠已经知道,大/风险期权的相对效用会在一个疗程中降低。 因此,与较大的奖励方案的相对价值相比,它们在较简单任务中受训的老鼠的表现更不稳定,因此更容易受到干扰。 总体而言,该实验的结果表明,即使对D1受体的阻滞和对D2受体的刺激极大地改变了小概率,肯定概率和大概率奖励之间的选择,但这些影响似乎并不归因于辨别能力的更根本性损害在较大和较小的奖励之间。

讨论

在这里,我们报告内侧PFC中的D1和D2受体对概率与某些奖励之间的选择产生了重要影响。 此外,降低或增加这些受体中每一种的活性产生了不同的,有时是相反的选择变化,这表明它们各自对这些决策过程发挥独特但互补的调节控制。

D1 / D2受体阻断的影响

据我们所知,这是第一次证明在内侧PFC中阻断D1或D2受体会对行为产生相反的影响。 以前的这类研究已经揭示D1,但不是D2,拮抗作用破坏注意力或工作记忆等功能(Williams和Goldman-Rakic,1995; Seamans等,1998; Granon等,2000)或两者都有受体协同作用以促进远离条件性处理器的移位或偏置行为(Ragozzino,2002; Floresco和Magyar,2006)。 我们的研究结果表明,SCH23390和eticlopride对选择产生了相反的影响,这表明正常决策依赖于额叶D1和D2受体活性的关键平衡,并且改变这种平衡会引起某些/不确定奖励选择的可分离变化。

PFC D1封锁以剂量依赖的方式降低对大/风险选项的偏好, 在最后三个概率块中最突出。 SCH23390增加了概率性折扣,类似于全身给药时该化合物的作用(St. Onge和Floresco,2009)。 有趣的是,通过酪氨酸耗竭减少人类受试者的DA传播也导致剑桥赌博任务(McLean等人,2004)的更保守和更差的质量决策。 我们的研究结果表明,这些影响可能部分是由减少的前额D1激活所介导的。 逐选择分析进一步表明,这种对风险期权的偏好降低与在未经奖励的风险选择之后选择小/某选择的趋势增加有关,这表明对决策的影响可能是增加的结果。对负面反馈的敏感性。 类似地,阻断前肢或前扣带回的D1受体,当它们被延迟(Loos等,2010)或与更大的努力成本相关时(Schweimer和Hauber,2006),降低了对更大奖励的偏好。 总的来说,这些研究结果表明,PFC D1信号对成本/效益评估产生了深远的影响,有助于克服可能与更大的奖励相关的成本,以最大化长期收益。

与之形成鲜明对比的是,PFC D2受体阻断增加了对大/风险选项的偏好,减缓了选择偏差的转变,因为奖励概率在一个疗程中减少。 值得注意的是,这种效果类似于在类似任务条件下由PFC灭活诱导的效应(St.Onge和Floresco,2010)。 但是,我们认为这并不反映“风险”行为本身普遍增加。 相反,我们之前的研究结果使我们得出结论,内侧PFC在监测奖励概率的变化以相应地调整行为方面起着关键作用。 目前的结果扩展到这一点,揭示了D2受体对决策制定的这一方面的PFC调节做出了重要贡献。 风险选择的明显增加在前一次试验获得大量奖励后选择风险期权的趋势增加更为突出。 因此,D2封锁不是整合关于在多次试验中获得更大奖励的可能性的信息,而是导致收到更大的奖励,以对后续选择的方向施加更大和更直接的影响。 这与人类最近的一项研究一致,其中D2拮抗作用增加了与更高奖励概率相关的选择和心室内PFC活性的相应变化(Jocham等,2011)。 总的来说,这些研究结果表明,PFC D1和D2受体对决策制定形成了独特而又互补的贡献。 D1受体活动促进选择更大但不确定或更昂贵的奖励,而D2受体减轻了更大的概率奖励对选择偏差的直接影响,促进了在获得这些奖励的可能性时长期调整行为的能力变化。

D1 / D2受体刺激的作用

在已经显示对其他形式的认知(注意力,工作记忆)产生不同影响的剂量范围内,D1受体激动剂SKF81297的PFC内输注没有显着改变风险选择,尽管这些治疗稍微增加了对大的/危险的杠杆,最重要的是低剂量。 应谨慎对待这种无效效应的解释,因为这些非单调剂量/反应效应表明SKF81297可能具有比其他认知功能更窄的有效剂量范围。 此外,0.1μg剂量确实显着改变了选择模式,增加了获胜 - 停留性能和减少失败趋势,其中大鼠更有可能在奖励和奖励遗漏之后选择大/风险杠杆。 然而,增加剂量的SKF81297没有显着改变选择的事实表明PFC D1受体的超常正常刺激不会实质上干扰关于风险和奖励的决策。 相比之下,类似的治疗减少了更大,延迟奖励的选择(Loos等,2010),提供了进一步的支持,即不同类型的成本/效益决策可以在药理学上分离。

D2激动剂喹吡罗在决策中引起了真正的“损伤”,显着缩小了贴现曲线,大鼠在奖励概率变化时没有显示出可辨别的折扣。 100%块中的四颗粒选择的选择减少(当它是最有利的时),但是在12.5%块中增加(当它是最不利的时)。 在D2刺激后,相对于盐水(〜73%),大/风险选择的总体比例没有变化,但是动物对这些概率的变化完全不敏感。 因此,过度的D2受体激活严重干扰了调整选择的能力,显然导致大鼠跨越块使用更简单的交替策略,同时保持对大/危险杠杆的偏向。 这一发现与依地普利的作用相结合, 表明内侧PFC中D2(而不是D1)受体基调的相对水平对决策的这一方面有重要影响,增加或减少这种活动会影响性能.

喹吡罗产生的不利选择模式与通过长期自由喂养降低食物动力所引起的模式非常相似(St. Onge和Floresco,2009)。 这些互补的发现使人们很容易推测它们可能是相关的现象。 实际上,已提出内侧PFC DA流出的变化反映广义食物奖励或激励动机信号(Ahn和Phillips,1999; Winstanley等,2006)。 因此,随着时间的推移获得的奖励数量的变化可以通过相应的中间皮层DA水平的波动向PFC发信号通过D2受体上的动作,可以用于检测随时间获得的奖励量的变化并且促进选择偏见。 因此,泛滥D2受体可能会破坏这种动态信号,最终可能会产生更多的静态模式。

PFC D1和D2受体对基于风险的决策的不可分离的贡献

问题仍然是为什么封锁D1或D2受体应该对风险选择产生相反的影响,因为内源性DA激活两种受体。 关于这些受体如何差异地影响PFC神经网络活动的当代理论可以提供对该问题的深入了解(Durstewitz等,2000; Seamans和Yang,2004)。 已经提出D1受体减少弱输入的影响,稳定网络活动,使得单个表示支配PFC输出。 相反,D2活动减弱了抑制性影响,允许PFC神经系统处理多种刺激/表征,将这些网络置于更加不稳定的状态,这可能允许表示的变化.

在此处使用的概率折扣任务的不同阶段期间,某些点处的动物必须维持(在概率块内)或修改(跨块)它们对大/风险期权的相对值的表示。 因此,这里描述的D1 / D2拮抗作用的相反作用可以反映这些受体在任务的不同阶段的不同贡献。 D1活动可以稳定特定区块内风险期权的相对长期价值的表示,即使风险选择导致奖励遗漏(保持“关注奖励”),也能维持选择偏差。 阻断这些受体会使动物对奖励遗漏更敏感(即增加失败倾向),并减少风险选择。 相反,由于大/风险选项产生的跨越块的奖励较少,D2受体(可能在不同的神经元群体上)可能促进价值表示的修改。 因此,减少它们的活动会破坏这些表示的更新以及选择偏差的相应变化。 该模型还可以部分地解释增加D1和D2受体活性的影响,这预期会导致更大的持续选择大/风险选项或分别诱导“超灵活”状态。 因此,我们的研究结果表明,PFC DA基调对风险/报酬判断做出了重要而复杂的贡献。 通过在D1 / D2受体活动之间取得良好平衡,中间皮层DA可以帮助改善不同规模和不确定性的选择之间的成本/收益决策,促进对当前有利环境的利用或在条件变化时探索更有利可图的情况。

脚注

这项工作得到了加拿大卫生研究院(MOP 89861)的资助,SBFSBF是Michael Smith健康研究高级学者基金会,JRSO是加拿大自然科学和工程研究委员会和Michael的奖学金获得者。史密斯健康研究基金会。

通讯应发给不列颠哥伦比亚大学心理学和脑研究中心的Stan B. Floresco博士,温哥华2136 West Mall,V6T 1Z4, [电子邮件保护]

版权所有©2011作者0270-6474 / 11 / 318625-09 $ 15.00 / 0

参考资料

1。 ↵

1。 安S,

2。 菲利普斯股份公司

(1999)多巴胺能相关的内侧前额叶皮层和大鼠伏核的感觉特异性饱腹感。 J Neurosci 19:RC29,(1-6)。

摘要/免费全文

2。 ↵

1。 Bardgett ME,

2。 Depenbrock M,

3。 唐氏N,

4。 点M,

5。 绿色L

(2009)多巴胺调节大鼠基于努力的决策。 Behav Neurosci 123:242-251。

CrossRefMedline

3。 ↵

1。 巴里A,

2。 Eagle DM,

3。 Mar AC,

4。 罗宾逊ES,

5。 罗宾斯TW

(2009)去甲肾上腺素,多巴胺和5-羟色胺摄取阻断对大鼠停止任务表现的可分离作用。 精神药理学205:273-283。

CrossRefMedline

4。 ↵

1。 红衣主教RN,

2。 Howes NJ

(2005)伏核核心病变对大鼠小额奖励和大量不确定奖励之间选择的影响。 BMC Neurosci 6:37。

CrossRefMedline

5。 ↵

1。 红衣主教RN,

2。 罗宾斯TW,

3。 Everitt BJ

(2000)d-苯异丙胺,氯氮卓,α-氟哌噻嗪和行为操作对大鼠信号和无信号延迟强化的选择的影响。 精神药理学152:362-375。

CrossRefMedline

6。 ↵

1。 Chudasama Y,

2。 罗宾斯TW

(2004)多巴胺能调节啮齿动物前额叶皮层的视觉注意力和工作记忆。 神经精神药理学29:1628-1636。

CrossRefMedline

7。 ↵

1。 考辛斯MS,

2。 魏伟,

3。 Salamone JD

(1994)同时杠杆按压/喂养选择程序的性能的药理学表征:多巴胺拮抗剂,胆碱模拟物,镇静剂和兴奋剂药物的作用。 精神药理学116:529-537。

CrossRefMedline

8。 ↵

1。 Denk F,

2。 Walton ME,

3。 詹宁斯KA,

4。 夏普T,

5。 拉什沃思MF,

6。 Bannerman DM

(2005)血清素和多巴胺系统在延迟或努力的成本效益决策中的差异性参与。 精神药理学179:587-596。

CrossRefMedline

9。 ↵

1。 Durstewitz D,

2。 Seamans JK,

3。 Sejnowski TJ

(2000)工作记忆的神经计算模型。 Nat Neurosci 3(Suppl):1184-1191。

CrossRefMedline

10。 ↵

1。 Floresco SB,

2。 马扎尔奥

(2006)中间皮质多巴胺调节执行功能:超出工作记忆。 精神药理学188:567-585。

CrossRefMedline

11。 ↵

1。 Floresco SB,

2。 惠兰JM

(2009)由重复苯丙胺暴露引起的不同形式的成本/效益决策的扰动。 精神药理学205:189-201。

CrossRefMedline

12。 ↵

1。 Floresco SB,

2。 Magyar O,

3。 Ghods-Sharifi S,

4。 Vexelman C,

5。 谢谢MT

(2006)大鼠内侧前额叶皮层中的多种多巴胺受体亚型调节移位。 神经精神药理学31:297-309。

CrossRefMedline

13。 ↵

1。 Floresco SB,

2。 谢谢MT,

3。 Ghods-Sharifi S.

(2008a)多巴胺能和谷氨酸能力调节努力和基于延迟的决策。 神经精神药理学33:1966-1979。

CrossRefMedline

14。 ↵

1。 Floresco SB,

2。 St Onge JR,

3。 Ghods-Sharifi S,

4。 Winstanley CA.

(2008b)Cortico-limbic-striatal circuit提供不同形式的成本效益决策。 Cogn Affect Behav Neurosci 8:375-389。

CrossRefMedline

15。 ↵

1。 Ghods-Sharifi S,

2。 St Onge JR,

3。 Floresco SB

(2009)基底外侧杏仁核对不同决策形式的基本贡献。 J Neurosci 29:5251-5259。

摘要/免费全文

16。 ↵

1。 Granon S,

2。 Passetti F,

3。 托马斯KL,

4。 达利JW,

5。 Everitt BJ,

6。 罗宾斯TW

(2000)将D1多巴胺能受体药物输注到大鼠前额叶皮质后,注意力增强和受损。 J Neurosci 20:1208-1215。

摘要/免费全文

17。 ↵

1。 Haluk DM,

2。 Floresco SB

(2009)腹侧纹状体多巴胺调节不同形式的行为灵活性。 神经精神药理学34:2041-2052。

CrossRefMedline

18。 ↵

1。 赫顿SB,

2。 墨菲FC,

3。 Joyce EM,

4。 罗杰斯RD,

5。 卡斯伯特一世,

6。 巴恩斯TR,

7。 McKenna PJ,

8。 Sahakian BJ,

9。 罗宾斯TW

(2002)首发和慢性精神分裂症患者的决策缺陷。 Schizophr Res 55:249-257。

CrossRefMedline

19。 ↵

1。 Jocham G,

2。 Klein TA,

3。 Ullsperger M.

(2011)纹状体和腹内侧前额叶皮层中多巴胺介导的强化学习信号是基于价值的选择的基础。 J Neurosci 31:1606-1613。

摘要/免费全文

20。 ↵

1。 Loos M,

2。 Pattij T,

3。 Janssen MC,

4。 Counotte DS,

5。 Schoffelmeer AN,

6。 Smit AB,

7。 Spijker S,

8。 van Gaalen MM

(2010)内侧前额叶皮质中的多巴胺受体D1 / D5基因表达预测大鼠的冲动选择。 Cereb Cortex 20:1064-1070。

摘要/免费全文

21。 ↵

1。 麦克莱恩A,

2。 鲁宾斯坦JS,

3。 罗宾斯TW,

4。 Sahakian BJ

(2004)正常健康志愿者中酪氨酸耗竭的影响:对单相抑郁症的影响。 精神药理学171:286-297。

CrossRefMedline

22。 ↵

1。 Pagonabarraga J,

2。 García-SánchezC,

3。 Llebaria G,

4。 Pascual-Sedano B,

5。 Gironell A,

6。 库利塞夫斯基

(2007)帕金森氏病决策和认知障碍的对照研究。 Mov Disord 22:1430–1435。

CrossRefMedline

23。 ↵

1。 Paxinos G,

2。 沃森C.

(1998)立体定位坐标中的大鼠脑(学术,圣地亚哥),Ed 4。

24。 ↵

1。 Ragozzino ME

(2002)多巴胺D(1)受体阻滞在前肢 - 边缘区域对行为灵活性的影响。 Learn Mem 9:18-28。

摘要/免费全文

25。 ↵

1。 罗杰斯RD,

2。 Everitt BJ,

3。 Baldacchino A,

4。 Blackshaw AJ,

5。 Swainson R,

6。 Wynne K,

7。 贝克NB,

8。 猎人J,

9。 Carthy T,

10。 布克E,

11。 伦敦M,

12。 迪肯JF,

13。 Sahakian BJ,

14。 罗宾斯TW

(1999)对慢性安非他明滥用者,阿片类药物滥用者,前额叶皮层局灶性损害患者和色氨酸耗竭的正常志愿者的决策认知存在不可分离的缺陷:单胺能机制的证据。 神经精神药理学20:322-339。

CrossRefMedline

26。 ↵

1。 Schweimer J,

2。 豪伯W

(2006)前扣带皮层中的多巴胺D1受体调节基于努力的决策。 Learn Mem 13:777-782。

摘要/免费全文

27。 ↵

1。 Schweimer J,

2。 Saft S,

3。 豪伯W

(2005)儿茶酚胺神经传递参与大鼠前扣带回与努力相关的决策。 Behav Neurosci 119:1687-1692。

CrossRefMedline

28。 ↵

1。 Seamans JK,

2。 杨CR

(2004)前额皮质中多巴胺调节的主要特征和机制。 Prog Neurobiol 74:1-58。

CrossRefMedline

29。 ↵

1。 Seamans JK,

2。 Floresco SB,

3。 菲利普斯股份公司

(1998)D1受体调节海马 - 前额皮质回路整合空间记忆与大鼠的执行功能。 J Neurosci 18:1613-1621。

摘要/免费全文

30。 ↵

1。 St Onge JR,

2。 Floresco SB

(2009)多巴胺能调节基于风险的决策。 神经精神药理学34:681-697。

CrossRefMedline

31。 ↵

1。 St Onge JR,

2。 Chiu YC,

3。 Floresco SB

(2010)多巴胺能操作对风险选择的不同影响。 精神药理学211:209-221。

CrossRefMedline

32。 ↵

1。 St Onge JR,

2。 Floresco SB

(2010)前额皮质对基于风险的决策的贡献。 Cereb Cortex 20:1816-1828。

摘要/免费全文

33。 ↵

1。 塞子CM,

2。 Floresco SB

(2011)伏隔核及其子区域对基于风险的决策的不同方面的贡献。 Cogn Affect Behav Neurosci 11:97-112。

CrossRefMedline

34。 ↵

1。 van Gaalen MM,

2。 van Koten R,

3。 Schoffelmeer AN,

4。 Vanderschuren LJ

(2006)多巴胺能神经传递在冲动性决策中的重要参与。 Biol Psychiatry 60:66-73。

CrossRefMedline

35。 ↵

1。 威廉姆斯GV,

2。 Goldman-Rakic PS

(1995)通过前额皮质中的多巴胺D1受体调节记忆区域。 Nature 376:572-575。

CrossRefMedline

36。 ↵

1。 Winstanley CA,

2。 Theobald DE,

3。 达利JW,

4。 罗宾斯TW

(2005)控制大鼠冲动选择中5-羟色胺和多巴胺之间的相互作用:对冲动控制障碍的治疗意义。 神经精神药理学30:669-682。

MEDLINE

37。 ↵

1。 Winstanley CA,

2。 Theobald DE,

3。 达利JW,

4。 红衣主教RN,

5。 罗宾斯TW

(2006)脉冲选择的内侧前额叶和眶额皮质的5-羟色胺能和多巴胺能调节之间的双重解离。 Cereb Cortex 16:106-114。

摘要/免费全文