青少年对奖励预测错误的独特回应(2010)

Nat Neurosci。 2010 13(6):669 71。 EPUB 2010月16。

 

来源

加州大学洛杉矶分校心理学系,美国加利福尼亚州洛杉矶。 [电子邮件保护]

抽象

以前的工作表明,人类青少年可能对奖励过敏,但不知道哪个方面 奖励 处理负责此事。 我们分离了决策价值和 预测 错误信号,发现神经 预测 纹状体中的误差信号在青春期达到峰值,而神经决定值信号根据如何建模值而变化。 这表明多巴胺能增强 预测 错误响应有助于 青少年 奖励 求。

青春期是心理发展的一个独特时期,其特点是与儿童和成人相比,风险选择和行动增加。 与前额皮质相比,这可能反映了边缘情感和奖励系统的相对早期的功能发展1这样,青少年往往比两个孩子(对奖励还不完全敏感)和成年人(对奖励敏感,但有能力控制奖励驱动的冲动)更经常做出糟糕的决定和风险选择。

根据行为决策理论,选择由分配给每个潜在选择的价值(决策值)驱动2。 决策值由内侧前额叶皮质中的系统计算,该系统用作价值表示的共同途径3,4。 但是,为了在变化或嘈杂的世界中自适应地行动,必须根据经验更新这些值。 奖励预测误差信号反映了动作的预期值与动作的实际结果之间的差异5,并由中脑边缘多巴胺系统中的相位活动编码6。 在fMRI中,它们通常在腹侧纹状体中观察到,反映多巴胺能输出(例如, 7)。 儿童或青少年预测误差信号的性质未知。 青少年可能对奖赏有过敏的纹状体反应8虽然这个发现有点不一致9,10。 我们使用概率学习范例检查了青春期是否与决策值或预测误差信号的独特变化相关联11 (图。 1; 看到 补充方法 线上)。 我们使用简单的学习模型在学习期间估计每个试验的决策值和预测误差信号5。 使用参数fMRI分析,我们确定了根据这些信号调节其响应的大脑区域,并检查了这种反应如何随着年龄从儿童期到成年期而变化。 我们检查了线性效应(反映一般成熟或发育趋势)和二次效应(反映青少年特定效应)随年龄增长。 这项工作代表了对这些跨发展决策子组成部分的首次考察。

图1

实验设计。 45健康参与者(年龄为18-8的12儿童,16-14年龄的19青少年和11-25年龄的30成人)在获取fMRI期间执行概率学习任务。 获得了书面知情同意书。 参与者 ...

在行为上,所有参与者通过训练可预测的刺激变得更准确和更快,但不是随机刺激(交互F(5,210)= 9.85, P<0.0001以获取准确度且F(5,210)= 6.60, P响应时间<0.0001; 补充表1图。 1 线上)。 至关重要的是,响应时间有一个奖励x年龄互动(F(2,42)= 5.03, P = 0.01)。 事后测试表明,与小奖励(t(15)= 3.24相比,青少年是唯一一个对大奖励相关刺激反应更快的年龄组(t(XNUMX)= XNUMX) P = 0.006; 儿童t(17)= - 0.32, P = 0.75和成人t(10)= 1.90, P 0.09)。

我们对fMRI数据建模,以允许单独估计对刺激和反馈的神经反应(补充方法图。 2 线上; 对于观察刺激和接收反应反馈的全脑主效应,请参阅 补充图 3-4和表2-3 线上)。 我们研究了基于模型的决策信号(决策值和预测误差)与年龄的神经相关性。

图2

MRI结果。 (a)在z> 2.3的全脑水平校正时显示与年龄相关的区域, P<0.05。 纹状体和角回区域与年龄呈负相关2; 因为平均年龄2 被减去了 ...

我们分析了反馈中阳性预测误差的二次趋势,并确定了两个区域,其中青少年与其他年龄组 - 纹状体和角回相比显示出过敏反应。 内侧前额叶皮层中的一个区域显示出年龄对刺激决策值的负线性影响,因此与年龄较大的参与者相比,年轻参与者在该区域具有更强的决策值信号; 在成人以前的工作中,这个区域与目标导向的刺激价值密切相关(图2a)12。 因此,尽管对不可预测的正反馈的反应在青春期达到峰值,但对刺激值的敏感性随着年龄呈线性下降(对于年龄与上述每个感兴趣区域[ROI]之间的情节,见 补充图5 线上)。

考虑到决策值是通过模型中的错误驱动学习来发展的,因此令人惊讶的是,决策值显示出与年龄相关的轨迹与预测误差不同的轨迹。 但是,由于任务的结构,选择可能是由强化学习以外的其他因素(例如,显式记忆)驱动的。 为了澄清结果,我们运行了第二个模型,该模型以更综合的方式计算决策价值,作为先前针对每种刺激选择最佳反应的试验的比例(Lin,Adolphs和Rangel,未发表; 补充方法 线上)。 我们分析了该模型的预测误差值,发现它们反映了我们初步分析的结果,显示了纹状体和顶叶皮层中的区域,以及腹侧外侧前额区域,其中神经对预测误差的响应在青春期达到峰值。 该模型的决策值分析显示,在许多区域,包括侧顶叶皮层和纹状体,年龄和神经活动之间存在线性和非线性关系(补充图6和表5 线上)。 探索性(非独立)ROI分析显示,该模型中对决策值的神经反应似乎在儿童期和青春期之间增加,但随后在青春期和成年期之间逐渐增加(补充图7 线上)。 这些结果表明,青春期的峰值预测误差响应对不同模型是稳健的,而与决策值信号的年龄相关的变化对模型规范敏感。

基于先前的工作,显示腹侧纹状体始终对意外的正反馈敏感,如基于模型的奖励预测误差信号所反映的(例如,7),我们使用原始强化学习模型(包括双侧尾状核,壳核和伏核)分别检查每个年龄组的预测误差相关反应的定位(包括双侧尾状核,壳核和伏核)。图2b)。 与阳性预测误差显着相关的纹状体区域对于青少年和成人没有重叠。 虽然本研究中的成年人在检查成人预测误差的研究中始终如一地观察到腹侧纹状体区域的活动,但青少年在更多背部区域具有活动。 儿童在纹状体中没有与阳性预测误差相关的活动。

我们的研究结果扩展了先前在青春期增加奖赏相关神经活动的发现8 通过证明该发现与估值信号相比特定于预测误差。 预测误差反应的发育差异可能反映了相位多巴胺信号传导的差异13。 如果正确,这可以直接解释青少年经常观察到的有风险的奖励寻求行为。 青春期风险增加的行为在理论上可能反映出对潜在负面结果的敏感性降低或对潜在阳性结果的敏感性增加。 我们认为我们的数据与后者一致:即,增加的预测误差信号(假定反映更大的相位多巴胺信号)反映了积极结果的更大影响14,这被认为可以增加获得积极成果的动力(从而提高风险)。 因此,青少年过度活跃的多巴胺能预测错误反应可能导致寻求奖励的增加,特别是当与不成熟的认知控制系统结合时1.

目前的研究结果可以阐明为什么以前的研究对奖励处理产生了不一致的年龄影响。 首先,并非所有研究都将青少年与儿童和成人进行比较,这意味着无法记录与年龄的非线性关系的可能性。 此外,“青少年”的定义在各研究中并不一致。 其次,重要的是要注意这里使用的概率学习任务本身并不是一个冒险的决策任务,因此不同于奖励和风险承担文献中使用的其他任务。 第三,我们的结果表明,正确理解奖励处理的发展变化需要使用基于模型的方法以及个体试验组件的分解(刺激,选择和反馈)。

人们越来越认识到,青春期是心理发展的一个独特时期,在此期间发生的冒险,寻求奖励的行为可能导致严重的发病率和死亡率,包括意外死亡和吸毒成瘾的发生。 因此,了解青少年决策的神经基础是一项关键挑战。 目前的工作表明,青少年奖励寻求的一个贡献者可能是增强的预测误差信号的存在,这为未来研究这一重要发展时期的研究提供了新的目标。

补充材料

1

点击这里查看。(2.9M,pdf)

致谢

该研究得到了国家精神卫生研究所(5R24 MH072697),国家药物滥用研究所(5F31 DA024534),麦克唐纳基金会和德拉马丁基金会的支持。

脚注

作者贡献 JRC帮助设计实验,进行数据采集和分析,并撰写了手稿。 RFA,RMB和SYB设计了这些实验。 FWS为数据采集做出了贡献。 BJK和RAP设计了实验并帮助撰写了手稿。

 

利益争夺 作者声明他们没有竞争性的经济利益。

参考资料

1. Casey BJ,Getz S,Galvan A. Dev Rev. 2008;28:62-77。 [PMC免费文章] [考研]
2. Kahneman D,Tversky A. 计量经济学。 1979;47:263-91。
3. Chib VS,Rangel A,Shimojo S,O'Doherty JP。 J Neurosci。 2009;29:12315-20。 [考研]
4. Tom SM,Fox CR,Trepel C,Poldrack RA。 科学。 2007;315:515-8。 [考研]
5. Rescorla RA,Wagner AR。 在: 经典条件II:当前研究和理论。 Black A,Prokasy WF,编辑。 Appleton Century Crofts; 纽约,纽约:1972。 pp.64-99。
6. Schultz W,Dayan P,Montague PR。 科学。 1997;275:1593-9。 [考研]
7. Pagnoni G,Zink CF,Montague PR,Berns GS。 Nat Neurosci。 2002;5:97-8。 [考研]
8. Galvan A,et al。 J Neurosci。 2006;26:6885-92。 [考研]
9. Bjork JM,et al。 J Neurosci。 2004;24:1793-802。 [考研]
10. May JC,et al。 生物学精神病学。 2004;55:359-66。 [考研]
11. Knowlton BJ,Mangels JA,Squire LR。 科学。 1996;273:1399-402。 [考研]
12. Hare TA,O'Doherty J,Camerer CF,Schultz W,Rangel A. J Neurosci。 2008;28:5623-30。 [考研]
13. D'Ardenne K,McClure SM,Nystrom LE,Cohen JD。 科学。 2008;319:1264-7。 [考研]
14. Berridge KC,Robinson TE。 脑住宅牧师 1998;28:309-69。 [考研]