(L)Brain的长期奖励系统依赖于多巴胺(2013)

Brain的长期奖励系统依赖于多巴胺

2013 年 8 月 5 日

Brett Smith为redOrbit.com - 您的宇宙在线

从开车穿越国家到大学毕业,长期目标往往难以集中在即时奖励不在眼前。

根据“自然”杂志的一篇报道,来自西雅图华盛顿大学和麻省理工学院的一组研究人员最近发现了关于大脑如何能够保持专注,直到达到这些长期目标的新细节。

联合研究小组的研究建立在以前的研究基础上,这些研究将神经递质多巴胺与大脑的奖励系统联系起来。 虽然大多数先前的研究都涉及到关于立即奖励的多巴胺,但新的研究发现实验室大鼠在延迟满足后接近预期的奖励时多巴胺水平增加。

为了测量大鼠大脑中多巴胺的水平,研究小组使用了由UW行为科学家Paul Phillips开发的系统,称为快速扫描循环伏安法(FSCV),其涉及通过寻找其电化学特征来连续记录多巴胺浓度的小型植入电极。

“我们采用FSCV方法,以便我们可以同时测量大脑中四个不同部位的多巴胺,因为动物可以自由地穿过迷宫,”共同作者Mark Howe说,他目前是西北大学的博士后神经生物学家。 “每个探针测量一小部分脑组织中细胞外多巴胺的浓度,可能反映了数千个神经末梢的活动。”

科学家们开始训练老鼠在迷宫中寻找奖励。 在每只老鼠穿过迷宫时,会发出一种声音,指示它在交叉路口向右或向左转,以追求巧克力牛奶奖励。

该研究小组表示,在试验期间,他们预计大鼠的大脑会定期释放多巴胺脉冲。 然而,他们发现整个实验过程中神经递质的水平稳定上升 - 最终达到最高水平,因为啮齿动物接近其奖励。 虽然每次试验期间大鼠的行为各不相同,但尽管跑步速度或奖励概率,但他们的多巴胺水平可靠地上升。

“相反,多巴胺信号似乎反映了大鼠离目标有多远,”麻省理工学院大脑研究实验室负责人安·格雷比尔说。 “越接近,信号越强。”

研究小组还发现,多巴胺信号的大小与预期奖励的大小有关。 当大鼠被调理以期待更多份的巧克力牛奶时,他们的多巴胺水平更快地上升到更高的峰值。

研究人员通过将迷宫扩展到更复杂的形状来改变实验,使得老鼠跑得更远并且进行额外的转弯以获得奖励。 在这些较长的试验期间,多巴胺信号逐渐增加,但最终达到与之前的迷宫相同的水平。

“这就好像动物正在调整它的期望,知道它还有进一步发展,”Graybiel说。

她建议未来的研究应该研究人类中的这种现象。

“如果在我们自己的大脑中没有发生类似事情,我会感到震惊,”Graybiel说。


研究揭示了大脑如何关注奖品

08年05月2013日,星期一–上午10:15

麦戈文脑研究所

“我们到了吗?”

任何与小孩一起旅行的人都知道,保持对远方目标的关注可能是一个挑战。 麻省理工学院(MIT)的一项新研究表明,大脑如何完成这项任务,并表明神经递质多巴胺可能标志着长期奖励的价值。 这些发现也可以解释为什么患有帕金森病的患者 - 多巴胺信号传导受损 - 往往难以维持完成任务的动力。

这项工作在自然界中有所描述。

以前的研究已经将多巴胺与奖励联系起来,并且已经表明当动物获得意想不到的奖励时,多巴胺神经元显示出短暂的活动爆发。 这些多巴胺信号被认为对强化学习很重要,强化学习是动物学会进行导致奖励的动作的过程。

从长远来看

在大多数研究中,奖励已在几秒钟内完成。 然而,在现实生活中,满足并不总是立竿见影的:动物必须经常寻找食物,并且必须保持远距离目标的动力,同时也要回应更直接的线索。 对于人类来说也是如此:长途旅行中的司机必须始终专注于到达最终目的地,同时还要对交通做出反应,停下来吃零食,并让后座儿童娱乐。

麻省理工学院的研究小组由研究所教授安·格雷比尔(Ann Graybiel)领导,他也是麻省理工学院麦戈文脑研究所的研究员,他决定研究多巴胺如何在迷宫任务期间改变,接近延迟满足的工作。 研究人员训练老鼠在迷宫中航行以获得奖励。 在每次试验期间,老鼠会听到一种声音,指示它在交叉路口向右或向左转,以找到巧克力牛奶奖励。

麻省理工学院的研究人员不是简单地测量含有多巴胺的神经元的活动,而是想测量纹状体中多巴胺的释放量,这是一种已知在强化学习中很重要的脑结构。 他们与大学的保罗菲利普斯合作。 华盛顿公司开发了一种称为快速扫描循环伏安法(FSCV)的技术,其中微小的植入碳纤维电极可以根据其电化学指纹连续测量多巴胺浓度。

“我们采用FSCV方法,以便我们可以同时测量大脑中四个不同部位的多巴胺,因为动物可以在迷宫中自由移动,”第一作者Mark Howe解释说,他是Graybiel的前研究生,现在是一位博士后西北大学神经生物学系 “每个探针测量一小部分脑组织中细胞外多巴胺的浓度,可能反映了数千个神经末梢的活动。”

多巴胺逐渐增加

从以前的研究中,研究人员预计他们可能会在试验的不同时间看到多巴胺的释放,“但实际上我们发现了一些更令人惊讶的东西,”Graybiel说:在每次试验中,多巴胺水平稳定增加,达到峰值动物接近了它的目标 - 好像在期待奖励。

从试验到试验,大鼠的行为各不相同 - 有些跑步比其他跑步更快,有时动物会短暂停止 - 但多巴胺信号不随跑步速度或试验持续时间而变化。 它也不取决于获得奖励的可能性,这是以前的研究所表明的。

“相反,多巴胺信号似乎反映了大鼠离目标有多远,”Graybiel解释道。 “越接近,信号越强。”研究人员还发现信号的大小与预期奖励的大小有关:当训练大鼠预测更大的巧克力牛奶时,多巴胺信号上升更陡峭到更高的最终浓度。

在一些试验中,T形迷宫扩展到更复杂的形状,需要动物进一步跑步并在获得奖励之前进行额外的转弯。 在这些试验期间,多巴胺信号逐渐增加,最终达到与较短迷宫相同的水平。 “这就好像动物正在调整它的期望,知道它还有进一步发展,”Graybiel说。

“内部指导系统”

“这意味着多巴胺水平可用于帮助动物在通往目标的路上做出选择,并估计与目标的距离,”Salk研究所的Terrence Sejnowski说,他是一位熟悉研究结果的计算神经科学家,但是谁没有参与这项研究。 “这个'内部指导系统'也可能对人类有用,他们也必须在可能是一个遥远目标的路上做出选择。”

Graybiel希望在未来的研究中研究的一个问题是信号是如何在大脑内产生的。 大鼠和其他动物形成其空间环境的认知图,其中所谓的“放置细胞”在动物处于特定位置时是活跃的。 “当我们的老鼠反复运行迷宫时,”她说,“我们怀疑他们学会将迷宫中的每个点与他们之前跑步时所获得的奖励的距离联系起来。”

至于这项研究与人类的相关性,Graybiel说:“如果在我们自己的大脑中没有发生类似的情况,我会感到震惊。”众所周知,帕金森氏症患者多巴胺信号受损,往往似乎无动于衷,并且难以维持完成长期任务的动力。 “也许这是因为他们不能产生这种缓慢增加的多巴胺信号,”Graybiel说。

资料来源:麻省理工学院