生物学精神病学。 作者手稿; 可在PMC 2014 May 1中找到。
以最终编辑形式发布为:
生物精神病学。 2013 May 1; 73(9):819-826。
在线发布2012 Oct 5。 DOI: 10.1016 / j.biopsych.2012.09.001
PMCID:PMC3548035
NIHMSID:NIHMS407698
抽象
肥胖是否(或在何种程度上)反映高能量食物成瘾的问题通常会缩小到这些食物的暴饮暴食是否导致与成瘾晚期所确定的相同的长期神经适应的问题。 平等或可能更大的兴趣是共同的大脑机制是否调节饮食和吸毒习惯的获得和发展的问题。 关于这个问题的最早证据植根于脑刺激奖励的早期研究。 在某些情况下,侧下丘脑电刺激可以加强,并且可以促进其他情况下的喂养。 对同一个大脑区域的刺激应该是强化和驱动诱导是矛盾的; 动物为什么要努力诱导像饥饿这样的驱动状态呢? 这被称为“驱动 - 奖励悖论”。对驱动 - 奖励悖论基质的见解表明,对多巴胺系统 - 下丘脑外侧受刺激纤维“下游”系统是否存在的争议性问题的答案是更关键的是“想要”或“喜欢”各种奖励,包括食物和成瘾药物。 同样的大脑回路涉及食物和成瘾药物的动机和强化,这延伸了强迫暴饮暴食和强迫吸毒的共同机制的论点。
近年来,关于成瘾的讨论倾向于关注其终末阶段,当反复接触药物已经以细胞生物学家,电生理学家和神经影像学家可以测量的方式改变了大脑。 在早些年,注意力集中在成瘾药物的习惯形成效应上; 成瘾药物如何劫持动机和奖励的大脑机制? 是否肥胖的问题 结果来自 食物成瘾使我们回到了早期的问题,即大脑机制对成瘾性食物和药物的强迫性觅食的发展负责,这反过来又使我们回到解析对动机的奖励寻求行为的贡献的问题和加固(1).
在很大程度上,证据表明肥胖和成瘾的共同基础的证据表明脑内多巴胺在食物的习惯形成中起作用(2)和成瘾药物(3)。 多巴胺系统被食物激活(4)和大多数成瘾药物(5),关于多巴胺的作用是否主要在食物和药物的增强作用或获得它们的动机中起作用的争论仍然存在争论(6–8); 用口语来说,多巴胺对于奖励的“喜欢”或奖励的“缺乏”更为重要(9)? 近年来未被广泛考虑的一系列相关证据是一种被称为“驱动 - 奖励悖论”的现象的证据。在这里,我描述了悖论并将其与多巴胺在强迫性寻求食物和强迫药物中具有共同作用的证据联系起来 - 寻求以及哪些角色 - 动机或强化 - 取决于多巴胺系统的问题。
侧下丘脑电刺激
在1950中,外侧下丘脑被一些人称为快乐中心(10)和其他人的饥饿中心(11)。 对该地区的电刺激是有益的; 几分钟之内,这样的刺激可能会以每小时几千响应的速度建立强制杠杆按压(12)。 获得这种刺激的经验也建立了接近杠杆的条件动机,这种动机足以克服痛苦的脚步冲击(12)。 因此,这种刺激作为无条件强化剂,“加入”反应习惯以及刺激关联,将反应杠杆建立为引发接近和操纵的条件性激励刺激。 从最早的研究可以推断,老鼠喜欢这种刺激,喜欢它让他们想要更多(10); 对人类患者的刺激研究证实,这种刺激是令人愉快的(13).
刺激这个地区也可以激发行为。 赫斯的早期工作表明,电脑刺激可诱发强迫性喂养,其特征为“贪食症”(14)。 发现脑刺激奖励后(15),很快发现外侧下丘脑的刺激可以诱导这种喂养和奖励(16)。 事实上,奖励地点的刺激可以诱发各种物种 - 典型的,生物学原始的行为,如饮食,掠食性攻击和交配(17)。 在许多方面,刺激的效果类似于自然驱动状态的影响(18),以及刺激和食物匮乏的影响已知总结(19)。 那么,这就是驱动奖励悖论(20); 老鼠为什么要按下杠杆来诱发像饥饿这样的状态呢?
内侧前脑束纤维通道
从历史上看,驱动 - 奖励悖论引发的第一个问题是,相同或不同的下丘脑外侧基质是否与刺激的两种效应有关。 这不是一个容易排除的可能性,因为电刺激会不加选择地激活不同的神经递质系统。 刺激的有效区域可能是直径毫米(21, 22并且在该区域内,刺激倾向于激活围绕电极尖端的任何纤维。 然而,不同大小和髓鞘形成的纤维具有不同的兴奋性特征,并且用于这两种行为的刺激参数有些不同(23, 24)。 虽然最初被认为是饥饿和奖励的主要来源是外侧下丘脑的床核,但是通过的纤维具有比细胞体低得多的活化阈值,并且横向下丘脑的床核被穿过50纤维系统包括内侧前脑束(25, 26)。 用于脑刺激奖励和刺激诱导的喂养的直接激活途径(或途径)的起源,直接靶标和神经递质仍然未被识别,但是传代纤维明显受到牵连并且已经确定了它们的一些特征。 类似驱动的基质和侧下丘脑刺激的有益效果具有非常相似的特征。
首先,解剖图显示,用于脑刺激奖励和刺激诱导进食的下丘脑外侧基底具有非常相似的内侧 - 外侧和背侧 - 腹侧边界,并且在这些边界内是均匀的(27, 28)。 此外,虽然只有内侧前脑束的外侧下丘脑部分最初被识别为喂养和奖励,但在腹侧被盖区域刺激更多的尾部突出物也可以是有益的(29–31)并诱导喂养(32–34)。 在腹侧被盖区内,有效刺激部位的边界与形成中脑皮质边缘和黑质纹状体多巴胺系统的多巴胺细胞群的边界紧密匹配(30)。 刺激小脑脚(内侧前脑束的更加尾部分支)也可以支持自我刺激和喂养(35, 36)。 因此,如果单独的基底介导这两种行为,那些基底具有非常相似的解剖轨迹和可能类似的子组件。
虽然不允许神经递质含量的分化,但心理物理方法 - 评估刺激输入的系统变化的行为影响 - 允许轴突特征之间的显着程度的区分。 这些方法在成瘾或喂养文献中没有被广泛讨论。
首先,“成对脉冲”刺激已被用于估计“第一阶段”纤维的不应期和传导速度(由电极尖端的施加电流直接激活的奖励和饲喂相关纤维种群) )。 用于估计不应期的方法 - 神经元膜在动作电位去极化后再充电所需的时间 - 基于电生理学家研究单个神经元所使用的方法。 虽然在实践中需要考虑一些细微之处,但原则上该方法非常简单。 当研究单个神经元时,人们简单地刺激神经元两次,改变第一次和第二次刺激之间的间隔,以便找到仍然允许细胞响应第二次刺激的最小间隔。 如果第二次刺激过快地跟随第一次刺激,则神经元将不会从第一次刺激的恢复中恢复到第二次刺激。 如果第二个脉冲足够晚,则神经元将从第一个脉冲引起的发射中充分恢复,以便响应第二个脉冲再次发射。 用于获得对两个脉冲的响应的最小脉冲间间隔定义了受刺激轴突的“不应期”。
为了获得对中等水平电刺激的行为反应,必须刺激光纤以上,并且必须给予不止一个刺激脉冲; 为了到达电极周围的许多纤维,给予更高水平的刺激,并且需要重复刺激脉冲的“训练”以激活这些多次。 在自我刺激研究中,传统上给出了0.5秒的刺激训练; 在刺激诱导的喂养研究中,给予20或30秒的刺激序列。 列车内的每个脉冲通常仅持续0.1毫秒:足够长以激活附近的神经元一次但不足以使它们在同一脉冲期间恢复并再次发射。 脉冲通常以25-100 Hz的频率给出,因此即使在半秒刺激序列中也存在数十个重复脉冲。 图中列出了一系列简单的刺激脉冲 图1A.
确定第一阶段神经元的不应期,列车 配对 脉冲(图1B),而不是单脉冲列车(图1A), 给出。 每对中的第一个脉冲称为“C”或“调节”脉冲; 每对中的第二个脉冲称为“T”或“测试”脉冲(图1C)。 如果C脉冲被它们各自的T脉冲过于紧密地跟踪,则T脉冲将无效并且动物将作出响应,好像它仅接收C脉冲一样。 如果C脉冲和T脉冲之间的间隔充分延长,则T脉冲将变得有效,并且获得更多奖励的动物将更有力地响应。 由于第一阶段神经元的群体具有一系列不应期,因此当CT间期达到最快相关纤维的不应期时,对刺激的行为反应开始,并且随着CT间隔延长直至它们超过不应期的不应期而改善。最慢的纤维(图1D)。 因此,该方法给出了所述行为的第一阶段神经元群体或群体的不应期特征。
如这些方法所示,介导下丘脑外侧脑刺激奖励的纤维的绝对不应期为约0.4至约1.2毫秒(37–40)。 刺激诱导喂养的绝对不应期也在此范围内(38, 40)。 这两个种群的不应期不仅相似; 这两个分布具有相似的异常:在每种情况下,当CT间隔在0.6和0.7毫秒之间增加时,它们没有表现出行为改善(39, 40)。 这表明有两个纤维子群有助于 每 行为:非常快的纤维的小子群(从0.4到0.6毫秒的不应期)和较慢的较慢纤维子群(不应期从0.7到1.2毫秒或者可能稍长)。 很难想象当不应期时间曲线如此相似时,不同的群体介导刺激的奖励和驱动效应,每个都具有0.6和0.7毫秒之间的不连续性。
关于刺激的驱动和奖励效应的共同基质的其他证据是,沿着内侧前脑束的其他部位的刺激也可以诱导两种喂养(32–34, 40, 41)和奖励(29, 42–44)。 无论刺激电极位于内侧前脑束的腹侧被盖或外侧下丘脑水平,奖励和刺激诱导的喂养的不应期分布是相同的(40)。 这有力地表明,相同的两个传代纤维亚群是这两种行为的原因。
此外,一旦部分地识别了介导刺激效应的纤维的轨迹,就可以确定和比较第一阶段纤维对于两种行为的传导速度(43)。 用于估计传导速度的方法类似于用于估计不应期的方法,但是在这种情况下,C脉冲沿着光纤路径(例如,外侧下丘脑)在一个刺激部位处传递,并且T脉冲在另一个刺激部位传递。 (例如,腹侧被盖区)。 这需要刺激电极,这些电极对齐以沿着它们的长度在两个点处使相同的轴突去极化(45)。 当发现一对电极沿着纤维最佳地对齐以进行奖励时,它们也会沿着纤维最佳地对齐以用于刺激诱导的喂食(33)。 这里,当给出成对脉冲时,在T脉冲有效之前必须允许C脉冲和T脉冲之间的较长间隔。 这是因为,除了从耐火性恢复的时间之外,必须允许时间将动作电位从一个电极尖端传导到另一个电极尖端(43, 45)。 通过从不同电极给出的脉冲的临界CT间隔减去不应期(由单电极刺激确定),我们可以估计传导时间的范围并推导出第一级纤维群的传导速度范围。 使用这种方法的研究表明,用于刺激诱导的奖赏的纤维具有与用于刺激诱导的饲养的纤维相同或非常相似的传导速度(33)。 因此,驱动 - 奖励悖论不能基于边界,不应期,传导速度或基板的传导路径来容易地解决,以用于外侧下丘脑电刺激的奖励和驱动诱导效果; 相反,似乎由内侧前脑束刺激触发的驱动效应的机制与刺激的增强效应的机制相同或非常相似。
药理学证据进一步表明脑刺激奖励和刺激诱导喂养的共同底物; 这一证据表明多巴胺神经元的共同参与,不具有不应期的神经元和内侧前脑束的第一级纤维的传导速度特征,但可能是直接激活纤维下游的第二级或第三级纤维。 首先,刺激诱导的喂养和侧下丘脑脑刺激奖励都被多巴胺拮抗剂减弱(46–51)。 此外,每个都通过腹侧注射吗啡来促进(52, 53)和mu和delta阿片受体激动剂(54, 55)激活多巴胺系统(56)。 同样,delta-9四氢大麻酚也促进了两者(57–59)。 虽然安非他明是一种厌食症药物,但它甚至可以增强刺激诱导的喂养方面(60)以及脑刺激奖励(61),特别是当它被显微注射到伏隔核中时(62, 63).
与多巴胺系统的相互作用
大脑刺激的第一阶段纤维如何与多巴胺系统相互作用? 另一项双电极刺激研究表明,第一阶段纤维从尾侧到下丘脑外侧区域,向着或穿过多巴胺系统起源的腹侧被盖区域尾侧突出。 使用两个电极再次施加刺激,以沿着它们的长度在不同的点处影响相同的纤维,但是在这种情况下,一个电极用作阴极(注入阳离子)以在电极尖端局部去极化轴突而另一个是用作阳极(收集阳离子)以沿着它们的长度在不同的点超极化相同的轴突。 由于神经冲动涉及沿着相位去极化区域的轴突运动,如果脉冲进入超极化区域,则脉冲失败。 当阳极刺激阻断阴极刺激的行为效应时,这意味着阳极位于阴极和神经末梢之间。 通过在两个电极位置之间切换阴极刺激和阳极阻挡并确定哪种配置在行为上有效,我们可以确定第一级纤维的传导方向。 该测试表明,大部分受刺激的纤维在尾端 - 尾侧方向向腹侧被盖区域传导奖励信息(64)。 虽然系统的起源或起源仍有待确定,但有一种假设认为,下行的第一阶段纤维终止于腹侧被盖区,在那里突触多巴胺能细胞(65); 另一个假设是,第一阶段纤维穿过腹侧被盖区并终止于脑桥脑肌节核,后者转回多巴胺细胞(66)。 无论哪种方式,大量证据表明内侧前脑束纤维的相同或非常相似的亚群(67具有奖励效果以及侧向下丘脑刺激尾部朝向腹侧被盖区域的驱动诱导效应,并且腹侧被盖区域的多巴胺神经元是两种刺激效应的最终共同路径中的关键环节。
药物诱导的喂养和奖励
驱动奖励悖论并不是电刺激引起的行为研究所特有的; 另一个例子涉及通过显微注射药物诱导的行为。 例如,老鼠会用杠杆按压或鼻子戳来进行吗啡的微量注射(68, 69),或内源性μ阿片类内吗啡肽(70)进入腹侧被盖区; 他们还学会将选择性mu和delta阿片类药物DAMGO和DPDPE自我管理到这个大脑区域(71)。 mu和delta阿片类药物与激活多巴胺系统的能力成正比; mu阿片类药物在激活多巴胺系统方面比δ阿片类药物有效100倍(56并且,同样地,作为奖励的效率超过100倍(71)。 因此,mu和delta阿片类药物具有归因于激活的有益行为(或者更可能是去抑制作用[72])中脑皮质边缘多巴胺系统的起源。 将阿片类药物直接注射到腹侧被盖区域也可以刺激饱食大鼠的摄食,并在饥饿的大鼠中加强。 通过腹侧注射吗啡诱导喂养(73–75)或mu或delta阿片类药物(76, 77)。 与其奖励效果一样,mu阿片类药物DAMGO在刺激喂养方面比100或delta阿片类药物DPDPD更有效(77)。 因此,再次,通过操纵共同的脑部位来刺激和喂养每个都可以刺激,在这种情况下,使用比电刺激更具选择性的药物来激活特定的神经元素。
另一个例子涉及神经递质GABA的激动剂。 微量注射GABA或GABAA 激动剂muscimol进入尾部但不是腹侧被盖区域的延髓部分诱导喂养的动物(78)。 类似的麝香醇注射在尾部但不是延髓腹侧被盖区域是有益的(79)。 GABAA 拮抗剂 也是有益的(80),并导致伏隔核多巴胺升高(81); 在这种情况下,有效的注射部位是 喙 而不是 尾 腹侧被盖区,暗示对侧嘴侧和尾侧GABA能系统。 在这些地区尚未用GABA-A拮抗剂检查喂养。
最后是全身大麻素(82)和大麻素显微注入腹侧被盖区(83)它们本身正在加强,全身大麻素也可以增强下丘脑外侧电刺激引起的摄食(84)。 同样,我们发现注射既有益又有动力。 同样,涉及中脑皮质边缘多巴胺系统; 在这种情况下,大麻素在腹侧被盖区域是有效的(至少是奖励),在那里它们与多巴胺系统的输入相互作用并导致其激活(85, 86).
上述研究表明,动机的阴阳内侧前脑束中有一个下行系统:在获得奖励之前获得奖励的动机,以及通过及时收到奖励来加强最近的反应和刺激关联。奖励,一旦获得。 该系统从下丘脑外侧朝向多巴胺系统尾部突出 - 可能是在其上或在其输入上突触 - 这起着重要作用,(尽管可能不是必需的)87, 88)),在这种动机的表达中的作用(46)和这种加固(50).
一个假设
多巴胺系统(一种与食物成瘾药物消费的习惯形成后果有关的系统)如何参与获得这些奖励的先行动机? 最明显的可能性是不同的多巴胺子系统可能会促进这些不同的功能。 首先,通过黑质纹状体,中脑边缘和中皮层系统的名义区分以及它们内的子系统,建议该子系统可以起到不同的作用。 黑质纹状体系统传统上与运动的起始相关,而中脑边缘系统传统上与奖励相关(89, 90)和动机(91)功能(但见[92])。 中皮质系统也与奖励功能有关(93–95)。 腹内侧(壳),腹外侧(核心)和背侧纹状体 - 主要多巴胺末端区域 - 对不同类型的奖励和奖励预测因素有差异反应(96–101)。 由于存在两种一般类型的多巴胺受体(D1和D2)和两种选择性表达它们的纹状体输出途径(直接和间接),因此进一步表明了不同的子系统可能起不同的作用。 然而,另一个有趣的可能性是相同的多巴胺神经元可能通过使用不同的神经元信号模式来促进不同的状态。 也许最感兴趣的区别是多巴胺神经元的两种活动状态之间的区别:强直起搏器状态和阶段爆发状态(102).
它是多巴胺神经元的阶段性爆发状态,具有表示奖励或奖励预测因子到来的时间保真度(103)。 当检测到奖励或奖励预测因子时,多巴胺神经元以短潜伏期突然爆发。 因为多巴胺神经元只有在出乎意料时才对自己的回报作出反应,随着预测的确立而将其对预测因子的反应转移,因此将奖励和奖励预测视为独立事件变得频繁(103)。 另一种观点认为,通过巴甫洛夫条件反射,奖励的预测因子成为条件强化者和净回报事件的条件成分(104):确实,它成为奖励的前沿(105, 106)。 它是奖励的习惯形成效果 - 无论是无条件奖励还是条件奖励(奖励预测因子) - 需要短时间,阶段性,响应 - 偶然传递。 在回复之后立即发送的奖励比甚至一秒之后发送的奖励更有效; 奖励影响在获得回应之后作为延迟的函数以双曲线衰减(107)。 众所周知,多巴胺系统的阶段性激活是由两种兴奋性输入引发的:谷氨酸(108)和乙酰胆碱(109)。 其中每一项都参与了可卡因的奖励效果:多巴胺系统的谷氨酸能和胆碱能输入均由可卡因奖励的预期引发,这些投入中的每一项都增加了可卡因本身的净回报效果(110, 111).
另一方面,多巴胺神经元的强直性起搏器射击的缓慢变化以及伴随它们的多巴胺细胞外浓度的变化更可能与伴随对食物或药物的渴望的动机状态的变化相关。 与强化不同,激励状态不依赖于短时延和响应时间。 动力状态可以逐渐建立并且可以持续很长时间,并且这些时间特征最可能反映起搏器激发多巴胺神经元的速率的缓慢变化和细胞外多巴胺水平的缓慢变化。 提高多巴胺水平的动机效应(112在食物和药物自我管理的应对恢复范例中可能最好地说明了这一点(113),经过灭绝训练的动物可以通过轻微的足部休克应激,食物或药物引发,或与食物或药物相关的感官提示来更新寻求食物或药物。 这些挑衅中的每一个 - 足部压力(114), 餐饮 (115)或药物(116)启动和食物 - (97)或药物 - (110, 111, 116)相关线索 - 提高细胞外多巴胺水平数分钟或数十分钟。 因此,多巴胺能神经元的起搏器发射的变化可能与启动对食物或成瘾药物的学习反应的动机相关。
虽然对驱动 - 奖励悖论的解释仍未得到证实,但上述研究强烈表明,驱动和奖励功能是由一种共同的下行内侧前脑纤维系统介导的,该系统直接或间接地激活中脑多巴胺系统。 最简单的假设是多巴胺具有一般的唤醒功能,这对于驱动和强化都是必不可少的。 这与细胞外多巴胺对所有行为都必不可少的事实是一致的,正如具有接近完全多巴胺消耗的动物的运动不能所证实(117)。 细胞外多巴胺水平的反应独立的强直性增加(与多巴胺系统的强直发作相关)引起一般运动活动的增加,可能仅仅通过增加引起巴甫洛夫调查和学习的器乐反应的新颖和条件刺激的显着性(118–120)。 在这种观点中,食物或药物预测刺激引起的强直多巴胺水平的增加是主观渴望或“缺乏”的频繁相关。响应 - 偶然性增加与刺激中多巴胺系统标记的相位激发相关的瞬时多巴胺水平和反应协会,可能是通过加强对仍然活跃的痕迹的整合来调节这些关联的短期记忆(121, 122)。 虽然这种观点认为细胞外多巴胺波动介导驱动和增强作用,但它认为增强效应是主要的; 只有在看到食物或反应杠杆与食物或成瘾药物的强化作用相关之后,食物或杠杆才会成为激励动机刺激,本身可以激发渴望并引发接近。 这里的论点是,yesteday对特定食物或药物的强化作用确立了今天对食物或药物的渴望。
结论意见
不仅高热能食物的暴饮暴食变得强迫,而且面对负面后果,这表明暴饮暴食具有成瘾性质。 很难想象当富含药物来源以及高浓度吸烟或注射它们的能力是我们进化史上相对较新的事件时,自然选择如何导致成瘾的单独机制。 觅食和觅食需要相同的协调运动,因此它们的机制共享最终的共同路径。 他们每个人都有主观的渴望,他们每个人都受到短暂的饱腹感。 每一个都涉及前脑电路,它对动机和强化有重要作用,电路强烈地与建立强迫性器乐习惯有关(12, 123–125)。 虽然从成瘾研究中我们对肥胖的了解很有兴趣(126),看看我们可以从肥胖和食物摄入的研究中学到什么,这也很有趣。 例如,下丘脑食欲素/ hypocretin神经元在喂养中有建议的作用(127)和奖励(128)并且已知脑刺激奖励(129),像食物奖励(130)可以通过外周饱腹感激素瘦素调节。 新的光遗传学方法(131与电刺激相比,允许更多选择性激活动机电路,希望这些方法可以促进我们对强迫吸毒和强迫暴饮暴食的理解,并解决驱动 - 奖励悖论。
脚注
财务披露
作者报告没有生物医学经济利益或潜在的利益冲突。
发布者的免责声明: 这是未经编辑的手稿的PDF文件,已被接受发布。 作为对我们客户的服务,我们正在提供该手稿的早期版本。 在以最终的可引用形式发布之前,稿件将进行复制,排版和审查。 请注意,在制作过程中可能会发现可能影响内容的错误,以及适用于该期刊的所有法律免责声明。
参考资料