Bioloxía de psiquiatría. Manuscrito do autor; dispoñible en PMC 2014 Maio 1.
Publicado en forma definitiva editada como:
Psicoloxía biolóxica. 2013 1; 73 (9): 819 – 826.
Publicado en liña 2012 Oct 5. doi: 10.1016 / j.biopsych.2012.09.001
PMCID: PMC3548035
NIHMSID: NIHMS407698
Abstracto
A pregunta de se (ou en que grao) a obesidade reflicte a adicción a alimentos de alta enerxía adoita estreitarse á pregunta de se o exceso de alimentación destes alimentos provoca as mesmas neuroadaptacións a longo prazo que se identifican coas etapas tardías da adicción. De igual ou quizais maior interese é a cuestión de se os mecanismos cerebrais comúns median a adquisición e o desenvolvemento de hábitos alimentarios e de consumo de drogas. As primeiras probas sobre esta cuestión están enraizadas en primeiros estudos de recompensa á estimulación cerebral. A estimulación eléctrica hipotalámica lateral pode reforzarse nalgunhas condicións e pode motivar a alimentación noutras. Que a estimulación da mesma rexión cerebral debería reforzarse e provocar a condución é paradóxica; por que un animal debe traballar para inducir un estado parecido á unidade como a fame? Isto coñécese como o "paradoxo da recompensa por unidade". As observacións sobre os substratos do paradóxico drive-recompensa suxiren unha resposta á controvertida pregunta de se o sistema de dopamina - un sistema "augas abaixo" das fibras estimuladas do hipotálamo lateral - é máis criticamente implicado en "querer" ou "gustar" de varias recompensas, incluídos os alimentos e as drogas adictivas. Que o mesmo circuíto cerebral está implicado na motivación e o reforzo tanto de alimentos como de drogas adictivas amplía o argumento para un mecanismo común que subxace a alimentación compulsiva e a toma compulsiva de drogas.
Nos últimos anos, as discusións sobre a adicción tenden a centrarse nas súas etapas terminais, cando a exposición repetida a un medicamento alterou o cerebro de formas que poden ser medidas por biólogos celulares, electrofisiólogos e neuroimagens. Nos anos anteriores, a atención estivo nos efectos de hábito das drogas adictivas; como secuestraban as drogas adictivas aos mecanismos cerebrais de motivación e recompensa? A pregunta de se a obesidade resultados de A adicción aos alimentos volve á pregunta anterior sobre que mecanismos cerebrais son os responsables do desenvolvemento dunha forraxe compulsiva de alimentos e drogas adictivas e isto á súa vez, volve ao problema de analizar as contribucións aos comportamentos de motivación que buscan recompensas. e reforzo (1).
En gran parte, a evidencia que suxire unha base común para a obesidade e a adicción é unha evidencia que implica a dopamina cerebral nos efectos de hábito dos alimentos (2) e de drogas adictivas (3). Mentres o sistema de dopamina é activado polos alimentos (4) e pola maioría das drogas adictivas (5), continúa o debate sobre se o papel da dopamina ten un papel fundamentalmente nos efectos de reforzo dos alimentos e drogas ou un papel na motivación para obtelos (6-8); en termos coloquiais, a dopamina é máis esencial para o "gusto" dunha recompensa ou o "querer" da recompensa (9)? Unha liña de evidencias relevantes non moi consideradas nos últimos anos é a evidencia dun fenómeno denominado "paradoxo da recompensa impulsora". Aquí describo o paradoxo e relato coa evidencia de que a dopamina ten roles comúns no medicamento compulsivo en busca de alimentos e compulsivo. buscar e cuestionar cal dos roles (motivación ou reforzo) depende do sistema de dopamina.
Estimulación eléctrica hipotalámica lateral
Nas 1950s, o hipotálamo lateral foi marcado como centro de pracer por algúns (10) e un centro de fame por outros (11). A estimulación eléctrica desta rexión foi gratificante; en poucos minutos, tal estimulación podería establecer un pulsado de palanca compulsiva a taxas que alcanzan varios miles de respostas por hora (12). A experiencia que obtivo tal estimulación tamén estableceu unha motivación condicionada para achegarse á panca, e esta motivación podería ser suficiente para superar o doloroso golpe (12). Así, esta estimulación serviu como reforzador incondicionado, "imprime" hábitos de resposta, así como asociacións de estímulos que establecían a palanca de resposta como estímulo condicionado que provocaba o enfoque e a manipulación. Dende os primeiros estudos inferíase que ás ratas lles gustaba a estimulación e que o gusto fixo que quixesen máis (10); estudos de estimulación en pacientes humanos confirmaron que tal estimulación era agradable (13).
A estimulación desta rexión tamén pode motivar o comportamento. O traballo temperán de Hess revelou que a estimulación eléctrica cerebral podería inducir a alimentación compulsiva, caracterizada como "bulimia" (14). Tras o descubrimento de recompensa de estimulación cerebral (15), logo descubriuse que a estimulación do hipotálamo lateral podería inducir tal alimentación e recompensar (16). De feito, a estimulación nos sitios de recompensa pode inducir unha variedade de comportamentos típicamente biolóxicos especies, como comer, beber, ataque depredador e cópula (17). En moitos aspectos, os efectos da estimulación son similares aos efectos dos estados das unidades naturais (18), e os efectos da estimulación e da privación de alimentos son coñecidos por resumir (19). Este, entón, foi o paradoxo da recompensa (20); por que unha rata debe pulsar unha palanca para inducir a un estado como a fame?
Fibras medias de paso
Históricamente, a primeira pregunta suscitada polo paradoxo da recompensa foi a de saber se os mesmos ou diferentes substratos hipotalámicos laterais están implicados nos dous efectos da estimulación. Esta non foi unha posibilidade fácil de descartar porque a estimulación eléctrica activa distintos sistemas de neurotransmisores bastante indiscriminados. A zona efectiva de estimulación é talvez un milímetro de diámetro (21, 22) e dentro desta zona, a estimulación tende a activar cantas fibras rodean a punta do electrodo. Non obstante, as fibras de diferente tamaño e mielinización teñen características de excitabilidade diferentes, e os parámetros de estimulación empregados para os dous comportamentos foron algo diferentes (23, 24). Aínda que se trataba do núcleo da cama do hipotálamo inicial que se pensaba inicialmente como a fonte principal de fame e recompensa, as fibras de paso teñen uns limiares de activación moito inferiores aos dos corpos celulares, e o núcleo de cama do hipotálamo lateral atravésase máis. Sistema de fibra 50 que inclúe o feixe de cerebro interno (25, 26). A orixe, obxectivo inmediato e neurotransmisor da vía (ou vías) directamente activada para a recompensa de estimulación cerebral e a alimentación inducida por estimulación seguen sen ser identificados, pero as fibras de paso están claramente implicadas e varias das súas características foron determinadas. Os substratos do accionamento e os efectos gratificantes da estimulación hipotalámica lateral teñen características moi similares.
En primeiro lugar, a cartografía anatómica revelou que o substrato hipotalámico lateral para recompensa de estimulación cerebral e para alimentación inducida por estimulación teñen límites medial-laterais e dorsal-ventrais moi similares e son homoxéneos dentro destes límites (27, 28). Ademais, mentres que só a porción hipotalámica lateral do feixe do antebrazo medial se identificou inicialmente con alimentación e recompensa, a estimulación de proxeccións máis caudales do feixe, na área tegmental ventral, tamén pode resultar gratificante (29-31) e inducir a alimentación (32-34). Dentro da área tegmental ventral, os límites dos sitios de estimulación efectivos coinciden estreitamente cos límites dos grupos celulares de dopamina que forman os sistemas de dopamina mesocorticolímbica e nigrostriatal (30). A estimulación do pedúnculo cerebelo (unha rama aínda máis caudal do feixe do cerebro medial) tamén pode apoiar a autoestimulación e a alimentación (35, 36). Así, se os substratos separan os dous comportamentos, estes substratos teñen traxectorias anatómicas notablemente similares e talvez subcompoñentes similares.
Aínda que non permiten a diferenciación do contido de neurotransmisores, os métodos psicofísicos -valorar os efectos conductuais das variacións sistemáticas da entrada de estimulación- permiten un importante grao de diferenciación entre as características axonais. Os métodos non son moi discutidos nas literaturas de adicción ou alimentación.
En primeiro lugar, a estimulación de "pulso emparejado" usouse para estimar os períodos refractarios e as velocidades de condución das fibras do "primeiro estadio" (as poboacións de fibras relevantes de recompensa e alimentación que están activadas directamente pola corrente aplicada na punta do electrodo. ). O método para estimar períodos refractarios -o tempo necesario para que a membrana neuronal se recargue despois da despolarización dun potencial de acción- baséase no método empregado por electrofisiólogos que estudan neuronas individuais. Aínda que hai algunhas sutilezas a considerar na práctica, o método é moi sinxelo en principio. Ao estudar neuronas simples, simplemente estimúlase a neurona dúas veces, variando o intervalo entre a primeira e a segunda estimulación para atopar o intervalo mínimo que aínda permite que a célula responda á segunda estimulación. Se a segunda estimulación segue a primeira demasiado rápido, a neurona non se recuperará dos efectos da primeira no tempo para responder á segunda. Se o segundo pulso chega o suficientemente tarde, a neurona recuperarase suficientemente do disparo provocado polo primeiro pulso para disparar de novo en resposta ao segundo. O intervalo mínimo entre pulso para obter respostas a ambos os pulsos define o "período refractario" do axón estimulado.
Para obter respostas comportamentais a niveis moderados de estimulación eléctrica, hai que estimular máis de fibra e hai que dar máis dun pulso de estimulación; niveis máis altos de estimulación danse a chegar a moitas fibras ao redor do electrodo, e son necesarios "trens" de pulsos de estimulación repetidos para activar estes varios. En estudos de autoestimulación, tradicionalmente danse os trens de estimulación de 0.5 segundos; en estudos de alimentación inducidos por estimulación danse trens de estimulación de segundos 20 ou 30. Cada pulso dentro dun tren normalmente só dura 0.1 msec: o suficientemente longo como para activar as neuronas próximas unha vez, pero non o suficiente para que se recuperen e disparen por segunda vez durante o mesmo pulso. Os pulsos adóitanse a frecuencias de 25-100 Hz, de xeito que incluso nun tren de estimulación de medio segundo hai decenas de pulsos repetidos. Un esquema sinxelo de pulsos de estimulación está esquematizado Imaxe 1A.
Para determinar períodos refractarios das neuronas do primeiro estadio, hai trens de apareado pulsos (Fig. 1B), máis que trens de pulsos simples (Fig. 1A), danse. O primeiro pulso de cada par chámase pulso "C" ou "acondicionamento"; O segundo pulso en cada par denomínase pulso "T" ou "proba" (Fig. 1C). Se os pulsos C son seguidos demasiado de cerca polos seus respectivos pulsos T, os pulsos T serán ineficaces e o animal responderá coma se recibise só os pulsos C. Se o intervalo entre os pulsos C e T amplíase suficientemente, o pulso T farase efectivo e o animal, recibindo máis recompensa, responderá con máis forza. Debido a que a poboación de neuronas do primeiro estadio ten unha serie de períodos refractarios, as respostas de comportamento á estimulación comezan a medida que o intervalo de TC alcanza o período refractario das fibras relevantes máis rápidas e mellora a medida que os intervalos de TC se estenden ata superar o período refractario da fibras máis lentas (Fig. 1D). Así, o método ofrécenos as características do período refractario da poboación ou poboacións de neuronas da primeira etapa para o comportamento en cuestión.
Tal e como demostran estes métodos, os períodos refractarios absolutos para as fibras que median a recompensa hipotalámica lateral de estimulación cerebral van desde aproximadamente 0.4 ata aproximadamente 1.2 msec (37-40). Os períodos refractarios absolutos para a alimentación inducida por estimulación tamén están neste rango (38, 40). Non só son similares os intervalos do período refractario para as dúas poboacións; as dúas distribucións presentan unha anomalía similar: en cada caso, non mostran melloras do comportamento cando aumentan os intervalos de TC entre 0.6 e 0.7 msec (39, 40). Isto suxire que hai dúas subpoblacións de fibras que contribúen cada comportamento: unha pequena subpoblación de fibras moi rápidas (períodos refractarios que van desde 0.4 a 0.6 msec) e unha subpoblación máis grande de fibras máis lentas (períodos refractarios que van desde 0.7 a 1.2 msec ou quizais un pouco máis). É difícil imaxinar que diferentes poboacións medien os efectos gratificantes e estimulantes da estimulación cando os perfís do período refractario son semellantes, cada un cunha discontinuidade entre 0.6 e 0.7 msec.
A evidencia adicional para un substrato común para os efectos impulsores e recompensadores da estimulación é que a estimulación en sitios doutras partes do feixe do cerebro medial tamén pode inducir a ambos os alimentos (32-34, 40, 41) e recompensar (29, 42-44). As distribucións do período refractario para a alimentación inducida pola recompensa e a estimulación son as mesmas se os electrodos estimulantes están no tegmental ventral ou no nivel hipotalámico lateral do feixe do antebrazo medial (40). Isto suxire firmemente que as mesmas dúas subpoblacións de fibras de paso son responsables de ambos os comportamentos.
Ademais, unha vez identificada parcialmente a traxectoria das fibras mediadoras dun efecto de estimulación, pódense determinar e comparar as velocidades de condución das fibras do primeiro estadio para os dous comportamentos (43). O método para estimar as velocidades de condución é similar ao para a estimación de períodos refractarios, pero neste caso os pulsos C son entregados nun sitio de estimulación ao longo do camiño da fibra (por exemplo, o hipotálamo lateral) e os pulsos T entreganse noutro. (por exemplo, a área tegmental ventral). Isto require estimular electrodos que estean aliñados para despolarizar os mesmos axóns en dous puntos ao longo da súa lonxitude (45). Cando se atopa un par de electrodos aliñados ó longo das fibras para ser recompensados, resultan tamén aliñados óptimos ao longo das fibras para alimentación inducida pola estimulación (33). Aquí, cando se dan pulsos emparellados, debe permitirse un intervalo máis longo entre os pulsos C e os pulsos T antes de que os pulsos T sexan efectivos. Isto débese a que, ademais do tempo para a recuperación da refractaría, hai que permitir un tempo para a condución do potencial de acción dunha punta de electrodo á outra (43, 45). Restando o período refractario (determinado por estimulación dun único electrodo) do intervalo de TC crítico para os impulsos dados nos distintos electrodos, podemos estimar o rango de tempos de condución e derivar o rango de velocidades de condución para a poboación de fibras da primeira etapa. Estudos empregando este método demostraron que as fibras para recompensa inducida pola estimulación teñen as velocidades de condución iguais ou moi similares que as fibras para alimentación inducida pola estimulación (33). Así, o paradoxo da recompensa da unidade non se resolve facilmente con base nos límites, os períodos refractarios, as velocidades de condución ou o camiño de condución dos substratos para os efectos gratificantes e impulsores da estimulación eléctrica hipotalámica lateral; máis ben, parece que o mecanismo para os efectos impulsores desencadeado pola estimulación media do paquete do antebrazo é igual ou notablemente similar ao mecanismo para os efectos de reforzo da estimulación.
As probas farmacolóxicas suxiren ademais un substrato común para a recompensa da estimulación cerebral e a alimentación inducida pola estimulación; Esta evidencia suxire a implicación común de neuronas dopaminas, neuronas que non teñen o período refractario e as características de velocidade de condución das fibras de primeira etapa do feixe de antebrazo medial, pero presuntamente son fibras de segunda ou terceira etapa augas abaixo das fibras directamente activadas. En primeiro lugar, a alimentación inducida pola estimulación e a recompensa lateral hipotalámica cerebral son cada vez atenuadas por antagonistas da dopamina (46-51). Ademais, cada unha é facilitada por inxeccións tegmentais ventrales de morfina (52, 53) e agonistas opioides mu e delta (54, 55) que activan o sistema de dopamina (56). Do mesmo xeito, ambos son facilitados polo tetrahidrocannabinol delta-9 (57-59). Aínda que a anfetamina é un medicamento anorexixénico, mesmo potencia aspectos da alimentación inducida pola estimulación (60) así como recompensa de estimulación cerebral (61), particularmente cando é microinxectado nun núcleo accumbens (62, 63).
Interaccións co sistema de dopamina
Como interactúan as fibras da primeira etapa da estimulación cerebral co sistema dopamina? Outro estudo de estimulación de dous electrodos suxire que as fibras da primeira etapa se proxectan caudalmente desde algún lugar rostral ata a zona hipotalámica lateral, cara ou a través da área tegmental ventral onde se orixina o sistema de dopamina. A estimulación aplícase de novo usando dous electrodos aliñados para influír nas mesmas fibras en diferentes puntos ao longo da súa lonxitude, pero neste caso un dos electrodos úsase como cátodo (inxectando catións positivos) para despolarizar axóns localmente na punta do electrodo e o outro é usado como o ánodo (recollendo os catións) para hiperpolarizar os mesmos axóns nun punto diferente ao longo da súa lonxitude. Dado que o impulso nervioso implica o movemento cara ao axón dunha zona de despolarización fásica, o impulso falla se entra nunha zona de hiperpolarización. Cando a estimulación anodal bloquea os efectos comportamentais da estimulación catodal significa que o ánodo está entre o cátodo e o terminal nervioso. Cambiando a estimulación catodal e o bloqueo anodal entre os dous sitios de electrodos e determinando que configuración é eficaz comportamentalmente, podemos determinar a dirección de condución das fibras da primeira etapa. Esta proba indica que a maior parte das fibras estimuladas conducen mensaxes de recompensa en dirección rostral-caudal, cara á área tegmental ventral (64). Aínda que aínda se determina a orixe ou orixe do sistema, unha hipótese é que as fibras descendentes do primeiro estadio rematan na área tegmental ventral, sinapsándose nas células dopaminérxicas (65); outra hipótese é que as fibras do primeiro estadio pasan pola área tegmental ventral e rematan no núcleo tegmental pedunculopontino, que se retorna ás células da dopamina (66). Sexa como sexa, unha boa cantidade de evidencias suxire que as subpoblacións iguais ou moi similares das fibras medias do cerebro anterior67) leva os efectos gratificantes e tamén os efectos impulsores da estimulación hipotalámica lateral caudalmente cara á área tegmental ventral e que as neuronas dopaminas da área tegmental ventral son un eslabón crítico na ruta común final para os dous efectos de estimulación.
Alimentación e recompensa inducida por drogas
O paradoxo da recompensa non é exclusivo dos estudos de comportamento inducidos pola estimulación eléctrica; outro exemplo é o comportamento inducido por microinxeccións de drogas. Por exemplo, as ratas farán palanca de prensa ou o nariz para administrar microinxeccións de morfina (68, 69) ou o endogorfo mu opioide endóxeno (70) á área tegmental ventral; tamén aprenden a auto-administrar os opioides mu e delta selectivos DAMGO e DPDPE nesta rexión cerebral (71). Os opioides mu e delta son gratificantes en proporción ás súas habilidades para activar o sistema de dopamina; Os opioides mu xa son máis de 100 veces máis eficaces que os opioides delta na activación do sistema de dopamina (56) e, do mesmo xeito, son máis de 100 veces máis eficaces que as recompensas (71). Así, os opioides mu e delta teñen accións gratificantes atribuídas á activación (ou, máis probablemente, á desinhibición [72]) das orixes do sistema de dopamina mesocorticolímbica. As inxeccións directas de opioides na zona tegmental ventral tamén estimulan a alimentación en ratas saciadas e aumentan a fame. A alimentación induce por inxeccións tegmentais ventrais de calquera morfina (73-75) ou opioides mu ou delta (76, 77). Como é o caso dos seus efectos gratificantes, o DAMO mu opioide é 100 ou máis veces máis eficaz que o DPDPD opioide delta para estimular a alimentación (77). Así, unha vez máis, a recompensa e a alimentación poden estimularse manipulando un sitio cerebral común, empregando, neste caso, drogas moito máis selectivas que a estimulación eléctrica para activar elementos neuronais específicos.
Outro exemplo inclúe agonistas para o neurotransmisor GABA. Microinxeccións de GABA ou GABAA O muscimol agonista no caudal pero non a porción rostral da área tegmental ventral induce a alimentación en animais satinados (78). Do mesmo xeito, as inxeccións de muscimol na zona caudal, pero non na zona tegmental ventral, son gratificantes (79). GABAA antagonistas tamén son gratificantes (80) e provocan que o núcleo accumbens aumente a dopamina (81); neste caso, o lugar de inxección efectivo é rostral e non o caudal área tegmental ventral, que suxire os sistemas GABAérxicos rostrais e caudais opostos. A alimentación aínda non se examinou con antagonistas de GABA-A nestas rexións.
Finalmente cannabinoides sistémicos (82) e cannabinoides microinjectados na área tegmental ventral (83) están reforzando por si mesmos e os cannabinoides sistémicos tamén potencian a alimentación inducida pola estimulación eléctrica hipotalámica lateral (84). De novo, atopamos inxeccións que son gratificantes e tamén motivadoras para alimentarse. De novo, o sistema de dopamina mesocorticolímbico está implicado; neste caso, os cannabinoides son eficaces (como recompensas, polo menos) na área tegmental ventral, onde interactúan con entradas para o sistema de dopamina e producen a súa activación (85, 86).
Os estudos revisados anteriormente implican un sistema descendente no paquete de antebrazo mediano no yin e o yang da motivación: a motivación para a acción pola promesa dunha recompensa antes de que a obtivese e o reforzo de asociacións de resposta e estímulo recentes mediante a recepción oportuna de recompensa, unha vez obtida. Este sistema proxecta caudalmente dende o hipotálamo lateral cara ao sistema de dopamina (presuntamente sinapsando tanto sobre el como sobre os seus insumos), que ten un papel significativo (aínda que quizais non sexa necesario (87, 88)), papel na expresión de ambos esta motivación (46) e este reforzo (50).
Unha hipótese
Como pode involucrarse tamén o sistema de dopamina, un sistema implicado tanto nas consecuencias que forman o hábito do consumo de drogas adictivas aos alimentos como na motivación antecedente para obter estas recompensas? A posibilidade máis obvia é que diferentes subsistemas de dopamina poden subsistir estas diferentes funcións. Que os subsistemas poden servir a diferentes funcións suxérese, primeiro, a diferenciación nominal dos sistemas nigrostriatal, mesolímbico e mesocortical e polos subsistemas dentro deles. O sistema nigrostriatal está tradicionalmente asociado ao inicio do movemento, mentres que o sistema mesolímbico está asociado tradicionalmente á recompensa (89, 90) e motivacional (91) función (pero vexa [92]). O sistema mesocortical tamén está implicado na función de recompensa (93-95). O estromo ventromedial (shell), ventrolateral (núcleo) e dorsal (campos terminais principais de dopamina) son sensiblemente sensibles a diferentes tipos de recompensas e recompensan os predictores (96-101). Que diferentes subsistemas poidan cumprir funcións diferentes é suxerido ademais polo feito de que hai dúas clases xerais de receptores de dopamina (D1 e D2) e dúas vías de saída estriais (directas e indirectas) que as expresan selectivamente. Outra posibilidade interesante, non obstante, é que as mesmas neuronas dopaminas poidan subservar os diferentes estados empregando diferentes patróns de sinalización neuronal. Quizais a distinción de interese máis interesante sexa a distinción entre dous estados de actividade das neuronas da dopamina: un estado de marcapasos tónico e un estado de estallido fásico (102).
É o estado de fago de neuronas de dopamina que ten a fidelidade temporal para sinalar a chegada de recompensas ou recompensar os predictores (103). As neuronas da dopamina estalan con pouca latencia cando se detectan recompensas ou recompensadores. Debido a que as neuronas da dopamina responden ás recompensas só cando son inesperadas, mudan a súa resposta aos predictores a medida que se establece a predición, fíxose frecuente ver a recompensa e a predición de recompensas tratados como sucesos independentes (103). Unha visión alternativa é que o predictor dunha recompensa, a través do acondicionamento pavloviano, convértese nun reforzador condicionado e un compoñente condicionado do evento neto de recompensa (104): De feito, que se converta na vangarda máis importante da recompensa (105, 106). É o efecto de recompensas que forman o hábito (xa sexan recompensas incondicionadas ou condicionadas (predictores de recompensa)), que require unha entrega de pouca latencia, fásica, de continxente de resposta. As recompensas entregadas inmediatamente despois dunha resposta son moito máis eficaces que as recompensas entregadas incluso un segundo despois; o impacto de recompensa decae hiperbólicamente en función do atraso despois da resposta que a gaña (107). É coñecida a activación fásica do sistema de dopamina por dúas entradas excitadoras: o glutamato (108) e acetilcolina (109). Cada un destes participa nos efectos gratificantes da cocaína gañada: a entrada glutamaterxica e colinérxica ao sistema de dopamina desencadéase cada vez pola esperanza de recompensa de cocaína e cada un destes aportes engade aos efectos gratificantes netos da cocaína en si (110, 111).
Por outra banda, son cambios lentos no disparo de marcapasos tónico de neuronas da dopamina e os cambios na concentración extracelular de dopamina que os acompañan que son máis propensos a asociarse a cambios no estado motivacional que acompañan ansias por alimentos ou drogas. A diferenza do reforzo, os estados motivacionais non dependen de tempo de curta latencia e de contingente de resposta. Os estados motivacionais poden construírse gradualmente e poden manterse durante longos períodos, e estas características temporais son máis propensas a reflectir cambios lentos na taxa de disparo de marcapasos de neuronas de dopamina e cambios lentos nos niveis de dopamina extracelulares. Os efectos motivacionais do aumento dos niveis de dopamina (112) son quizais mellor ilustrados no paradigma de reinserción da resposta na autoadministración de alimentos e drogas (113), onde os animais que se someteron a un adestramento en extinción poden ser provocados por un estrés leve do calado, unha alimentación ou preparación de drogas, ou as sinais sensoriais relacionadas con alimentos ou con drogas para renovar o consumo de drogas. Cada unha destas provocacións: estrés no calado114), comida (115) ou drogas (116) cebada e comida-97) ou drogas (110, 111, 116) pistas relacionadas: eleva os niveis de dopamina extracelulares durante minutos ou decenas de minutos. Así, os cambios no disparo de marcapasos de neuronas dopaminérxicas son o probable correlación da motivación para iniciar respostas aprendidas para alimentos ou drogas adictivas.
Aínda que non se confirman as explicacións do paradoxo da recompensa, os estudos revisados anteriormente suxiren fortemente que as funcións de impulsión e recompensa están mediadas por un sistema común de fibras descendentes do antebrazo medial que, directa ou indirectamente, activa os sistemas de dopamina do cerebro medio. A hipótese máis sinxela é que a dopamina cumpre unha función excitante xeral que é esencial tanto para a unidade como para o reforzo. Isto é coherente co feito de que a dopamina extracelular é esencial para todo comportamento, como confirma a akinesia dos animais con esgotamentos de dopamina case total (117). Os aumentos tónicos independentes da resposta nos niveis de dopamina extracelulares (asociados ao aumento do disparo tónico do sistema de dopamina) provocan aumentos na actividade locomotora xeral, quizais simplemente aumentando a salidez de estímulos novos e condicionados que provocan respostas instrumentais e investigadoras de Pavlovia (118-120). A este xuízo, os aumentos dos niveis de dopamina tónica provocados por estímulos preditivos por alimentos ou medicamentos son o frecuente correlacionado de ansias ou "desexos" subxetivos. O continxente de resposta aumenta os niveis de dopamina momentánea asociados ao disparo fásico do selo do sistema de dopamina en estímulo e asociacións de resposta, presumiblemente mediante a mellora da consolidación do rastro aínda activo que media a memoria a curto prazo destas asociacións (121, 122). Aínda que esta visión sostén que as flutuacións de dopamina extracelulares median tanto os efectos de impulsión como de reforzo, pero sostén que os efectos de reforzo son primarios; só despois de que se vexa un alimento ou unha panca de resposta se asociaron cos efectos reforzantes dese alimento ou dun medicamento adictivo, o alimento ou a panca convértese nun estímulo motivacional que pode estimular a ansia e provocar un enfoque. O argumento aquí é que os efectos reforzantes de un determinado alimento ou fármaco son os que hoxe establecen as ansias por ese alimento ou droga.
Comentarios conclusivos
Non é só que a alimentación excesiva de alimentos con alta enerxía se converta en compulsiva e se manteña ante consecuencias negativas o que suxire que o exceso adquire propiedades da adicción. É difícil imaxinar como a selección natural tería como resultado un mecanismo separado para a adicción cando as fontes enriquecidas das drogas e a capacidade de fumar ou inxectalas en alta concentración son acontecementos relativamente recentes da nosa historia evolutiva. A forraxe de drogas e a alimentación necesitan os mesmos movementos coordinados e os seus mecanismos comparten un camiño común final. Cada un deles está asociado a ansias subxectivas e están suxeitos a saciedade momentánea. Cada un deles implica circuítos previos que contribúen de xeito importante tanto á motivación como ao reforzo, circuítos fortemente implicados no establecemento de hábitos instrumentais compulsivos (12, 123-125). Aínda que hai moito interese polo que podemos aprender sobre obesidade a partir de estudos sobre adicción (126), tamén será interesante ver o que podemos aprender sobre a adicción a partir de estudos sobre obesidade e inxestión de alimentos. Por exemplo, as neuronas hipotalámicas de orixe / hipocretina suxeriron papeis na alimentación (127) e recompensar (128) e sábese que a estimulación cerebral recompensa (129), como recompensa de comida (130) pode ser modulado pola hormona saciedade periférica leptina. Novos métodos optoxenéticos (131) permiten a activación moito máis selectiva de circuítos de motivación que o de estimulación eléctrica, e espérase que estes métodos poidan avanzar na nosa comprensión da toma de drogas e de alimentación compulsiva e resolver o paradoxo da recompensa.
Grazas
A preparación deste manuscrito foi apoiada en forma de salario polo programa de investigación intramural, National Insititute on Drug Abuse, National Institutes of Health.
Notas ao pé
Revelacións financeiras
O autor non informa intereses financeiros biomédicos nin posibles conflitos de intereses.
Exención de responsabilidade do editor: Este é un ficheiro PDF dun manuscrito non editado que foi aceptado para publicación. Como servizo aos nosos clientes, estamos a proporcionar esta versión temprana do manuscrito. O manuscrito experimentará a copia, composición e revisión da proba resultante antes de que se publique na súa forma definitiva. Ten en conta que durante o proceso de produción pódense descubrir erros que poden afectar o contido e pertencen os restricións xurídicas que se aplican á revista.
References