Las misteriosas funciones motivacionales de la dopamina mesolímbica (2012)

John D. Salamone, Mercè Correa

Neuron - 8 de noviembre de 2012 (Vol. 76, Número 3, págs. 470-485)

Resumen

Se sabe que la dopamina del núcleo accumbens desempeña un papel en los procesos motivacionales, y las disfunciones de la dopamina mesolímbica pueden contribuir a los síntomas motivacionales de la depresión y otros trastornos, así como a las características del abuso de sustancias. Aunque se ha vuelto tradicional etiquetar las neuronas de dopamina como neuronas de "recompensa", esto es una sobregeneralización y es importante distinguir entre los aspectos de la motivación que se ven afectados de manera diferente por las manipulaciones dopaminérgicas. Por ejemplo, la dopamina accumbens no media en la motivación alimentaria primaria o en el apetito, sino que está involucrada en procesos motivacionales apetitosos y aversivos que incluyen activación conductual, esfuerzo de esfuerzo, comportamiento de aproximación, compromiso de tareas sostenido, procesos pavlovianos y aprendizaje instrumental. En esta revisión, analizamos los complejos roles de la dopamina en las funciones conductuales relacionadas con la motivación.

Texto Principal

La dopamina (DA) de Nucleus accumbens se ha implicado en varias funciones conductuales relacionadas con la motivación. Sin embargo, los detalles de esta participación son complejos y, en ocasiones, pueden ser difíciles de desentrañar. Una consideración importante al interpretar estos hallazgos es la capacidad de distinguir entre diversos aspectos de la función motivacional que se ven afectados de manera diferente por las manipulaciones dopaminérgicas. Aunque las neuronas tegmentales ventrales se han etiquetado tradicionalmente como neuronas de "recompensa" y el DA mesolímbico se ha denominado sistema de "recompensa", esta vaga generalización no se corresponde con los hallazgos específicos que se han observado. El significado científico del término "recompensa" no está claro, y su relación con conceptos como refuerzo y motivación a menudo está mal definida. Los estudios farmacológicos y de depleción de DA demuestran que la DA mesolímbica es fundamental para algunos aspectos de la función motivacional, pero de poca o ninguna importancia para otros. Algunas de las funciones motivacionales del DA mesolímbico representan áreas de superposición entre los aspectos de la motivación y las características del control motor, lo cual es consistente con la conocida participación del núcleo accumbens en la locomoción y procesos relacionados. Además, a pesar de una enorme literatura que vincula el DA mesolímbico con aspectos de la motivación y el aprendizaje aversivos, una literatura que se remonta a varias décadas (p. Ej., Salamone et al., 1994), la tendencia establecida ha sido enfatizar la participación dopaminérgica en la recompensa, el placer y la adicción. , y aprendizaje relacionado con la recompensa, con menos consideración de la participación de DA mesolímbico en procesos aversivos. La presente revisión discutirá la participación de DA mesolímbico en diversos aspectos de la motivación, con énfasis en experimentos que interfieren con la transmisión de DA, particularmente en el núcleo accumbens.

Mesolímbica DA y Motivación: el cambiante panorama teórico

Al menos, los humanos somos contadores de historias empedernidos; somos, después de todo, los descendientes de personas que se sentaron alrededor del fuego por la noche siendo obsequiados por vívidos mitos, cuentos e historias orales. La memoria humana es más eficaz si se pueden tejer hechos o eventos aleatorios en el tapiz significativo de una historia coherente. Los científicos no son diferentes. Una conferencia universitaria eficaz o un seminario científico a menudo se denomina "una buena historia". Lo mismo ocurre con las hipótesis y teorías científicas. Nuestro cerebro parece anhelar el orden y la coherencia del pensamiento que ofrece una hipótesis científica simple y clara, respaldada por la evidencia suficiente para hacerla plausible. El problema es: ¿qué pasa si se mejora la coherencia de la historia al sobreinterpretar algunos hallazgos e ignorar otros? Gradualmente, las piezas del rompecabezas que no encajan continúan carcomiendo el conjunto, lo que finalmente hace que toda la historia sea lamentablemente inadecuada.

Se puede argumentar que este tipo de evolución ha tenido lugar con respecto a la hipótesis DA de "recompensa". Se podría construir una "historia", que procedería de la siguiente manera: el síntoma principal de la depresión es la anhedonia, y dado que el DA es un "transmisor de recompensa" que media las reacciones hedónicas, la depresión se debe a una reducción de la experiencia de placer regulada por DA . Asimismo, se ha sugerido que la adicción a las drogas depende de la experiencia de placer inducida por drogas que secuestran el “sistema de recompensa” del cerebro, que está mediado por la transmisión de DA y evolucionado para transmitir el placer producido por estímulos naturales como la comida. Esto incluso sugeriría que el bloqueo de los receptores de DA podría ofrecer un tratamiento eficaz para la adicción. Finalmente, también se podría ofrecer una “historia” construida sobre la premisa de que las neuronas DA responden exclusivamente a estímulos placenteros como la comida y que esta actividad media la respuesta emocional a estos estímulos, que a su vez subyace en el apetito por el consumo de alimentos. Tales historias no son "hombres de paja" que se construyen artificialmente para estos pasajes. Pero, lamentablemente, a pesar de su popularidad, ninguna de estas ideas está totalmente respaldada por un examen detenido de la literatura.

Para tomar el ejemplo de la participación dopaminérgica en la depresión, uno podría comenzar a deconstruir esta idea señalando que la “anhedonia” en la depresión a menudo es mal interpretada o mal etiquetada por los médicos (Treadway y Zald, 2011). Varios estudios muestran que las personas deprimidas a menudo tienen una experiencia autoevaluada relativamente normal de encuentros con estímulos placenteros y que, más allá de cualquier problema con la experiencia del placer, las personas deprimidas parecen tener deficiencias en la activación conductual, el comportamiento de búsqueda de recompensas y esfuerzo de esfuerzo (Treadway y Zald, 2011). De hecho, la mayoría de las personas deprimidas sufren una constelación paralizante de deficiencias motivacionales que incluyen retraso psicomotor, anergia y fatiga (Demyttenaere et al., 2005; Salamone et al., 2006), y una evidencia considerable implica a la DA en estos síntomas (Salamone et al. ., 2006, Salamone et al., 2007). Estas observaciones, junto con la literatura que indica que no existe una correspondencia simple entre la actividad de DA y la experiencia hedónica (p. Ej., Smith et al., 2011) y los estudios que relacionan el DA con la activación conductual y el esfuerzo (Salamone et al., 2007). ; ver discusión a continuación), nos llevan a concluir que la participación dopaminérgica en la depresión parece ser más complicada de lo que la simple historia hubiera permitido.

De manera similar, está claro que un cuerpo sustancial de investigación sobre la dependencia y adicción a las drogas no cumple con los principios tradicionales de la hipótesis DA de recompensa. Varios estudios han demostrado que el bloqueo de los receptores de DA o la inhibición de la síntesis de DA no atenúa consistentemente la euforia autoinformada o el "subidón" inducido por las drogas de abuso (Gawin, 1986; Brauer y De Wit, 1997; Haney et al., 2001 ; Nann-Vernotica et al., 2001; Wachtel et al., 2002; Leyton et al., 2005; Venugopalan et al., 2011). Investigaciones recientes han identificado diferencias individuales en los patrones de comportamiento que muestran las ratas durante el acondicionamiento del enfoque pavloviano, que están relacionadas con la propensión a autoadministrarse medicamentos. Las ratas que muestran una mayor respuesta a las señales condicionadas (rastreadores de signos) muestran diferentes patrones de adaptación dopaminérgica al entrenamiento en comparación con los animales que responden más al reforzador primario (rastreadores de objetivos; Flagel et al., 2007). Curiosamente, las ratas que muestran un mayor acercamiento condicionado pavloviano a un estímulo apetitivo y muestran un mayor condicionamiento de incentivos a las señales de la droga, también tienden a mostrar un mayor miedo en respuesta a las señales que predicen el shock y un mayor condicionamiento del miedo contextual (Morrow et al., 2011). Investigaciones adicionales han desafiado algunas opiniones mantenidas durante mucho tiempo sobre los mecanismos neuronales que subyacen a la adicción, en contraposición a las características de refuerzo iniciales de las drogas. Se ha vuelto más común ver la adicción en términos de mecanismos de formación de hábitos neoestriatales construidos sobre el consumo extensivo de drogas, que puede ser relativamente independiente de las contingencias de refuerzo instrumental o las características motivacionales iniciales de los reforzadores de drogas (Kalivas, 2008; Belin et al., 2009). ). Estos puntos de vista emergentes sobre la base neuronal de la adicción a las drogas y su posible tratamiento se han movido mucho más allá de la historia original ofrecida por la hipótesis DA de la "recompensa".

Después de décadas de investigación y continuos desarrollos teóricos, se ha producido una reestructuración conceptual sustancial en el campo de la investigación de DA. Hay evidencia considerable que indica que la interferencia con la transmisión de DA mesolímbica deja intactos aspectos fundamentales de la respuesta motivacional y hedónica a los alimentos (Berridge, 2007; Berridge y Kringelbach, 2008; Salamone et al., 2007). Las medidas de comportamiento, como los puntos de ruptura de la relación progresiva y los umbrales de autoestimulación, que antes se pensaba que eran útiles como marcadores de las funciones de "recompensa" o "hedonia" de la DA, ahora se considera que reflejan procesos que implican esfuerzo, percepción del esfuerzo. costos relacionados o de oportunidad y toma de decisiones (Salamone, 2006; Hernandez et al., 2010). Varios artículos recientes de electrofisiología han demostrado la capacidad de respuesta de neuronas DA tegmentales ventrales supuestas o identificadas a estímulos aversivos (Anstrom y Woodward, 2005; Brischoux et al., 2009; Matsumoto y Hikosaka, 2009; Bromberg-Martin et al., 2010; Schultz, 2010; Lammel et al., 2011). Muchos investigadores ahora enfatizan la participación de DA mesolímbico y nigroestriatal en el aprendizaje reforzado o la formación de hábitos (Wise, 2004; Yin et al., 2008; Belin et al., 2009), en lugar de la hedonia per se. Todas estas tendencias han contribuido a una reescritura dramática de la historia de la participación dopaminérgica en la motivación.

Procesos motivacionales: antecedentes históricos y conceptuales

El término motivación se refiere a un constructo que se usa ampliamente en psicología, psiquiatría y neurociencia. Como ocurre con muchos conceptos psicológicos, la discusión de la motivación tuvo sus orígenes en la filosofía. Al describir los factores causales que controlan el comportamiento, el filósofo alemán Schopenhauer, 1999, discutió el concepto de motivación en relación con la forma en que los organismos deben estar en posición de "elegir, aprovechar e incluso buscar los medios de satisfacción". La motivación también fue Un área vital de interés durante el desarrollo inicial de la psicología. Los primeros psicólogos científicos, incluidos Wundt y James, incluyeron la motivación como tema en sus libros de texto. Los neoconductistas, como Hull y Spence, empleaban con frecuencia conceptos motivadores como incentivo y motivación. Young, 1961 definió la motivación como “el proceso de despertar acciones, mantener la actividad en curso y regular el patrón de actividad”. Según una definición más reciente, la motivación es “el conjunto de procesos mediante los cuales los organismos regulan la probabilidad, la proximidad y Disponibilidad de estímulos ”(Salamone, 1992). En términos generales, la construcción psicológica moderna de la motivación se refiere a los procesos relevantes para el comportamiento que permiten a los organismos regular su entorno externo e interno (Salamone, 2010).

Quizás la principal utilidad del constructo de motivación es que proporciona un resumen conveniente y una estructura organizativa para las características observables del comportamiento (Salamone, 2010). El comportamiento se dirige hacia o lejos de estímulos particulares, así como a actividades que implican interactuar con esos estímulos. Los organismos buscan acceso a algunas condiciones de estímulo (es decir, comida, agua, sexo) y evitan otras (es decir, dolor, malestar), tanto de manera activa como pasiva. Además, el comportamiento motivado normalmente tiene lugar en fases (Tabla 1). La etapa terminal del comportamiento motivado, que refleja la interacción directa con el estímulo de la meta, se conoce comúnmente como la fase consumatoria. La palabra "consumatorio" (Craig, 1918) no se refiere a "consumo", sino a "consumación", que significa "completar" o "terminar". En vista del hecho de que los estímulos motivacionales generalmente están disponibles en algunos La distancia física o psicológica del organismo, la única forma de acceder a estos estímulos, es involucrarse en un comportamiento que los acerque o haga que su ocurrencia sea más probable. Esta fase de comportamiento motivado a menudo se conoce como "apetito", "preparatorio", "instrumental", "enfoque" o "búsqueda". Por lo tanto, los investigadores a veces distinguen entre "tomar" y "buscar" un estímulo natural como alimentos (por ejemplo, Foltin, 2001), o de un reforzador de drogas; de hecho, el término "comportamiento de búsqueda de drogas" se ha convertido en una frase común en el lenguaje de la psicofarmacología. Como se analiza a continuación, este conjunto de distinciones (p. Ej., Instrumental versus consumatorio o búsqueda versus toma) es importante para comprender los efectos de las manipulaciones dopaminérgicas en la motivación de estímulos naturales como los alimentos.

Además de los aspectos "direccionales" de la motivación (es decir, que la conducta se dirige hacia o lejos de los estímulos), también se dice que la conducta motivada tiene aspectos "activantes" (Cofer y Appley, 1964; Salamone, 1988, Salamone, 2010; Parkinson et al., 2002; Tabla 1). Debido a que los organismos generalmente están separados de los estímulos motivacionales por una gran distancia, o por varios obstáculos o costos de respuesta, participar en un comportamiento instrumental a menudo implica trabajo (p. Ej., Buscar comida, correr laberintos, presionar palancas). Los animales deben destinar recursos considerables a la conducta de búsqueda de estímulos, que por lo tanto puede caracterizarse por un esfuerzo sustancial, es decir, velocidad, persistencia y altos niveles de producción de trabajo. Aunque el esfuerzo de este esfuerzo a veces puede ser relativamente breve (por ejemplo, un depredador atacando a su presa), en muchas circunstancias debe mantenerse durante largos períodos de tiempo. Las capacidades relacionadas con el esfuerzo son altamente adaptables, porque en el entorno natural la supervivencia puede depender de la medida en que un organismo supere los costos de respuesta relacionados con el tiempo o el trabajo. Por estas razones, la activación conductual se ha considerado un aspecto fundamental de la motivación durante varias décadas. Los psicólogos han utilizado durante mucho tiempo los conceptos de impulso e incentivo para enfatizar los efectos energizantes de las condiciones motivacionales en las medidas de la conducta instrumental, como la velocidad de carrera en un laberinto. Cofer y Appley, 1964 sugirieron que existía un mecanismo de anticipación-vigorización que podía activarse mediante estímulos condicionados y que funcionaba para vigorizar la conducta instrumental. La presentación no contingente programada de estímulos motivacionales primarios, como bolitas de refuerzo de alimentos, puede inducir varias actividades, como beber, locomoción y correr ruedas (Robbins y Koob, 1980; Salamone, 1988). Varios investigadores han estudiado el impacto de los requisitos laborales en el desempeño de tareas instrumentales, lo que finalmente ayudó a sentar las bases para el desarrollo de modelos económicos de comportamiento operante (por ejemplo, Hursh et al., 1988). Los etólogos también han empleado conceptos similares. Los animales que buscan alimento necesitan gastar energía para tener acceso a alimentos, agua o material de nidificación, y la teoría de la búsqueda óptima describe cómo la cantidad de esfuerzo o tiempo invertido para obtener estos estímulos es un determinante importante del comportamiento de elección.

Existe un grado considerable de superposición conceptual entre los procesos de control motor y los aspectos activantes de la motivación. Por ejemplo, la privación de alimentos puede acelerar la velocidad de carrera en un laberinto. ¿Refleja esto condiciones que son motivacionales, motrices o alguna combinación de las dos? La actividad locomotora está claramente bajo el control de los sistemas neurales que regulan el movimiento. Sin embargo, la actividad locomotora en roedores también es muy sensible al impacto de condiciones motivacionales como la novedad, la privación de alimentos o la presentación periódica de pequeños gránulos de comida. Además, si a un organismo se le presenta un desafío relacionado con el trabajo durante la ejecución instrumental, a menudo responde a ese desafío ejerciendo un mayor esfuerzo. El aumento de los requisitos de relación en los horarios operativos, hasta cierto punto, puede crear presiones sustanciales al alza en las tasas de respuesta. Enfrentarse a un obstáculo, como una barrera en un laberinto, puede hacer que los roedores aumenten su esfuerzo y salten la barrera. Además, la presentación de un estímulo condicionado pavloviano asociado con un estímulo motivacional primario como la comida puede servir para instigar el acercamiento o amplificar la actividad instrumental, un efecto conocido como transferencia pavloviana a instrumental (Colwill y Rescorla, 1988). Por lo tanto, los sistemas neuronales que regulan la producción motora parecen operar a instancias de esos sistemas neuronales que dirigen el comportamiento hacia o alejándose de estímulos particulares (Salamone, 2010). Por supuesto, los términos "control motor" y "motivación" no significan exactamente lo mismo, y uno puede encontrar fácilmente puntos de no superposición. Sin embargo, es evidente que también existe una superposición fundamental (Salamone, 1992, Salamone, 2010). A la luz de esta observación, es informativo considerar que las palabras en inglés motivación y movimiento se derivan en última instancia de la palabra latina moverémover moti es el pasado participio de moveré). Al igual que con la distinción entre comportamiento instrumental versus consumo (o búsqueda versus toma), la diferenciación entre los aspectos activacionales y direccionales de la motivación se usa ampliamente para describir los efectos de las manipulaciones dopaminérgicas (Tabla 1). La naturaleza diversa de los procesos motivacionales es una característica importante de la literatura que analiza los efectos conductuales de las manipulaciones dopaminérgicas, así como el enfoque en la actividad dinámica de las neuronas DA mesolímbicas.

Naturaleza disociativa de los efectos de la interferencia con la transmisión DA de Nucleus Accumbens

Al tratar de comprender la literatura sobre las funciones motivacionales de Accumbens DA, debemos considerar varios de los principios conceptuales resaltados anteriormente. Por un lado, debemos reconocer que los procesos motivacionales son disociables en partes componentes, y que las manipulaciones de la transmisión de DA accumbens a veces son capaces de escindir estos componentes como la aplicación de un cortador de diamantes, alterando sustancialmente algunos y dejando otros prácticamente intactos (Salamone y Correa, 2002; Berridge y Robinson, 2003; Smith et al., 2011). Por otro lado, también debemos darnos cuenta de que los procesos motivacionales interactúan con mecanismos relacionados con la emoción, el aprendizaje y otras funciones, y que no existe un mapeo preciso punto a punto entre los procesos conductuales y los sistemas neuronales. Por lo tanto, algunos de los efectos de las manipulaciones dopaminérgicas pueden entenderse más eficazmente en términos de acciones sobre aspectos específicos de la motivación, la función motora o el aprendizaje, mientras que otros efectos pueden ser más directos en áreas de superposición entre estas funciones. Por último, también se debe considerar que es muy poco probable que accumbens DA realice solo una función muy específica; Es difícil concebir una máquina compleja como el cerebro de un mamífero que funcione de una manera tan sencilla. Por tanto, el DA accumbens probablemente realiza varias funciones, y cualquier método conductual o de neurociencia en particular puede ser muy adecuado para caracterizar algunas de estas funciones, pero poco adecuado para otras. En vista de esto, puede resultar difícil reunir una visión coherente.

Las manipulaciones cerebrales pueden alterar subcomponentes de un proceso conductual de una manera muy específica. Este principio ha sido muy útil en la neurociencia cognitiva y ha llevado a distinciones importantes en términos de procesos de memoria disociables (es decir, memoria declarativa versus procedimental, memoria de trabajo versus memoria de referencia, procesos dependientes del hipocampo versus procesos independientes). Por el contrario, la tendencia en gran parte de la literatura que discute las funciones conductuales de la DA accumbens ha sido, en cambio, utilizar instrumentos conceptuales bastante contundentes, es decir, términos muy generales y vagos como "recompensa", para resumir las acciones de las drogas u otras manipulaciones. De hecho, el término "recompensa" ha sido criticado en detalle en otros lugares (Cannon y Bseikri, 2004; Salamone, 2006; Yin et al., 2008; Salamone et al., 2012). Aunque el término recompensa tiene un significado como sinónimo de "reforzador", no existe un significado científico consistente de "recompensa" cuando se usa para describir un proceso neuroconductual; algunos lo emplean como sinónimo de "refuerzo", mientras que otros lo usan para significar "motivación primaria" o "apetito", o como un sinónimo apenas disfrazado de "placer" o "hedonia" (para una descripción histórica de la "hipótesis de la anhedonia" , ”Ver Wise, 2008). En muchos casos, la palabra “recompensa” parece usarse como un término general que se refiere a todos los aspectos del aprendizaje apetitivo, la motivación y la emoción, incluidos los aspectos condicionados e incondicionados; este uso es tan amplio que en esencia no tiene sentido. Se puede argumentar que el uso excesivo del término "recompensa" es una fuente de tremenda confusión en esta área. Mientras que un artículo puede usar recompensa para referirse a placer, otro puede usar el término para referirse al aprendizaje por refuerzo pero no al placer, y un tercero puede referirse a la motivación apetitiva de una manera muy general. Estos son tres significados muy diferentes de la palabra, que confunden la discusión de las funciones conductuales del DA mesolímbico. Además, etiquetar DA mesolímbico como un "sistema de recompensa" sirve para restar importancia a su papel en la motivación aversiva. Quizás el mayor problema con el término "recompensa" es que evoca el concepto de placer o hedonia en muchos lectores, incluso si esto no es intencionado por el autor.

La presente revisión se centra en la participación de los accumbens DA en las características de la motivación de los refuerzos naturales, como los alimentos. En general, hay pocas dudas de que el DA accumbens está involucrado en algunos aspectos de la motivación de los alimentos; pero que aspectos? Como veremos a continuación, los efectos de la interferencia con la transmisión de DA de Accumbens son de naturaleza altamente selectiva o disociativa, lo que afecta algunos aspectos de la motivación y deja otros intactos. El resto de esta sección se centrará en los resultados de experimentos en los que se usan fármacos dopaminérgicos o agentes neurotóxicos para alterar la función del comportamiento.

Aunque generalmente se reconoce que la depleción de DA en el prosencéfalo puede afectar la alimentación, este efecto está estrechamente relacionado con la depleción o antagonismo de DA en las áreas sensitivomotoras o relacionadas con el motor del neostriatum lateral o ventrolateral, pero no del núcleo accumbens (Dunnett e Iversen, 1982; Salamone et al., 1993). Un estudio de optogenética reciente mostró que la estimulación de las neuronas GABA tegmentales ventrales, que da como resultado la inhibición de las neuronas DA, actuaba para suprimir la ingesta de alimentos (van Zessen et al., 2012). Sin embargo, no está claro si este efecto se debe específicamente a acciones dopaminérgicas, o si depende de efectos aversivos que también se producen con esta manipulación (Tan et al., 2012). De hecho, se ha demostrado repetidamente que el agotamiento y el antagonismo de DA accumbens no perjudican sustancialmente la ingesta de alimentos (Ungerstedt, 1971; Koob et al., 1978; Salamone et al., 1993; Baldo et al., 2002; Baldo y Kelley, 2007) . Según sus hallazgos de que las inyecciones de D1 o D2 Los antagonistas familiares en el núcleo o la cáscara de Accumbens deterioraron la actividad motora, pero no suprimieron la ingesta de alimentos, Baldo et al., 2002 afirmaron que el antagonismo de DA de Accumbens "no abolió la motivación principal para comer". Las reducciones de DA de Accumbens no lograron reducir la ingesta de alimentos o la tasa de alimentación, y no afectaron la manipulación de los alimentos, aunque reducciones similares del neostriatum ventrolateral afectaron estas medidas (Salamone et al., 1993). Además, los efectos de los antagonistas de DA o de la depleción de DA accumbens sobre el comportamiento instrumental reforzado con alimentos no se parecen mucho a los efectos de los fármacos supresores del apetito (Salamone et al., 2002; Sink et al., 2008), o la devaluación del reforzador proporcionada por prealimentación (Salamone et al., 1991; Aberman y Salamone, 1999; Pardo et al., 2012). Lex y Hauber, 2010 demostraron que las ratas con depleción de DA accumbens eran sensibles a la devaluación del refuerzo alimentario durante una tarea instrumental. Además, Wassum et al., 2011 demostraron que el antagonista de DA flupentixol no afectó la palatabilidad de la recompensa de los alimentos ni el aumento de la palatabilidad de la recompensa inducida por el cambio ascendente en el estado motivacional producido por una mayor privación de alimentos.

Una evidencia considerable también indica que el DA del núcleo accumbens no media directamente la reactividad hedónica a los alimentos. Un enorme trabajo de Berridge y sus colegas ha demostrado que la administración sistémica de antagonistas de DA, así como la depleción de DA en todo el prosencéfalo o núcleo accumbens, no mitigan la reactividad del gusto apetitivo por los alimentos, que es una medida ampliamente aceptada de la reactividad hedónica a las soluciones dulces. (Berridge y Robinson, 1998, Berridge y Robinson, 2003; Berridge, 2007). Además, la caída del transportador de DA (Peciña et al., 2003), así como las microinyecciones de anfetamina en el núcleo accumbens (Smith et al., 2011), que elevan la DA extracelular, no lograron mejorar la reactividad del gusto apetitivo por la sacarosa. Sederholm et al., 2002 informaron que los receptores D2 en la cáscara del núcleo accumbens regulan la reactividad del gusto aversivo, y que la estimulación del receptor D2 del tallo cerebral suprimió el consumo de sacarosa, pero ninguna población de receptores medió la manifestación hedónica del gusto.

Si el DA del núcleo accumbens no media el apetito por la comida per se, o las reacciones hedónicas inducidas por la comida, ¿cuál es su implicación en la motivación alimentaria? Existe un consenso considerable en que la reducción o el antagonismo de DA accumbens dejan intactos aspectos centrales de la hedonia inducida por los alimentos, el apetito o la motivación alimentaria primaria, pero sin embargo afectan las características críticas del comportamiento instrumental (es decir, la búsqueda de alimentos) (Tabla 1; Figura 1) . Los investigadores han sugerido que la DA del núcleo accumbens es particularmente importante para la activación del comportamiento (Koob et al., 1978; Robbins y Koob, 1980; Salamone, 1988, Salamone, 1992; Salamone et al., 1991, Salamone et al., 2005, Salamone et al., 2007; Calaminus y Hauber, 2007; Lex y Hauber, 2010), esfuerzo durante el comportamiento instrumental (Salamone et al., 1994, Salamone et al., 2007, Salamone et al., 2012; Mai et al. ., 2012), transferencia pavloviana a instrumental (Parkinson et al., 2002; Everitt y Robbins, 2005; Lex y Hauber, 2008), comportamiento de aproximación flexible (Nicola, 2010), gasto y regulación de energía (Salamone, 1987; Beeler et al., 2012) y la explotación del aprendizaje por recompensa (Beeler et al., 2010). El agotamiento y el antagonismo de DA de Accumbens reducen la actividad locomotora y la cría espontánea e inducida por novedades, así como la actividad inducida por estimulantes (Koob et al., 1978; Cousins ​​et al., 1993; Baldo et al., 2002). Actividades como beber en exceso, correr ruedas o actividad locomotora que son inducidas por la presentación periódica de gránulos de comida a animales privados de comida se reducen por la reducción de DA accumbens (Robbins y Koob, 1980; McCullough y Salamone, 1992). Además, las dosis bajas de antagonistas de DA, así como el antagonismo o la depleción de DA accumbens, reducen la respuesta reforzada con alimentos en algunas tareas a pesar de que la ingesta de alimentos se conserva en esas condiciones (Salamone et al., 1991, Salamone et al., 2002; Ikemoto y Panksepp, 1996; Koch et al., 2000). Los efectos de la depleción de DA accumbens sobre el comportamiento reforzado con alimentos varían mucho según los requisitos de la tarea o el programa de refuerzo. Si los efectos primarios de la depleción de DA accumbens estuvieran relacionados con una reducción del apetito por la comida, entonces uno esperaría que el programa de proporción fija 1 (FR1) fuera muy sensible a esta manipulación. Sin embargo, este programa es relativamente insensible a los efectos de la transmisión comprometida de DA en accumbens (Aberman y Salamone, 1999; Salamone et al., 2007; Nicola, 2010). Uno de los factores críticos que producen sensibilidad a los efectos de la reducción de DA accumbens en el comportamiento reforzado con alimentos es el tamaño del requisito de relación (es decir, el número de presiones de palanca necesarias por reforzador; Aberman y Salamone, 1999; Mingote et al., 2005). Además, el bloqueo de los receptores de DA accumbens perjudica el desempeño del enfoque instrumental instigado por la presentación de señales (Wakabayashi et al., 2004; Nicola, 2010).

La capacidad de los antagonistas de DA o depleciones de DA accumbens para disociar entre el consumo de alimentos y el comportamiento instrumental reforzado por alimentos, o entre diferentes tareas instrumentales, no es un detalle trivial o un resultado epifenómeno. Más bien, demuestra que en condiciones en las que se puede alterar el comportamiento instrumental reforzado con alimentos, los aspectos fundamentales de la motivación alimentaria están intactos. Varios investigadores que han escrito sobre las características fundamentales de los estímulos reforzantes han llegado a la conclusión de que los estímulos que actúan como reforzadores positivos tienden a ser relativamente preferidos, a provocar un acercamiento, una conducta dirigida a un objetivo o una conducta consumatoria, o generan un alto grado de demanda, y que estos efectos son un aspecto fundamental del refuerzo positivo (Dickinson y Balleine, 1994; Salamone y Correa, 2002; Salamone et al., 2012). Como se indica en el análisis económico conductual ofrecido por Hursh, 1993: "la respuesta se considera una variable dependiente secundaria que es importante porque es fundamental para controlar el consumo". Por lo tanto, los resultados descritos anteriormente demuestran que las dosis bajas de antagonistas de DA y la depleción de DA accumbens no afectan los aspectos fundamentales de la motivación y el refuerzo alimentarios primarios o incondicionados, pero hacen que los animales sean sensibles a algunas características del requisito de respuesta instrumental, la respuesta contundente a las señales condicionadas, y reducir la tendencia de los animales a trabajar para reforzar los alimentos.

Una de las manifestaciones de la naturaleza disociativa de los efectos conductuales de dosis sistémicas bajas de antagonistas de DA, y el agotamiento o antagonismo de DA accumbens, es que estas condiciones afectan la asignación relativa de comportamiento en animales que responden a tareas que evalúan la toma de decisiones basada en el esfuerzo. (Salamone et al., 2007; Floresco et al., 2008; Mai et al., 2012). Una tarea que se ha utilizado para evaluar los efectos de las manipulaciones dopaminérgicas en la asignación de respuesta ofrece a las ratas la posibilidad de elegir entre presionar la palanca reforzada por la entrega de un alimento relativamente preferido, o acercarse y consumir un alimento disponible al mismo tiempo pero menos preferido (Salamone et al., 1991 , Salamone et al., 2007). En condiciones de referencia o de control, las ratas adiestradas obtienen la mayor parte de su alimento presionando la palanca y consumen pequeñas cantidades de alimento. Dosis bajas a moderadas de antagonistas de DA que bloquean D1 o D2 Los subtipos de receptores familiares producen una alteración sustancial de la asignación de respuesta en ratas que realizan esta tarea, disminuyendo la presión de la palanca reforzada con alimentos pero aumentando sustancialmente la ingesta de comida (Salamone et al., 1991; Koch et al., 2000; Sink et al., 2008) . Esta tarea ha sido validada en varios experimentos. Las dosis de antagonistas de DA que producen el cambio de la presión de la palanca a la ingesta de comida no afectan la ingesta total de alimentos ni alteran la preferencia entre estos dos alimentos específicos en las pruebas de elección de alimentación libre (Salamone et al., 1991; Koch et al., 2000). Por el contrario, los supresores del apetito de diferentes clases, incluidos los antagonistas de la fenfluramina y los cannabinoides CB1 (Salamone et al., 2007; Sink et al., 2008), no lograron aumentar la ingesta de comida en dosis que suprimieron la presión de la palanca. En contraste con los efectos del antagonismo de la DA, la alimentación previa, que es un tipo de devaluación del reforzador, redujo tanto la presión de la palanca como la ingesta de comida (Salamone et al., 1991). Estos resultados indican que la interferencia con la transmisión de DA no solo reduce la motivación o la ingesta primaria de alimentos, sino que altera la asignación de respuestas entre fuentes alternativas de alimentos que se obtienen a través de diferentes respuestas. Estos efectos conductuales dependen de la DA accumbens y son producidos por la depleción de DA accumbens y las infusiones locales de D1 o D2 antagonistas de la familia en el núcleo o caparazón de accumbens (Salamone et al., 1991; Koch et al., 2000; Nowend et al., 2001; Farrar et al., 2010; Mai et al., 2012).

También se ha desarrollado un procedimiento de laberinto en T para estudiar la elección relacionada con el esfuerzo. Para esta tarea, los dos brazos elegidos del laberinto conducen a diferentes densidades de refuerzo (p. Ej., 4 frente a 2 gránulos de alimentos, o 4 frente a 0) y, en algunas condiciones, se coloca una barrera en el brazo con la mayor densidad de refuerzo alimentario. para imponer un desafío relacionado con el esfuerzo (Salamone et al., 1994). Cuando el brazo de alta densidad tiene la barrera en su lugar, y el brazo sin la barrera contiene menos reforzadores, las reducciones de DA accumbens o el antagonismo disminuyen la elección del brazo de alto costo / alta recompensa y aumentan la selección del brazo de bajo costo / recompensa baja (Salamone et al., 1994; Denk et al., 2005; Pardo et al., 2012; Mai et al., 2012). Cuando no había barrera en el laberinto, los roedores preferían el brazo de alta densidad de refuerzo, y ni el antagonismo del receptor de DA ni el agotamiento de DA accumbens alteraron su elección (Salamone et al., 1994). Cuando el brazo con la barrera contenía 4 gránulos, pero el otro brazo no contenía gránulos, las ratas con depleciones de DA accumbens todavía eligieron el brazo de alta densidad, treparon la barrera y consumieron los gránulos. En un estudio reciente de T-maze con ratones, mientras que el haloperidol redujo la elección del brazo con la barrera, este fármaco no tuvo ningún efecto sobre la elección cuando ambos brazos tenían una barrera en su lugar (Pardo et al., 2012). Por lo tanto, las manipulaciones dopaminérgicas no alteraron la preferencia basada en la magnitud del refuerzo y no afectaron la discriminación, la memoria o los procesos de aprendizaje instrumental relacionados con la preferencia del brazo. Bardgett et al., 2009 desarrollaron una tarea de descuento del esfuerzo del laberinto en T, en la que la cantidad de comida en el brazo de alta densidad del laberinto disminuía en cada prueba en la que las ratas seleccionaban ese brazo. El descuento por esfuerzo fue alterado por la administración de D1 y D2 antagonistas familiares, lo que hizo más probable que las ratas eligieran el brazo de bajo refuerzo / bajo costo. El aumento de la transmisión de DA mediante la administración de anfetamina bloqueó los efectos de SCH23390 y haloperidol y también predispuso a las ratas a elegir el brazo de alto refuerzo / alto costo, lo cual es consistente con los estudios de elección operante usando ratones derribados del transportador DA (Cagniard et al., 2006).

Una de las cuestiones importantes en esta área es la medida en que los animales con transmisión de DA deficiente son sensibles a los requisitos de trabajo en tareas relacionadas con el esfuerzo, oa otros factores como retrasos en el tiempo (p. Ej., Denk et al., 2005; Wanat et al., 2010). En general, los efectos del antagonismo de DA sobre el descuento por demora han demostrado ser bastante mixtos (Wade et al., 2000; Koffarnus et al., 2011), y Winstanley et al., 2005 informaron que las reducciones de DA accumbens no afectaron el descuento por demora. Floresco et al., 2008 demostraron que el haloperidol, antagonista de la DA, alteraba el descuento del esfuerzo incluso cuando controlaban los efectos del fármaco en la respuesta a los retrasos. Wakabayashi et al., 2004 encontraron que el bloqueo del núcleo accumbens D1 o D2 Los receptores no afectaron el rendimiento en un programa de intervalos progresivos, lo que implica esperar intervalos de tiempo cada vez más largos para recibir refuerzo. Además, los estudios con programas de refuerzo en tándem que tienen requisitos de proporción adjuntos a los requisitos de intervalo de tiempo indican que las reducciones de DA de los accumbens hacen que los animales sean más sensibles a los requisitos de proporción adicional, pero no los hacen sensibles a los requisitos de intervalo de tiempo de 30 a 120 s (Correa et al. , 2002; Mingote et al., 2005).

En resumen, los resultados del laberinto en T y los estudios de elección operante en roedores apoyan la idea de que dosis bajas de antagonistas de DA y depleciones de DA accumbens dejan intactos aspectos fundamentales de la motivación primaria y el refuerzo, pero no obstante reducen la activación conductual y hacen que los animales reasignen su instrumental. selección de respuesta basada en los requisitos de respuesta de la tarea y seleccionar alternativas de menor costo para obtener reforzadores (Salamone et al., 2007, Salamone et al., 2012). Una evidencia considerable indica que la DA mesolímbica es parte de un circuito más amplio que regula la activación del comportamiento y las funciones relacionadas con el esfuerzo, que incluye otros transmisores (adenosina, GABA; Mingote et al., 2008; Farrar et al., 2008, Farrar et al., 2010 ; Nunes et al., 2010; Salamone et al., 2012) y áreas del cerebro (amígdala basolateral, corteza cingulada anterior, pálido ventral; Walton et al., 2003; Floresco y Ghods-Sharifi, 2007; Mingote et al., 2008 ; Farrar et al., 2008; Hauber y Sommer, 2009).

Involucramiento de Mesolimbic DA en la motivación apetitosa: actividad dinámica de los sistemas DA

Aunque a veces se dice que la liberación de DA del núcleo accumbens o la actividad de las neuronas DA tegmentales ventrales es instigada por la presentación de reforzadores positivos como la comida, la literatura que describe la respuesta de DA mesolímbico a los estímulos apetitivos es bastante complicada (Hauber, 2010). En un sentido general, ¿la presentación de alimentos aumenta la actividad de las neuronas DA o la liberación de DA accumbens? En una amplia gama de condiciones y en diferentes fases de la conducta motivada, ¿qué fases o aspectos de la motivación están estrechamente vinculados a la instigación de la actividad dopaminérgica? La respuesta a estas preguntas depende de la escala de tiempo de la medición y las condiciones de comportamiento específicas que se estudian. Las fluctuaciones en la actividad de DA pueden tener lugar en múltiples escalas de tiempo, y a menudo se hace una distinción entre actividad "fásica" y "tónica" (Grace, 2000; Floresco et al., 2003; Goto y Grace, 2005). Las técnicas de registro electrofisiológico son capaces de medir la actividad fásica rápida de neuronas DA putativas (p. Ej., Schultz, 2010), y los métodos de voltamperometría (p. Ej., Voltamperometría cíclica rápida) registran los "transitorios" de DA que son cambios fásicos rápidos en DA extracelular, que se cree que son representan la liberación de ráfagas de actividad neuronal DA (p. ej., Roitman et al., 2004; Sombers et al., 2009; Brown et al., 2011). También se ha sugerido que los cambios fásicos rápidos en la liberación de DA pueden ser relativamente independientes de la activación de las neuronas de DA y, en cambio, pueden reflejar la activación sincronizada de las interneuronas estriatales colinérgicas que promueven la liberación de DA a través de un mecanismo de receptor nicotínico presináptico (Rice et al., 2011; Threlfell et al., 2012; Surmeier y Graybiel, 2012). Los métodos de microdiálisis, por otro lado, miden la DA extracelular de una manera que representa el efecto neto de los mecanismos de liberación y absorción integrados en unidades más grandes de tiempo y espacio en relación con la electrofisiología o voltamperometría (p. Ej., Hauber, 2010). Por lo tanto, a menudo se sugiere que los métodos de microdiálisis midan los niveles de DA "tónicos". Sin embargo, en vista del hecho de que la microdiálisis puede medir las fluctuaciones relacionadas con el comportamiento o las drogas (p. Ej., Aumentos seguidos de disminuciones) en la DA extracelular que se producen en minutos, quizás sea más útil emplear el término "fásico rápido" para hablar sobre los cambios rápidos en la actividad relacionada con la DA que pueden medirse con electrofisiología o voltamperometría, y "fásica lenta" en referencia a los cambios que tienen lugar en la escala de tiempo más lenta medida con métodos de microdiálisis (p. ej., Hauber, 2010; Segovia et al. ., 2011).

Los estudios de electrofisiología han demostrado que la presentación de reforzadores alimentarios nuevos o inesperados se acompaña de aumentos transitorios en la actividad de neuronas DA tegmentales ventrales putativas, pero que este efecto desaparece con la presentación regular o la exposición repetida a través del entrenamiento (Schultz et al., 1993; Schultz, 2010). Empleando métodos de voltamperometría para medir cambios fásicos rápidos en la liberación de DA, Roitman et al., 2004 demostraron que, en animales entrenados, la exposición a un estímulo condicionado que indica que presionar la palanca daría como resultado el suministro de sacarosa fue acompañada por un aumento en los transitorios de DA, sin embargo, la presentación real del reforzador de sacarosa no lo era. Un hallazgo similar fue informado hace años por Nishino et al., 1987, quienes estudiaron la presión de palanca de relación fija libre operante en monos y observaron que la actividad de las supuestas neuronas DA tegmentales ventrales aumentaba durante la presión de palanca en animales entrenados, pero en realidad disminuía durante la presentación del reforzador. . La entrega de alimentos no prevista, así como la presentación de señales que predijeron la entrega de alimentos, aumentó la señalización fásica rápida medida por voltamperometría en el núcleo del núcleo accumbens (Brown et al., 2011). DiChiara y sus colegas demostraron que la exposición a nuevos alimentos sabrosos aumentaba transitoriamente la DA extracelular en la capa del núcleo accumbens según lo medido por microdiálisis, pero que esta respuesta se habituaba rápidamente (p. Ej., Bassareo et al., 2002). Un artículo de microdiálisis reciente demostró que la presentación de reforzadores de alimentos ricos en carbohidratos a ratas previamente expuestas no produjo ningún cambio en la DA extracelular en el núcleo o la cáscara de accumbens (Segovia et al., 2011). Por el contrario, tanto la adquisición como el mantenimiento de la presión de la palanca de relación fija se asociaron con aumentos en la liberación de DA (Segovia et al., 2011). Se mostró un patrón similar cuando se midieron los marcadores de transducción de señales relacionados con la DA (c-Fos y DARPP-32) (Segovia et al., 2012). Tomados en conjunto, estos estudios no apoyan la idea de que la presentación de los alimentos en sí, incluida la de los alimentos sabrosos, aumente uniformemente la liberación de DA accumbens en una amplia gama de condiciones.

Sin embargo, una evidencia considerable indica que los aumentos en la transmisión de DA están asociados con la presentación de estímulos asociados con reforzadores naturales como la comida o el desempeño de la conducta instrumental; esto se ha visto en estudios que involucran microdiálisis (Sokolowski y Salamone, 1998; Ostlund et al., 2011; Hauber, 2010; Segovia et al., 2011), voltamperometría (Roitman et al., 2004; Brown et al., 2011; Cacciapaglia et al., 2011) y registros electrofisiológicos durante la respuesta operante libre (Nishino et al., 1987; Kosobud et al., 1994). Cacciapaglia et al., 2011 informaron que la liberación fásica rápida de DA en el núcleo accumbens, medida por voltamperometría, ocurrió durante el inicio de una señal que señaló la disponibilidad del reforzador, así como la respuesta a la presión de la palanca, y que los efectos excitadores de esta liberación fásica en las neuronas accumbens fueron embotado por la inactivación del disparo de ráfaga en neuronas DA tegmentales ventrales. Además, un cuerpo sustancial de investigación en electrofisiología ha identificado algunas de las condiciones que activan el disparo de ráfagas en neuronas DA tegmentales ventrales putativas, incluida la presentación de estímulos que están asociados con el reforzador primario, así como las condiciones que tienen un valor de refuerzo más alto en relación con el expectativa generada por la experiencia previa (Schultz et al., 1997). La observación posterior ha llevado a la hipótesis de que la actividad de las neuronas DA podría representar el tipo de señal de error de predicción descrito por algunos modelos de aprendizaje (por ejemplo, Rescorla y Wagner, 1972). Este patrón de actividad en neuronas DA putativas ha proporcionado una base teórica formal para la participación de la señalización DA fásica rápida en modelos de aprendizaje por refuerzo (Schultz et al., 1997; Bayer y Glimcher, 2005; Niv, 2009; Schultz, 2010).

Aunque el enfoque principal del presente artículo es sobre los efectos de las manipulaciones dopaminérgicas en distintos aspectos de la motivación, es útil considerar la importancia de la señalización fásica rápida y fásica lenta (es decir, "tónica") para interpretar los efectos de las condiciones que interfieren con transmisión DA. Las diferentes escalas de tiempo de la actividad dopaminérgica podrían tener funciones muy diferentes y, por lo tanto, los efectos de una manipulación particular podrían depender mucho de si está alterando la actividad fásica rápida o lenta o los niveles de referencia de DA. Los investigadores han utilizado diversas manipulaciones farmacológicas o genéticas para afectar de manera diferencial la actividad rápida fásica de DA frente a la liberación de DA en escalas de tiempo más lentas (Zweifel et al., 2009; Parker et al., 2010; Grieder et al., 2012) y han informado que estas manipulaciones puede ejercer distintos efectos conductuales. Por ejemplo, Grieder et al., 2012 demostraron que la interferencia selectiva con la actividad fásica de DA impedía la expresión de aversiones condicionadas al lugar a la abstinencia de una sola dosis aguda de nicotina, pero no a la abstinencia de la nicotina crónica. Por el contrario, el bloqueo de los receptores D2 altera la expresión de la aversión condicionada durante la abstinencia crónica, pero no aguda. Zweifel et al., 2009 informaron que la inactivación genética selectiva de los receptores NMDA, que atenuó el disparo de ráfagas en las neuronas VTA DA, perjudicó la adquisición del aprendizaje apetitivo dependiente de señales, pero no interrumpió el comportamiento de trabajar para el refuerzo alimentario en un programa de proporción progresiva. De hecho, una serie de funciones de comportamiento relacionadas con la DA se conservan en animales con alteración de la actividad DA fásica rápida (Zweifel et al., 2009; Wall et al., 2011; Parker et al., 2010). Estas observaciones tienen implicaciones para integrar información de estudios de actividad fásica rápida con aquellos que se enfocan en los efectos del antagonismo o agotamiento de DA. En primer lugar, sugieren que se debe tener cuidado al generalizar a partir de conceptos generados en estudios de electrofisiología o voltamperometría (p. Ej., Que la liberación de DA actúa como una "señal de enseñanza") a las funciones conductuales que se deterioran cuando se utilizan drogas o agotamiento de DA interrumpir la transmisión de DA. Además, indican que los estudios de la actividad fásica rápida de las neuronas DA mesolímbicas pueden explicar las condiciones que aumentan o disminuyen rápidamente la actividad de DA o proporcionan una señal de DA discreta, pero no nos informan estrictamente sobre la amplia gama de funciones realizadas por la transmisión de DA a través de múltiples escalas de tiempo o aquellos afectados por la interrupción de la transmisión DA.

Participación de mecanismos mesolímbicos y neostriatales en el aprendizaje instrumental adecuado

Aunque se puede definir la motivación en términos que la distingan de otros constructos, se debe reconocer que, al discutir completamente las características conductuales o la base neuronal de la motivación, también se deben considerar las funciones relacionadas. El cerebro no tiene diagramas de caja y flechas o demarcaciones que separen cuidadosamente las funciones psicológicas centrales en sistemas neuronales discretos que no se superpongan. Por tanto, es importante comprender la relación entre los procesos motivacionales y otras funciones como la homeostasis, alostasis, emoción, cognición, aprendizaje, refuerzo, sensación y función motora (Salamone, 2010). Por ejemplo, Panksepp, 2011 enfatizó cómo las redes emocionales en el cerebro están intrincadamente entretejidas con los sistemas motivacionales involucrados en procesos como la búsqueda, la ira o el pánico. Además, el comportamiento de búsqueda / instrumental no solo está influenciado por las propiedades emocionales o motivacionales de los estímulos, sino también, por supuesto, por los procesos de aprendizaje. Los animales aprenden a participar en respuestas instrumentales específicas que están asociadas con resultados de refuerzo particulares. Como parte fundamental de la estructura asociativa del condicionamiento instrumental, los organismos deben aprender qué acciones conducen a qué estímulos (es decir, asociaciones acción-resultado). Por lo tanto, las funciones motivacionales están entrelazadas con funciones motoras, cognitivas, emocionales y otras (Mogenson et al., 1980). Aunque la presente revisión se centra en la participación de DA mesolímbico en la motivación de los reforzadores naturales, también es útil tener una breve discusión sobre la supuesta participación de DA mesolímbico en el aprendizaje instrumental.

Uno podría pensar que sería relativamente sencillo demostrar que el núcleo accumbens DA media el aprendizaje por refuerzo o está involucrado de manera crítica en los procesos de plasticidad sináptica que subyacen a la asociación de una respuesta operante con la entrega de un reforzador (es decir, asociaciones acción-resultado). Pero esta área de investigación es tan difícil y complicada de interpretar como la investigación motivacional revisada anteriormente. Por ejemplo, Smith-Roe y Kelley, 2000 mostraron que el bloqueo simultáneo de DA D1 y los receptores NMDA en el núcleo accumbens del núcleo retrasaron la adquisición del prensado de palanca instrumental. Además, las manipulaciones posteriores a la sesión que afectan la consolidación de la memoria también afectaron la adquisición de la presión de la palanca instrumental (Hernandez et al., 2002). Sin embargo, al revisar la literatura sobre el núcleo accumbens y el aprendizaje instrumental, Yin et al., 2008 concluyeron que “el accumbens no es necesario ni suficiente para el aprendizaje instrumental”. Del mismo modo, Belin et al., 2009 observaron que las manipulaciones de lesiones y drogas del núcleo del núcleo accumbens pueden afectar la adquisición de la conducta instrumental reforzada por estímulos naturales, pero afirmaron que las "contribuciones psicológicas precisas" de los accumbens y otras estructuras cerebrales siguen sin estar claras. Aunque hay muchos estudios que muestran que las lesiones del cuerpo celular, los antagonistas de DA o la depleción de DA pueden afectar los resultados relacionados con el aprendizaje en procedimientos como la preferencia de lugar, la adquisición de presión de la palanca u otros procedimientos, esto en sí mismo no demuestra que las neuronas del núcleo accumbens o La transmisión de DA mesolímbica es esencial para las asociaciones específicas que subyacen al aprendizaje instrumental (Yin et al., 2008). Los efectos específicos relacionados con el aprendizaje instrumental se pueden demostrar mediante evaluaciones de los efectos de la devaluación del reforzador o la degradación contingente, que a menudo no se realizan en farmacología o estudios de lesiones. Teniendo esto en cuenta, es importante tener en cuenta que las lesiones del cuerpo celular en el núcleo o la cáscara de los accumbens no alteraron la sensibilidad a la degradación por contingencia (Corbit et al., 2001). Lex y Hauber, 2010 descubrieron que las ratas con agotamientos de DA de núcleo accumbens aún eran sensibles a la devaluación del reforzador, y sugirieron que el DA de Accumbens Core podría no ser crucial para codificar asociaciones de acción-resultado. Aunque no está claro si la DA accumbens es fundamental para las asociaciones entre la respuesta y el reforzador, hay pruebas considerables que indican que la DA del núcleo accumbens es importante para el enfoque pavloviano y la transferencia pavloviana a instrumental (Parkinson et al., 2002; Wyvell y Berridge, 2000; Dalley et al., 2005; Lex y Hauber, 2008, Lex y Hauber, 2010; Yin et al., 2008). Tales efectos podrían proporcionar un mecanismo por el cual los estímulos condicionados pueden ejercer efectos activadores sobre la respuesta instrumental (Robbins y Everitt, 2007; Salamone et al., 2007), como se discutió anteriormente. Los efectos de activación o activación de los estímulos condicionados pueden ser un factor en la amplificación de una respuesta instrumental ya adquirida, pero también podrían actuar para promover la adquisición al aumentar el rendimiento de la respuesta y la variabilidad del comportamiento, creando así la ocasión para más oportunidades para emparejar una respuesta con refuerzo.

Curiosamente, aunque nocaut de DA D1 los receptores mitigaron la adquisición de la conducta de aproximación pavloviana, la desactivación de los receptores NMDA, que resultó en una disminución de 3 veces en la liberación fásica rápida de DA instigada por la presentación de señales asociadas con los alimentos, no retrasó la adquisición de la conducta de aproximación pavloviana (Parker et al. ., 2010). Esto indica que la relación entre la liberación rápida de DA fásica y el aprendizaje sigue siendo incierta. Los estudios futuros deben examinar los efectos de las manipulaciones que afectan la señalización de DA fásica rápida utilizando procedimientos que evalúan directamente el aprendizaje por refuerzo (es decir, devaluación del reforzador y degradaciones de contingencia). Además, los métodos genéticos y farmacológicos que conducen a la supresión de la actividad DA fásica rápida deben evaluarse más a fondo por sus acciones sobre la activación conductual y los aspectos de la motivación relacionados con el esfuerzo.

Participación de DA Mesolímbica en la Motivación Aversiva y el Aprendizaje: Actividad Dinámica de los Sistemas DA

Una revisión superficial de algunos artículos en la literatura de DA podría dejar a uno con la impresión de que la DA mesolímbica está involucrada selectivamente en los procesos hedónicos, la motivación apetitiva y el aprendizaje relacionado con el refuerzo, con exclusión de los aspectos aversivos del aprendizaje y la motivación. Sin embargo, tal punto de vista estaría en desacuerdo con la literatura. Como se describió anteriormente, una evidencia considerable indica que la transmisión de DA accumbens no media directamente las reacciones hedónicas a los estímulos. Además, existe una gran cantidad de literatura que indica que el DA mesolímbico está involucrado en la motivación aversiva y puede afectar el comportamiento en los procedimientos de aprendizaje aversivos. Varias condiciones de aversión diferentes (p. Ej., Choque, pellizco de la cola, estrés de restricción, estímulos condicionados aversivos, drogas aversivas, derrota social) pueden aumentar la liberación de DA medida por métodos de microdiálisis (McCullough et al., 1993; Salamone et al., 1994 ; Tidey y Miczek, 1996; Young, 2004). Durante muchos años, se pensó que la actividad de la neurona DA tegmental ventral no aumentaba con estímulos aversivos; sin embargo, estudios recientes han demostrado que la actividad electrofisiológica de neuronas DA putativas o identificadas aumenta por condiciones aversivas o estresantes (Anstrom y Woodward, 2005; Brischoux et al., 2009; Matsumoto y Hikosaka, 2009; Bromberg-Martin et al., 2010; Schultz, 2010; Lammel et al., 2011). Aunque Roitman et al., 2008 informaron que un estímulo gustativo aversivo (quinina) disminuyó los transitorios de DA en el núcleo accumbens, Anstrom et al., 2009 observaron que el estrés por derrota social estaba acompañado por aumentos en la actividad de DA fásica rápida medida tanto por electrofisiología como por voltametría . Sigue habiendo incertidumbre acerca de si existen neuronas DA separadas que responden de manera diferente a los estímulos apetitivos y aversivos, y qué proporción de neuronas responden a cada uno, pero parece haber pocas dudas de que la actividad DA mesolímbica puede mejorarse por al menos algunas condiciones aversivas y, por lo tanto, no está específicamente relacionado con la hedonia o el refuerzo positivo.

Un cuerpo sustancial de evidencia que se remonta a varias décadas (Salamone et al., 1994) y que continúa con la literatura reciente (Faure et al., 2008; Zweifel et al., 2011) demuestra que la interferencia con la transmisión de DA puede afectar la adquisición o el rendimiento. de comportamiento motivado aversivamente. De hecho, durante muchos años, los antagonistas de DA se sometieron a un cribado preclínico de actividad antipsicótica basándose en parte en su capacidad para mitigar el comportamiento de evitación (Salamone et al., 1994). Las reducciones de DA de Accumbens dificultan la presión de la palanca para evitar el impacto (McCullough et al., 1993). Las inyecciones sistémicas o intra-accumbens de antagonistas de DA también interrumpen la adquisición de aversión al lugar y aversión al gusto (Acquas y Di Chiara, 1994; Fenu et al., 2001), así como el condicionamiento del miedo (Inoue et al., 2000; Pezze y Feldon, 2004). Zweifel et al., 2011 informaron que la desactivación de los receptores NMDA, que actúa para reducir la liberación fásica rápida de DA, perjudicaba la adquisición del condicionamiento del miedo dependiente de señales.

Los estudios en humanos también han demostrado un papel para el estriado ventral en aspectos de motivación y aprendizaje aversivos. Los veteranos de guerra con trastorno de estrés postraumático mostraron un aumento del flujo sanguíneo en el estriado ventral / núcleo accumbens en respuesta a la presentación de estímulos aversivos (es decir, sonidos de combate; Liberzon et al., 1999). Los estudios de imágenes en humanos indican que las respuestas BOLD del estriado ventral, medidas por fMRI, aumentan en respuesta a los errores de predicción independientemente de si el estímulo predijo eventos gratificantes o aversivos (Jensen et al., 2007), y que los errores de predicción aversivos fueron bloqueados por el Haloperidol antagonista de DA (Menon et al., 2007). Baliki et al., 2010 informaron que en sujetos normales, las respuestas BOLD fásicas ocurrieron tanto al inicio como al final de un estímulo térmico doloroso. Delgado et al., 2011 demostraron que las respuestas BOLD del estriado ventral aumentaron durante el condicionamiento aversivo a un estímulo aversivo primario (choque), así como durante la pérdida monetaria. Un estudio de PET que obtuvo mediciones del desplazamiento de racloprida in vivo para evaluar la liberación de DA en humanos informó que la exposición al estrés psicosocial aumentó los marcadores de DA extracelular en el estriado ventral de una manera que se correlacionó con una mayor liberación de cortisol (Pruessner et al., 2004) . Por lo tanto, los estudios de imágenes en humanos también muestran que el cuerpo estriado ventral y su inervación DA mesolímbica responden tanto a estímulos aversivos como apetitivos.

Resumen y Conclusiones

En resumen, las ideas tradicionales sobre el DA como mediador de la "hedonia" y la tendencia a equiparar la transmisión del DA con "recompensa" (y "recompensa" con "hedonia") están dando paso a un énfasis en la participación dopaminérgica en aspectos específicos de la motivación y procesos relacionados con el aprendizaje (Figura 2), incluida la activación conductual, el esfuerzo, el enfoque instigado por señales, la predicción de eventos y los procesos pavlovianos. La transmisión de DA en el núcleo accumbens no ejerce una influencia poderosa sobre la reactividad hedónica a los sabores, ni parece mediar la motivación o el apetito alimentarios primarios (Berridge y Robinson, 1998; Salamone y Correa, 2002; Kelley et al., 2005; Barbano et al., 2009). Además, aunque las manipulaciones dopaminérgicas pueden afectar los resultados conductuales en animales entrenados en tareas de aprendizaje, no hay pruebas sólidas de que la DA accumbens sea fundamental para el aspecto específico del aprendizaje instrumental que implica la asociación entre la acción instrumental y el resultado reforzador (Yin et al. , 2008). Sin embargo, el DA accumbens es claramente importante para los aspectos de la motivación tanto apetitiva como aversiva (Salamone et al., 2007; Cabib y Puglisi-Allegra, 2012) y participa en los procesos de aprendizaje, al menos en parte a través de procesos que involucran el enfoque pavloviano y el pavloviano. a la transferencia instrumental (Yin et al., 2008; Belin et al., 2009). La interferencia con la transmisión de DA accumbens embota la adquisición de respuestas de aproximación pavloviana que son instigadas por señales que predicen la entrega de alimentos y deteriora las respuestas de evitación provocadas por señales que predicen estímulos aversivos. El agotamiento o el antagonismo de DA de Accumbens reducen los efectos de activación de los estímulos condicionados y hacen que los animales sean muy sensibles a los costos de respuesta instrumental relacionados con el trabajo (p. Ej., Producción de programas de proporción con requisitos de proporción grandes, escalada de barreras; Salamone et al., 2007, Salamone et al. , 2012; Barbano et al., 2009). Por lo tanto, el DA del núcleo accumbens está claramente involucrado en los aspectos de la motivación y la regulación de las acciones dirigidas a un objetivo, pero de una manera bastante específica y compleja que no se transmite con la simple palabra "recompensa". Algunas tareas instrumentales aprovechan las funciones servidas por el DA mesolímbico (p. Ej., Los aspectos activantes de la motivación, el esfuerzo) y, por lo tanto, el deterioro del DA mesolímbico afecta fácilmente el desempeño en estas tareas, mientras que responde a otras tareas reforzadas positivamente o medidas de alimentos primarios motivación, quedan intactos.

En los últimos años, la imagen que ha surgido es que el neostriatum (es decir, el estriado dorsal) y su inervación DA parecen tener un vínculo más claro con el procesamiento de asociaciones instrumentales que el núcleo accumbens (Yin et al., 2008). Las lesiones del neoestriado dorsomedial hicieron que los animales fueran insensibles tanto a la devaluación del reforzador como a la degradación por contingencia (Yin et al., 2005). Se ha demostrado que tanto las lesiones del cuerpo celular como la depleción de DA en el cuerpo estriado dorsolateral afectan la formación de hábitos (Yin et al., 2004; Faure et al., 2005). La participación del neostriatum en la formación de hábitos podría estar relacionada con el papel hipotético de los ganglios basales en la promoción del desarrollo de secuencias de acción o "fragmentación" de componentes de la conducta instrumental (Graybiel, 1998; Matsumoto et al., 1999). La idea de que existe una transición desde la regulación estriatal ventral de la respuesta instrumental a los mecanismos neoestriatales que regulan la formación de hábitos se ha empleado ampliamente para proporcionar una explicación de varias características de la adicción a las drogas (ver revisión de Belin et al., 2009), y también es relevante para comprender los efectos de los reforzadores naturales (Segovia et al., 2012). Sin embargo, en este contexto, es útil enfatizar que la participación de DA del núcleo accumbens en aspectos del aprendizaje o desempeño instrumental, o la participación de DA neostriatal en la regulación de la codificación de asociaciones acción-resultado o formación de hábitos, no significa que estas los efectos están mediados por acciones sobre la motivación primaria o el apetito por reforzadores naturales como la comida. Por ejemplo, Smith-Roe y Kelley, 2000 mostraron que la inyección combinada de un D1 antagonista y un antagonista de NMDA en dosis que perjudicaron la adquisición de la presión de la palanca reforzada con alimentos no afectaron la ingesta de alimentos e interpretaron este resultado como una demostración de la falta de un efecto motivacional general de esta manipulación. Además, se demostró que la interferencia con la transmisión de DA en el neoestriado dorsolateral perjudica la formación de hábitos, pero deja intacta la respuesta dirigida a objetivos (es decir, motivada por motivos) (Faure et al., 2005). Por lo tanto, la participación de DA neoestriatal en la formación de hábitos no proporciona evidencia de la mediación dopaminérgica de la motivación o el apetito alimentario primario. De hecho, la ingesta de alimentos se ve más afectada por la depleción de DA en el neostriado ventrolateral, y estas deficiencias están relacionadas con disfunciones motoras que afectan la velocidad de alimentación y el uso de las patas delanteras durante la alimentación, y ocurren en paralelo con la inducción del temblor oral que tiene las características del reposo parkinsoniano. temblor (Jicha y Salamone, 1991; Salamone et al., 1993; Collins-Praino et al., 2011).

Aunque no es un simple marcador de hedonia o motivación y apetito alimentario primario, la DA en el núcleo accumbens parece regular múltiples canales de información que pasan a través de este núcleo y, por lo tanto, participa en una variedad de procesos conductuales relacionados con aspectos de la motivación. Durante décadas, los investigadores han sugerido que las estructuras de los ganglios basales actúan como reguladores de la función sensoriomotora, lo que no significa que la interferencia con los ganglios basales produzca una simple parálisis o incapacidad motora, sino que se refiere a la idea de que estas estructuras, incluidas las accumbens, participan en la compuerta (es decir, el umbral) del impacto de la entrada sensorial en la salida del comportamiento. De manera similar, Mogenson et al., 1980 y sus colegas sugirieron hace años que el núcleo accumbens actúa como una interfaz "límbica-motora", proporcionando un vínculo entre las áreas límbicas involucradas en la emoción y la cognición y los circuitos neuronales que regulan la salida del comportamiento. Una evidencia considerable de múltiples fuentes indica que el núcleo accumbens actúa como una puerta, un filtro o un amplificador de la información que pasa a través de varias áreas corticales o límbicas en su camino hacia varias áreas motoras del cerebro (p. Ej., Roesch et al., 2009 ). Los estudios electrofisiológicos y voltamperométricos indican que el núcleo accumbens está organizado en conjuntos y microcircuitos de neuronas específicas de la tarea que son moduladas por DA (O'Donnell, 2003; Carelli y Wondolowski, 2003; Cacciapaglia et al., 2011). Roesch et al., 2009 informaron que las neuronas del núcleo accumbens integran información sobre el valor de una recompensa esperada con características de la producción motora (es decir, velocidad de respuesta o elección) que ocurren durante la toma de decisiones. La liberación de DA puede establecer un umbral para gastos de costo valiosos y, en algunas circunstancias, puede proporcionar un impulso oportunista para la explotación de recursos (Fields et al., 2007; Gan et al., 2010; Beeler et al., 2012). Esta sugerencia es consistente con la participación propuesta de Accumbens DA en la economía conductual del comportamiento instrumental, particularmente en términos de la toma de decisiones de costo / beneficio (Salamone et al., 2007, Salamone et al., 2009).

Como se mencionó anteriormente, los organismos generalmente están separados de los estímulos u objetivos motivacionales primarios por obstáculos o restricciones. Otra forma de decir esto es que el proceso de involucrarse en un comportamiento motivado requiere que los organismos superen la “distancia psicológica” entre ellos mismos y los estímulos motivacionales relevantes. El concepto de distancia psicológica es una idea antigua en psicología (por ejemplo, Lewin, 1935; Shepard, 1957; Liberman y Forster, 2008) y ha adquirido muchas connotaciones teóricas diferentes en diferentes áreas de la psicología (por ejemplo, experimental, social, personalidad, etc.). En el presente contexto, simplemente se usa como una referencia general a la idea de que los objetos o eventos a menudo no están directamente presentes o experimentados y, por lo tanto, los organismos están separados en múltiples dimensiones (por ejemplo, distancia física, tiempo, probabilidad, requisitos instrumentales) de estos objetos o eventos. De varias maneras, la DA mesolímbica sirve como un puente que permite a los animales atravesar la distancia psicológica que los separa de los objetos o eventos objetivo. Múltiples investigadores han formulado esto de diversas maneras o han enfatizado diferentes aspectos del proceso (Everitt y Robbins, 2005; Kelley et al., 2005; Salamone et al., 2005, Salamone et al., 2007, Salamone et al., 2009; Phillips et al., 2007; Nicola, 2010; Lex y Hauber, 2010; Panksepp, 2011; Beeler et al., 2012; ver Figura 2), pero muchas de las funciones en las que se ha implicado la DA accumbens, incluida la activación conductual, El esfuerzo durante la conducta instrumental, la transferencia pavloviana a instrumental, la capacidad de respuesta a los estímulos condicionados, la predicción de eventos, la conducta de aproximación flexible, la búsqueda y el gasto y la regulación de energía, son todos importantes para facilitar la capacidad de los animales para superar obstáculos y, en cierto sentido, trasciende la distancia psicológica. En general, la DA del núcleo accumbens es importante para realizar respuestas instrumentales activas que son provocadas o mantenidas por estímulos condicionados (Salamone, 1992), para mantener el esfuerzo en la respuesta instrumental a lo largo del tiempo en ausencia de refuerzo primario (Salamone et al., 2001; Salamone y Correa, 2002), y para regular la asignación de recursos conductuales mediante el establecimiento de restricciones sobre las respuestas instrumentales que se seleccionan para la obtención de refuerzo con base en análisis de costo / beneficio (Salamone et al., 2007, Salamone et al., 2012; Hernandez et al. ., 2010).

Implicaciones traslacionales y clínicas

Paralelamente a la investigación en animales analizada anteriormente, los estudios experimentales y clínicos con seres humanos también han comenzado a dilucidar algunas de las funciones motivacionales de la DA estriatal ventral y dorsal y apuntan hacia su potencial significado clínico. Esta investigación emergente en humanos, utilizando métodos de imagen así como métodos farmacológicos, ha generado resultados consistentes con la idea de que los sistemas estriatales en general, y la DA en particular, están involucrados en aspectos del comportamiento instrumental, la anticipación del refuerzo, la activación del comportamiento y el esfuerzo. Procesos relacionados. Knutson et al., 2001 informaron que la activación de la resonancia magnética funcional accumbens era evidente en personas que realizaban una tarea de juego, pero que el aumento de la actividad estaba asociado con la predicción o anticipación de la recompensa en lugar de la presentación real de la recompensa monetaria. O'Doherty et al., 2002 observaron que la anticipación del suministro de glucosa se asoció con una mayor activación de la resonancia magnética funcional en las áreas de DA del cerebro medio y del estriado, pero que estas áreas no respondían al suministro de glucosa. Estudios de imágenes recientes han implicado al cuerpo estriado ventral en la toma de decisiones de costo / beneficio (Croxson et al., 2009; Botvinick et al., 2009; Kurniawan et al., 2011). Treadway et al., 2012 encontraron que las diferencias individuales en el esfuerzo de los seres humanos se asociaron con un marcador de imagen de la transmisión de DA estriatal. Además, Wardle et al., 2011 demostraron que la anfetamina mejora la disposición de las personas a esforzarse para obtener una recompensa, en particular cuando la probabilidad de recompensa era baja pero no alteraba los efectos de la magnitud de la recompensa sobre la voluntad de esforzarse. Un artículo de imágenes reciente mostró que las dosis de L-DOPA que mejoraron la representación estriatal de acciones motivadas por el apetito no afectaron la representación neuronal del valor de refuerzo (Guitart-Masip et al., 2012). Otro informe reciente describió la capacidad de las manipulaciones de catecolaminas para disociarse entre diferentes aspectos de la motivación y la emoción en humanos (Venugopalan et al., 2011). En este estudio, el acceso al consumo de cigarrillos se usó como refuerzo, y los investigadores manipularon la transmisión de DA mediante la inhibición transitoria de la síntesis de catecolamina con agotamiento de fenilalanina / tirosina. La inhibición de la síntesis de catecolamina no mitigó el deseo de fumar por los cigarrillos o las respuestas hedónicas inducidas por el hábito de fumar. Sin embargo, disminuyó los puntos de rotura de relación progresiva para el refuerzo de cigarrillos, lo que indica que las personas con síntesis reducida de DA mostraron una menor disposición a trabajar para los cigarrillos. Además, la investigación de imágenes ha demostrado que el núcleo accumbens / estriado ventral humano no solo responde a los estímulos apetitivos, sino que también responde al estrés, la aversión y la hiperactivación / irritabilidad (Liberzon et al., 1999; Pavic et al., 2003; Phan et al., 2004; Pruessner et al., 2004; Levita et al., 2009; Delgado et al., 2011).

A medida que los conceptos sobre la DA continúen evolucionando, la investigación sobre las funciones conductuales de la DA tendrá profundas implicaciones para las investigaciones clínicas de las disfunciones motivacionales observadas en personas con depresión, esquizofrenia, abuso de sustancias y otros trastornos. En los seres humanos, los aspectos patológicos de los procesos de activación del comportamiento tienen una importancia clínica considerable. La fatiga, la apatía, la anergia (es decir, la falta de energía autoinformada) y el retraso psicomotor son síntomas comunes de depresión (Marin et al., 1993; Stahl, 2002; Demyttenaere et al., 2005; Salamone et al., 2006) , y síntomas motivacionales similares también pueden estar presentes en otros trastornos psiquiátricos o neurológicos como la esquizofrenia (es decir, "avolición"), abstinencia de estimulantes (Volkow et al., 2001), parkinsonismo (Friedman et al., 2007; Shore et al. , 2011), esclerosis múltiple (Lapierre y Hum, 2007) y enfermedades infecciosas o inflamatorias (Dantzer et al., 2008; Miller, 2009). Una evidencia considerable de estudios tanto en animales como en humanos indica que la DA mesolímbica y estriatal está involucrada en estos aspectos patológicos de la motivación (Schmidt et al., 2001; Volkow et al., 2001; Salamone et al., 2006, Salamone et al., 2007 , Salamone et al., 2012; Miller, 2009; Treadway y Zald, 2011). Una tendencia reciente en la investigación de salud mental ha sido reducir el énfasis en las categorías de diagnóstico tradicionales y, en cambio, centrarse en los circuitos neuronales que median síntomas patológicos específicos (es decir, el enfoque de criterios de dominio de investigación; Morris y Cuthbert, 2012). Es posible que la investigación continua sobre las funciones motivacionales de la DA arroje luz sobre los circuitos neuronales que subyacen a algunos de los síntomas motivacionales en la psicopatología y promoverá el desarrollo de tratamientos novedosos para estos síntomas que son útiles en múltiples trastornos.

(PDF)