¿Qué significa la dopamina? (2018)

. Manuscrito del autor; Disponible en PMC 2019 Feb 1.

Publicado en forma final editada como:

Nat Neurosci. 2018 Jun; 21 (6): 787 – 793.

Publicado en línea 2018 Mayo 14. doi 10.1038 / s41593-018-0152-y

PMCID: PMC6358212

NIHMSID: NIHMS987662

Resumen

La dopamina es un modulador crítico tanto del aprendizaje como de la motivación. Esto presenta un problema: ¿cómo pueden las células diana saber si el aumento de dopamina es una señal para aprender o para moverse? A menudo se presume que la motivación implica cambios lentos ("tónicos") de dopamina, mientras que las fluctuaciones rápidas ("fásicas") de dopamina transmiten errores de predicción de recompensa para el aprendizaje. Sin embargo, estudios recientes han demostrado que la dopamina transmite un valor motivacional y promueve el movimiento, incluso en escalas de tiempo inferiores al segundo. Aquí describo una explicación alternativa de cómo la dopamina regula el comportamiento continuo. La liberación de dopamina relacionada con la motivación es rápida y localmente esculpida por receptores en terminales de dopamina, independientemente de la activación de las células de dopamina. Las neuronas objetivo cambian bruscamente entre los modos de aprendizaje y rendimiento, y las interneuronas colinérgicas estriatales proporcionan un mecanismo de cambio candidato. El impacto en el comportamiento de la dopamina varía según la subregión, pero en cada caso, la dopamina proporciona una estimación dinámica de si vale la pena gastar un recurso interno limitado, como energía, atención o tiempo.

¿Es la dopamina una señal para el aprendizaje, la motivación o ambas cosas?

Nuestra comprensión de la dopamina ha cambiado en el pasado y está cambiando una vez más. Una distinción crítica es entre los efectos de la dopamina en corriente Comportamiento (rendimiento), y efectos de la dopamina en futuras comportamiento (aprendizaje). Ambos son reales e importantes, pero en varias ocasiones uno ha estado a favor y el otro no.

Cuando (en los '70s] fue posible realizar lesiones selectivas y completas de las vías de dopamina, la consecuencia obvia de comportamiento fue una reducción severa en el movimiento¹. Esto encaja con los efectos acinéticos de la pérdida de dopamina en humanos, producidos por la enfermedad de Parkinson avanzada, los fármacos tóxicos o la encefalitis.². Sin embargo, ni los casos de ratas ni humanos muestran una incapacidad fundamental para moverse. Ratas lesionadas con dopamina nadan en agua fría³y los pacientes acinéticos pueden levantarse y correr si suena una alarma de incendio (kinesia "paradójica"). Tampoco hay un déficit básico en la apreciación de las recompensas: las ratas lesionadas con dopamina consumirán los alimentos que se colocan en la boca y muestran signos de disfrutarla.⁴. Más bien, no elegirán hacer un esfuerzo para obtener recompensas activamente. Estos y muchos otros resultados establecieron un vínculo fundamental entre la dopamina y la motivación.⁵. Incluso la desaceleración del movimiento observada en casos menos graves de la enfermedad de Parkinson puede considerarse un déficit motivacional, lo que refleja decisiones implícitas de que no vale la pena gastar la energía necesaria para movimientos más rápidos.⁶.

Luego (en los '80') vinieron grabaciones pioneras de neuronas de dopamina en monos que se comportan (en áreas del cerebro medio que se proyectan en el cerebro anterior: área tegmental ventral, VTA / substantia nigra pars compacta, SNc). Entre los patrones de disparo observados se encontraban breves explosiones de actividad a estímulos que desencadenaron movimientos inmediatos. Este disparo de dopamina "fásico" se interpretó inicialmente como un apoyo a la "activación de comportamiento"⁷ y "excitación motivacional"⁸ - en otras palabras, como estimulante del comportamiento actual del animal.

Se produjo un cambio radical en los '90', con la reinterpretación de las explosiones fásicas de dopamina como codificación. errores de predicción de recompensa (RPEs⁹). Esto se basó en una observación clave: las células de dopamina responden a estímulos inesperados asociados con una recompensa futura, pero a menudo dejan de responder si se esperan estos estímulos¹⁰. La idea de RPE se originó en teorías de aprendizaje anteriores, y especialmente en el campo de la ciencia de la computación de refuerzo del entonces en desarrollo.¹¹. El punto de una señal de RPE es actualizar valores(estimaciones de recompensas futuras). Estos valores se utilizan más adelante, para ayudar a tomar decisiones que maximicen la recompensa. Dado que la activación de células de dopamina se parece a los RPE, y los RPE se utilizan para el aprendizaje, se volvió natural enfatizar el papel de la dopamina en el aprendizaje. Las manipulaciones optogenéticas posteriores confirmaron la identidad dopaminérgica de las células codificantes de RPE^12,13 y demostraron que efectivamente modulan el aprendizaje^14,15.

La idea de que la dopamina proporciona una señal de aprendizaje encaja perfectamente con la literatura de que la dopamina modula la plasticidad sináptica en el cuerpo estriado, el objetivo principal del cerebro anterior de la dopamina. Por ejemplo, la triple coincidencia de la estimulación con glutamato de una espina dendrítica del estriado, la despolarización postsináptica y la liberación de dopamina hacen que la espina dorsal crezca¹⁶. La modulación dopaminérgica de los mecanismos de aprendizaje a largo plazo ayuda a explicar los efectos conductuales persistentes de las drogas adictivas, que comparten la propiedad de mejorar la liberación de dopamina estriatal¹⁷. Incluso la acinesia profunda con pérdida de dopamina puede explicarse en parte por tales mecanismos de aprendizaje.¹⁸. La falta de dopamina puede tratarse como un RPE constantemente negativo, que actualiza progresivamente los valores de las acciones hacia cero. Los antagonistas de la dopamina pueden producir efectos similares a la extinción en el comportamiento, similares a los de la extinción.^19,20.

Sin embargo, la idea de que la dopamina participa de manera crítica en la motivación continua nunca ha desaparecido; por el contrario, los neurocientíficos del comportamiento la dan por sentada. Esto es apropiado dada la fuerte evidencia de que las funciones de la dopamina en la motivación / movimiento / vigor son disociables del aprendizaje.^15,20–23. El desafío involucrado en la conciliación de este rol motivacional con la teoría de que el DA proporciona una señal de aprendizaje de RPE es menos apreciado.

La motivación "mira hacia adelante": utiliza predicciones de recompensa futura (valores) para energizar apropiadamente el comportamiento actual. Por el contrario, el aprendizaje "mira hacia atrás" a los estados y acciones en el pasado reciente, y actualiza sus valores. Estas son fases complementarias de un ciclo: los valores actualizados pueden usarse en la toma de decisiones subsiguientes si esos estados se vuelven a encontrar, luego se actualizan nuevamente, y así sucesivamente. Pero, ¿en qué fase del ciclo interviene la dopamina: usar los valores para tomar decisiones (desempeño) o actualizar los valores (aprendizaje)?

En algunas circunstancias, es sencillo imaginar que la dopamina desempeña ambos roles simultáneamente.²⁴Las señales predictivas de recompensa inesperadas son los eventos arquetípicos para evocar la activación y liberación de las células de dopamina, y tales señales típicamente fortalecen el comportamiento y evocan el aprendizaje ( ). En esta situación particular, tanto la predicción de recompensa como los errores de predicción de recompensa aumentan simultáneamente, pero no siempre es así. A modo de ejemplo, las personas y otros animales a menudo se sienten motivados a trabajar por recompensas, incluso cuando ocurre poco o nada sorprendente. Pueden trabajar más y más duro a medida que se acercan cada vez más a la recompensa (el valor aumenta a medida que se acercan las recompensas). El punto es que el aprendizaje y la motivación son conceptualmente, computacionalmente y conductualmente distintos, y sin embargo, la dopamina parece hacer ambas cosas.

Abrir en una ventana separada

Dopamina: actualizando el pasado, vigorizando el presente.

Notable , Los círculos con flechas representan estados y las acciones potenciales de esos estados. Los anchos de las flechas indican los valores aprendidos de realizar cada acción. A medida que los estados / acciones se desvanecen en el pasado, progresivamente son menos elegibles para el refuerzo. Ed. Media, se produce un estallido de dopamina. El resultado es la revitalización de las acciones disponibles a partir del estado actual (rojo) y la plasticidad de las representaciones de valor para las acciones realizadas recientemente (púrpura). FondoComo resultado de la plasticidad, la próxima vez que se encuentren estos estados, sus valores asociados aumentarán (anchos de flecha). A través de la experiencia repetida, el aprendizaje por refuerzo puede "tallar un surco" a través del espacio estatal, lo que hace que ciertas trayectorias sean cada vez más probables. Además de esta función de aprendizaje, la función vigorizante y de rendimiento de la dopamina parece acelerar el flujo a lo largo de las trayectorias aprendidas anteriormente.

A continuación, evalúo críticamente las ideas actuales sobre cómo la dopamina es capaz de lograr el aprendizaje y las funciones motivacionales. Propongo un modelo actualizado, basado en tres hechos clave: 1) la liberación de dopamina desde los terminales no surge simplemente de la activación de las células de dopamina, sino que también puede controlarse localmente; 2) la dopamina afecta tanto a la plasticidad sináptica como a la excitabilidad de las células diana, con distintas consecuencias para el aprendizaje y el rendimiento, respectivamente; 3) los efectos de dopamina en la plasticidad pueden ser activados o desactivados por elementos del circuito cercanos. Juntas, estas características pueden permitir que los circuitos cerebrales alternen entre dos mensajes distintos de dopamina, para el aprendizaje y la motivación, respectivamente.

¿Hay señales de dopamina “fásicas” y “tónicas” separadas, con diferentes significados?

A menudo se argumenta que los roles de aprendizaje y motivación de la dopamina ocurren en diferentes escalas de tiempo.²⁵. Las células de dopamina se disparan continuamente ("tónicamente") a unos cuantos picos por segundo, con ocasionales explosiones breves ("fásicas") o pausas. Los estallidos, especialmente si se sincronizan artificialmente a través de las células de dopamina, conducen a los aumentos rápidos correspondientes en la dopamina del cerebro anterior.²⁶ que son altamente transitorios (sub-segundo duración)²⁷). La contribución separada de la activación tónica de las células de dopamina a las concentraciones de dopamina en el cerebro anterior es menos clara. Algunas evidencias sugieren que esta contribución es muy pequeña.²⁸. Puede ser suficiente para producir una estimulación casi continua de los receptores D2 de mayor afinidad, lo que permite al sistema notar breves pausas en la activación de las células de dopamina²⁹ y usa estas pausas como errores de predicción negativos.

La microdiálisis se ha utilizado ampliamente para medir directamente los niveles de dopamina en el cerebro anterior, aunque con una resolución temporal baja (generalmente con un promedio de muchos minutos). Tales mediciones lentas de dopamina pueden ser difíciles de relacionar precisamente con el comportamiento. No obstante, la microdiálisis de la dopamina en el núcleo accumbens (NAc; cuerpo estriado ventral / medial) muestra correlaciones positivas con la actividad locomotora³⁰ y otros índices de motivación.⁵. Esto se ha interpretado ampliamente como que hay cambios lentos ("tónicos") en la concentración de dopamina, y que estos cambios lentos transmiten una señal motivacional. Más específicamente, los modelos computacionales han propuesto que los niveles de dopamina tónica rastrean la tasa de recompensa promedio a largo plazo³¹ - una variable de motivación útil para la asignación de tiempo y las decisiones de alimentación. Vale la pena enfatizar que muy pocos artículos definen claramente los niveles de dopamina "tónicos"; por lo general, solo asumen que la concentración de dopamina cambia lentamente en la escala de tiempo de varios minutos de la microdiálisis.

Sin embargo, esta visión de “dopamina fásica = RPE / aprendizaje, dopamina tónica = motivación” enfrenta muchos problemas. En primer lugar, no hay evidencia directa de que la activación tónica de las células de dopamina varíe normalmente en escalas de tiempo lentas. Las tasas de cocción tónicas no cambian con la motivación cambiante^32,33. Se ha argumentado que los niveles de dopamina tónica cambian debido a una proporción cambiante de células de dopamina activas^34,35. Pero a través de muchos estudios en animales sin drogas y sin depilación, nunca se ha informado que las células de dopamina cambien entre los estados silenciosos y activos.

Además, el hecho de que la microdiálisis mida los niveles de dopamina lentamente no significa que los niveles de dopamina en realidad cambien lentamente. Nosotros recientemente¹⁵ examinó la dopamina NAc de rata en una tarea de recompensa probabilística, utilizando tanto microdiálisis como voltimetría cíclica de exploración rápida. Confirmamos que la dopamina mesolímbica, medida por microdiálisis, se correlaciona con la tasa de recompensa (recompensas / min). Sin embargo, incluso con una resolución temporal mejorada de la microdiálisis (1min), la dopamina fluctuó tan rápido como la tomamos: no vimos evidencia de una señal de dopamina inherentemente lenta.

Usando la resolución temporal más fina de voltametría, observamos una relación cercana entre las fluctuaciones y la motivación de la dopamina por debajo del segundo. A medida que las ratas realizaban la secuencia de acciones necesarias para obtener recompensas, la dopamina se elevaba cada vez más, alcanzando un máximo justo cuando obtenían la recompensa (y disminuían rápidamente a medida que la consumían). Demostramos que la dopamina se correlacionaba fuertemente con el valor del estado instantáneo, definido como la recompensa futura esperada, descontada por el tiempo esperado necesario para recibirla. Esta dinámica rápida de la dopamina también puede explicar los resultados de la microdiálisis, sin invocar señales de dopamina separadas en diferentes escalas de tiempo. A medida que los animales experimentan más recompensas, aumentan sus expectativas de recompensas futuras en cada paso de la secuencia de prueba. En lugar de una señal de tasa de recompensa promedio de evolución lenta, la correlación entre la dopamina y la tasa de recompensa se explica mejor como un promedio, a lo largo del tiempo de recolección de muestras de microdiálisis prolongado, de estos valores de estado de rápida evolución.

Esta interpretación del valor de la liberación de dopamina mesolímbica es consistente con los resultados de voltametría de otros grupos de investigación, quienes han encontrado repetidamente que la liberación de dopamina aumenta con la proximidad creciente a la recompensa^36–38( ). Esta señal de motivación no es intrínsecamente "lenta", sino que puede observarse en un rango continuo de escalas de tiempo. Aunque las rampas de dopamina pueden durar varios segundos cuando un comportamiento de aproximación también dura varios segundos³⁸Esto refleja el curso temporal del comportamiento, en lugar de la dinámica intrínseca de la dopamina. La relación entre la liberación de dopamina mesolímbica y el valor fluctuante es visible tan rápido como lo permite la técnica de grabación, es decir, en una escala de tiempo de ~ 100ms con electrodos de voltametría aguda¹⁵.

Las fluctuaciones rápidas de dopamina indican expectativas de recompensa que evolucionan dinámicamente.

ac) La liberación de dopamina mesolímbica aumenta rápidamente a medida que las ratas se acercan a las recompensas anticipadas. d) El valor, definido como estimaciones con descuentos temporales de recompensa futura, aumenta a medida que la recompensa se acerca. Las señales que indican que la recompensa es mayor, más cercana o más segura de lo que se esperaba anteriormente, aumentan de valor. Estos saltos de un momento a otro son RPE de diferencia temporal. e) Restar las "líneas de base" de distancia puede confundir el valor y las señales de RPE. A la izquierda, la dopamina alineada con la señal predictiva de recompensa (en el tiempo cero), con la resta de línea de base convencional, parece mostrar que la dopamina salta a niveles más altos cuando la recompensa es menos esperada (marrón), se asemeja a una señal de RPE. A la derecha, una presentación alternativa de los mismos datos, igualando los niveles de dopamina. después de la indicación, en cambio, mostraría que los niveles previos de dopamina dependen de la expectativa de recompensa (valor). Los análisis adicionales determinaron que la presentación del lado derecho está más cerca de la verdad (consulte los detalles en la ref. 15). Panel a reproducido, con permiso, de la ref. ³⁸, Macmillan Publishers Limited ...; Panel b reproducido, con permiso, de la ref. 37, Elsevier; Paneles reproducidos, con permiso, de la ref. ¹⁵, Macmillan Publishers Limited

Las rápidas fluctuaciones de la dopamina no solo reflejan la motivación, sino que también impulsan de inmediato el comportamiento motivado. Las respuestas fásicas más grandes de las células de dopamina para desencadenar señales predicen tiempos de reacción más cortos en ese mismo ensayo³⁹. La estimulación optogenética de las células de dopamina VTA hace que las ratas tengan más probabilidades de comenzar a trabajar en nuestra tarea de recompensa probabilística¹⁵, como si tuvieran una mayor expectativa de recompensa. La estimulación optogenética de las neuronas de dopamina SNc, o sus axones en el cuerpo estriado dorsal, aumenta la probabilidad de movimiento^40,41. Críticamente, estos efectos de comportamiento son evidentes dentro de un par de cientos de milisegundos desde el inicio de la estimulación optogenética. La capacidad de las señales predictivas de recompensa para aumentar la motivación parece estar mediada por una modulación dopaminérgica muy rápida de la excitabilidad de las neuronas espinosas NAc⁴². Dado que la dopamina está cambiando rápidamente, y estos cambios afectan la motivación rápidamente, las funciones motivacionales de la dopamina se describen mejor como rápidas ("fásicas"), no lentas ("tónicas").

Además, la invocación de escalas de tiempo rápidas y lentas separadas no resuelve en sí mismo el problema de decodificación que enfrentan las neuronas con receptores de dopamina. Si la dopamina indica el aprendizaje, la modulación de la plasticidad sináptica parecería una respuesta celular apropiada. Pero los efectos inmediatos sobre el comportamiento motivado implican efectos inmediatos sobre los picos, por ejemplo, a través de cambios rápidos en la excitabilidad. La dopamina puede tener ambos efectos postsinápticos (y más), entonces, ¿una determinada concentración de dopamina tiene un significado específico? ¿O es necesario construir este significado, por ejemplo, comparando los niveles de dopamina a lo largo del tiempo o utilizando otras señales coincidentes para determinar qué maquinaria celular se debe activar? Esta posibilidad se analiza más adelante.

¿La liberación de dopamina transmite la misma información que la activación de las células de dopamina?

La relación entre las fluctuaciones rápidas de la dopamina y el valor motivacional parece extraña, dado que la activación de las células de la dopamina se parece al RPE. Además, algunos estudios han reportado señales de RPE en la liberación de dopamina mesolímbica⁴³. Es importante señalar un desafío en la interpretación de algunas formas de datos neuronales. Las señales de valor y los RPE están correlacionados entre sí, como era de esperar, ya que el RPE generalmente se define como el cambio en el valor de un momento al siguiente (RPE de “diferencia temporal”). Debido a esta correlación, es fundamental utilizar diseños y análisis experimentales que distingan el valor de las cuentas de RPE. El problema se agrava cuando se usa una medida neuronal que se basa en cambios de señal relativos, en lugar de absolutos. Los análisis de voltamperometría suelen comparar la dopamina en algún momento de interés con una época "de referencia" anterior en cada ensayo (para eliminar los componentes de la señal que no dependen de la dopamina, incluida la carga de electrodos en cada barrido de voltaje y deriva en una escala de tiempo de minutos). Pero restar una línea de base puede hacer que una señal de valor se parezca a una señal RPE. Esto es lo que observamos en nuestros propios datos de voltamperometría (Fig. 2e). Los cambios en la expectativa de recompensa se reflejaron en los cambios en la concentración de dopamina al principio de cada prueba, y estos cambios se omiten si uno simplemente asume una línea de base constante entre las pruebas.¹⁵. Por tanto, las conclusiones sobre la liberación de dopamina y la codificación de RPE deben considerarse con cautela. Este peligro de interpretación de datos se aplica no solo a la voltamperometría, sino a cualquier análisis que se base en cambios relativos, incluyendo potencialmente algunos fMRI y fotometría.⁴⁴.

No obstante, todavía debemos reconciliar la liberación de dopamina relacionada con el valor en el núcleo de NAc con la ausencia constante de aumento de valor relacionado por las neuronas de dopamina¹³, incluso dentro del área VTA lateral que proporciona dopamina al núcleo de NAc⁴⁵. Un factor potencial es que las células de dopamina generalmente se registran en animales con cabeza que realizan tareas de acondicionamiento clásico, mientras que la liberación de dopamina se mide típicamente en animales sin restricciones que se mueven activamente a través de su entorno. Propusimos que la dopamina mesolímbica podría indicar específicamente el valor del "trabajo"¹⁵ - que refleja un requisito de dedicar tiempo y esfuerzo para obtener la recompensa. De acuerdo con esto, la dopamina aumenta con señales que instruyen el movimiento, pero no con señales que instruyen la quietud, incluso cuando indican una recompensa futura similar.⁴⁶. Si, como en muchas tareas clásicas de acondicionamiento, el “trabajo” activo no aporta ningún beneficio, los cambios dopaminérgicos que indican el valor del trabajo pueden ser menos evidentes.

Aún más importante puede ser el hecho de que la liberación de dopamina puede controlarse localmente en las propias terminales y, por lo tanto, mostrar patrones espacio-temporales independientes de la aceleración del cuerpo celular. Por ejemplo, la amígdala basolateral (BLA) puede influir en la liberación de dopamina NAc incluso cuando el VTA está desactivado.⁴⁷. A la inversa, la inactivación de BLA reduce la liberación de dopamina NAc y el comportamiento motivado correspondiente, sin afectar aparentemente a la activación de VTA⁴⁸. Los terminales de dopamina tienen receptores para una variedad de neurotransmisores, incluidos el glutamato, los opioides y la acetilcolina. Los receptores nicotínicos de acetilcolina permiten que las interneuronas colinérgicas estriatales (NIC) controlen rápidamente la liberación de dopamina^49,50. Aunque hace tiempo que se ha observado que el control local de la liberación de dopamina es potencialmente importante^7,51, no se ha incluido en las cuentas computacionales de la función de la dopamina. Propongo que la dinámica de liberación de dopamina relacionada con la codificación de valor surja en gran medida a través de local control, incluso cuando la activación de células de dopamina proporciona importantes señales similares a RPE para el aprendizaje.

¿Cómo puede la dopamina significar tanto aprendizaje como motivación sin confusión?

En principio, una señal de valor es suficiente para transmitir RPE también, ya que los RPE de diferencia temporal simplemente son cambios rápidos en el valor (Fig. 2B). Por ejemplo, las distintas vías intracelulares en las neuronas diana pueden ser diferentes a la concentración absoluta de dopamina (que representa el valor) frente a los cambios relativos rápidos en la concentración (que representan el EPR). Este esquema parece plausible, dada la compleja modulación de dopamina de la fisiología de la neurona espinosa⁵² y su sensibilidad a los patrones temporales de concentración de calcio.⁵³. Sin embargo, esto también parece algo redundante. Si ya existe una señal similar a RPE en el aumento de células de dopamina, debería ser posible usarla en lugar de derivar RPE a partir de una señal de valor.

Para usar apropiadamente distintas señales de RPE y valores, los circuitos receptores de dopamina pueden cambiar activamente la forma en que interpretan la dopamina. Existe evidencia intrigante de que la acetilcolina también puede cumplir esta función de cambio. Al mismo tiempo que las células de dopamina disparan ráfagas de picos a señales inesperadas, los CIN se muestran breves (~ 150ms) descansos en cocción, que no escalan con RPEs⁵⁴. Estas pausas CIN pueden ser impulsadas por neuronas VTA GABAérgicas⁵⁵ así como las células relacionadas con la "sorpresa" en el tálamo intralaminar, y se han propuesto para actuar como una señal de asociabilidad que promueve el aprendizaje⁵⁶. Morris y Bergman sugirieron⁵⁴ que las pausas colinérgicas definen ventanas temporales para la plasticidad estriatal, durante las cuales la dopamina se puede usar como una señal de aprendizaje. La plasticidad dependiente de la dopamina se suprime continuamente por mecanismos que incluyen los receptores muscarínicos m4 en las neuronas del estriado de la vía directa⁵⁷. Los modelos de señalización intracelular sugieren que durante las pausas de CIN, la ausencia de la unión de m4 puede actuar de forma sinérgica con las explosiones fásicas de dopamina para aumentar la activación de PKA⁵⁸, promoviendo así el cambio sináptico.

Las células colinérgicas del cuerpo estriado están bien posicionadas para cambiar dinámicamente el significado de un mensaje dopaminérgico multiplexado. Durante las pausas de CIN, el alivio de un bloqueo muscarínico sobre la plasticidad sináptica permitiría usar la dopamina para aprender. En otros momentos, la liberación de los terminales de dopamina se esculpiría localmente para afectar el desempeño del comportamiento continuo. Actualmente, esta sugerencia es a la vez especulativa e incompleta. Se ha propuesto que los CIN integren información de muchas neuronas espinosas circundantes para extraer señales útiles a nivel de red, como la entropía.^59,60. Pero no está del todo claro que la dinámica de actividad de la CIN se pueda usar para generar señales de valor de dopamina⁶¹, y también para bloquear las señales de aprendizaje de dopamina.

¿Dopamina significa lo mismo en todo el cerebro anterior?

A medida que la idea de RPE se consolidó, se imaginó que la dopamina era una señal global, transmitiendo un mensaje de error a través de los objetivos corticales frontales y estriatales. Schultz enfatizó que las células de dopamina de mono a lo largo de VTA y SNc tienen respuestas muy similares⁶². Los estudios de células de dopamina identificadas también han encontrado respuestas homogéneas de tipo RPE en roedores, al menos para las neuronas VTA laterales en contextos de condicionamiento clásico¹³. Sin embargo, las células de dopamina son molecular y fisiológicamente diversas^63–65 y ahora hay muchos informes que muestran diversos patrones de disparo en los animales que se comportan. Estos incluyen aumentos fásicos en el disparo a eventos aversivos⁶⁶ y desencadenar señales⁶⁷ que encajan mal con la cuenta estándar de RPE. Muchas células de dopamina muestran una respuesta inicial de corta latencia a eventos sensoriales que refleja sorpresa o "alerta" más que la codificación específica de RPE^68,69. Este aspecto de alerta es más prominente en SNc.⁶⁹, donde las células de dopamina se proyectan más hacia el estriatum dorsal / lateral “sensorimotor” (DLS^45,63). También se ha informado que las subpoblaciones de células de dopamina SNc aumentan⁴¹ o disminuir⁷⁰ Disparar en conjunción con movimientos espontáneos, incluso sin señales externas.

Varios grupos utilizaron la fotometría de fibra y el indicador de calcio GCaMP para examinar la actividad en masa de las subpoblaciones de neuronas de dopamina^71,72. Las células de dopamina que se proyectan al estriado dorsal / medial (DMS, por sus siglas en inglés) mostraron una actividad de depresión transitoria a shocks breves inesperados, mientras que las que se proyectaron a DLS mostraron una mayor actividad.⁷¹- más coherente con una respuesta de alerta. También se han observado distintas respuestas dopaminérgicas en diferentes subregiones del prosencéfalo utilizando GCaMP para examinar la actividad de los axones y terminales de dopamina.^40,72,73. Usando imágenes de dos fotones en ratones con cabeza, Howe y Dombeck⁴⁰ Informó actividad de dopamina fásica relacionada con movimientos espontáneos. Esto se observó predominantemente en los axones de dopamina individuales de SNc que terminaron en el cuerpo estriado dorsal, mientras que los axones de dopamina VTA en NAc respondieron más para recompensar el parto. Otros también encontraron actividad dopaminérgica relacionada con la recompensa en NAc, con DMS en su lugar más vinculado a acciones contralaterales⁷² y la cola posterior del cuerpo estriado en respuesta a estímulos aversivos y novedosos⁷⁴.

Las medidas directas de liberación de dopamina también revelan heterogeneidad entre subregiones^30,75. Con la microdiálisis, encontramos que la dopamina está correlacionada con el valor específicamente en el núcleo de NAc y la corteza frontal ventral-medial, no en otras partes mediales del cuerpo estriado (cáscara de NAc, DMS) o la corteza frontal. Esto es intrigante, ya que parece asociarse bien con dos "puntos calientes" de codificación de valores observados de forma sistemática en estudios de RMF humanos.^76,77. En particular, la señal NAc BOLD, que tiene una relación cercana con la señalización de dopamina⁷⁸, aumenta con la anticipación de la recompensa (valor), más que con el RPE⁷⁶.

Ya sea que estos patrones espaciales de liberación de dopamina surgen de la activación de distintas subpoblaciones de células de dopamina, el control local de la liberación de dopamina, o ambos, desafían la idea de un mensaje global de dopamina. Se podría concluir que hay muchas funciones diferentes de dopamina, con (por ejemplo) la dopamina en el "movimiento" de señalización del estriado dorsal y la dopamina en la "recompensa" de señalización del estriado ventral⁴⁰. Sin embargo, estoy a favor de otro enfoque conceptual. Las diferentes subregiones estriadas obtienen aportes de diferentes regiones corticales, por lo que procesarán diferentes tipos de información. Sin embargo, cada subregión estriatal comparte una arquitectura de microcircuitos común, que incluye neuronas espinosas con receptores de D1 frente a receptores de D2 separados⁷⁹, CINs, y así sucesivamente. Aunque es común referirse a varias subregiones estriadas (p. Ej., DLS, DMS, núcleo NAc) como si fueran áreas discretas, no hay límites anatómicos afilados entre ellas (la capa NAc es un poco más neuroquímica distinta). En cambio, solo hay gradientes suaves en la densidad de receptores, proporciones de interneuronas, etc., que parecen más ajustes a los parámetros de un algoritmo computacional compartido. Dada esta arquitectura común, ¿podemos describir una función común de dopamina, abstraída de la información específica que maneja cada subregión?

Dopamina estriatal y la asignación de recursos limitados.

Propongo que una variedad de efectos dispares de dopamina en el comportamiento en curso puede entenderse como una modulación de decisiones de asignación de recursos. Específicamente, la dopamina proporciona estimaciones de cuánto vale la pena gastar un recurso interno limitado, con un recurso particular que difiere entre las subregiones estriatales. Para el estriado "motor" (~ DLS) el recurso es movimiento, que está limitado porque mover energía cuesta, y porque muchas acciones son incompatibles entre sí⁸⁰. El aumento de la dopamina hace que sea más probable que un animal decida que vale la pena gastar energía para moverse o moverse más rápido^6,40,81. Tenga en cuenta que una señal de dopamina que codifica "el movimiento vale la pena" producirá correlaciones entre la dopamina y el movimiento, incluso sin la codificación de la dopamina "movimiento" per se.

Para el estriado "cognitivo" (~ DMS), los recursos son procesos cognitivos que incluyen atención (que, por definición, es de capacidad limitada)⁸²) y memoria de trabajo⁸³. Sin dopamina, las señales externas sobresalientes que normalmente provocan movimientos de orientación se descuidan, como si se consideraran menos dignas de atención³. Además, la combinación deliberada de procesos de control cognitivo es un esfuerzo (costoso)⁸⁴). Dopamina - especialmente en DMS⁸⁵ - juega un papel clave a la hora de decidir si vale la pena realizar este esfuerzo^86,87. Esto puede incluir si se emplean estrategias de decisión deliberativas ("basadas en modelos") más exigentes desde el punto de vista cognitivo.⁸⁸.

Para el estriado "motivacional" (~ NAc), un recurso limitado clave puede ser el tiempo del animal. La dopamina mesolímbica no se requiere cuando los animales realizan una acción simple y fija para obtener recompensas rápidamente⁸⁹. Pero muchas formas de recompensa solo pueden obtenerse a través del trabajo prolongado: secuencias extendidas de acciones no recompensadas, como en el forrajeo. Elegir involucrarse en el trabajo significa que deben abandonarse otras formas beneficiosas de pasar el tiempo. La dopamina mesolímbica alta indica que realizar un trabajo prolongado y laborioso vale la pena, pero a medida que la dopamina disminuye, los animales no se molestan y, en cambio, pueden prepararse para dormir.⁹⁰.

Dentro de cada circuito de circuito córtico-estriado, la contribución de la dopamina al comportamiento continuo es, por lo tanto, económica (preocupada por la asignación de recursos) y motivacional (si es vale la pena gastar recursos⁸¹). Estos circuitos no son completamente independientes, sino que tienen una organización jerárquica y en espiral: las porciones más ventrales del cuerpo estriado influyen en las células de dopamina que se proyectan a más porciones dorsales^5,91. De esta manera, las decisiones de participar en el trabajo también pueden ayudar a fortalecer los movimientos específicos y más breves necesarios. Pero en general, la dopamina proporciona señales "activantes", lo que aumenta la probabilidad de que se tome alguna decisión, en lugar de señales "direccionales" que especifican cómo los recursos deben ser gastados⁵.

¿Cuál es el papel computacional de la dopamina cuando se toman decisiones?

Una forma de pensar acerca de este rol de la actividad es en términos de umbrales de toma de decisiones. En ciertos modelos matemáticos, los procesos de decisión aumentan hasta que alcanzan un nivel de umbral, cuando el sistema se compromete con una acción.⁹². Una mayor dopamina sería equivalente a una menor distancia al umbral, por lo que las decisiones se alcanzan más rápidamente. Esta idea es simplista, pero hace predicciones cuantitativas que han sido confirmadas. La reducción de los umbrales para el movimiento causaría un cambio específico en la forma de la distribución del tiempo de reacción, justo lo que se ve cuando se infunde anfetamina en el estriatum sensoriomotor²⁰.

En lugar de umbrales fijos, los datos neuronales y de comportamiento pueden adaptarse mejor si los umbrales disminuyen con el tiempo, como si las decisiones fueran cada vez más urgentes. Se ha propuesto la producción de ganglios basales para proporcionar una señal de urgencia que evoluciona dinámicamente, lo que vigoriza los mecanismos de selección en la corteza.⁹³. La urgencia también fue mayor cuando las recompensas futuras estaban más cerca en el tiempo, lo que hace que este concepto sea similar al de la codificación de valor, el papel de activación de la dopamina.

¿Es tal rol de activación suficiente para describir los efectos moduladores del rendimiento de la dopamina del cuerpo estriado? Esto se relaciona con la pregunta de larga data de si los circuitos de los ganglios basales seleccionan directamente entre las acciones aprendidas⁸⁰ o simplemente vigorizar las elecciones hechas en otros lugares^93,94. Hay al menos dos formas en que la dopamina puede parecer tener un efecto más "direccional". La primera es cuando la dopamina actúa dentro de una subregión cerebral que procesa información direccional inherente. Los circuitos de los ganglios basales tienen un papel importante, parcialmente lateralizado, orientado hacia y acercándose a las posibles recompensas. El caudado de primates (~ DMS) está involucrado en dirigir los movimientos oculares hacia campos espaciales contralaterales⁹⁵. Una señal dopaminérgica de que vale la pena orientarse hacia algo en el espacio contralateral puede explicar la correlación observada entre la actividad dopaminérgica en DMS y los movimientos contralaterales⁷², así como el comportamiento rotacional producido por las manipulaciones de dopamina.⁹⁶. Una segunda influencia "direccional" de la dopamina es evidente cuando las lesiones (bilaterales) de dopamina desvían a las ratas hacia elecciones de bajo esfuerzo / baja recompensa, en lugar de alternativas de alto esfuerzo / alta recompensa⁹⁷. Esto puede reflejar el hecho de que algunas decisiones son más seriales que paralelas, con ratas (y humanos) que evalúan las opciones una a la vez.⁹⁸. En estos contextos de decisión, la dopamina puede seguir desempeñando un papel fundamentalmente activador al transmitir el valor de la opción actualmente considerada, que puede aceptarse o no.²⁴.

Los animales activos toman decisiones en múltiples niveles, a menudo a tasas altas. Más allá de pensar en decisiones individuales, puede ser útil considerar una trayectoria general a través de una secuencia de estados ( ). Al facilitar las transiciones de un estado a otro, la dopamina puede acelerar el flujo a lo largo de las trayectorias aprendidas⁹⁹. Esto puede relacionarse con la importante influencia de la dopamina sobre el momento del comportamiento^44,100. Una frontera clave para el trabajo futuro es obtener una comprensión más profunda de cómo dichos efectos de la dopamina en el comportamiento en curso surgen mecánicamente, al alterar el procesamiento de la información dentro de células individuales, microcircuitos y bucles de ganglios cortical basales a gran escala. Además, he enfatizado los roles computacionales comunes de la dopamina en un rango de objetivos estriatales, pero los objetivos corticales en gran parte descuidados, y queda por ver si las funciones de dopamina en ambas estructuras pueden describirse dentro del mismo marco.

En resumen, una descripción adecuada de la dopamina explicaría cómo la dopamina puede indicar tanto el aprendizaje como la motivación, en las mismas escalas de tiempo rápidas, sin confusión. Esto explicaría por qué la liberación de dopamina en los objetivos clave se relaciona con la expectativa de recompensa, aunque el disparo de células de dopamina no lo haga. Y proporcionaría una cuenta computacional unificada de las acciones de la dopamina en el estriado y en otros lugares, lo que explica los efectos de comportamiento dispares en el movimiento, la cognición y el tiempo. Algunas ideas específicas presentadas aquí son especulativas, pero tienen la intención de vigorizar la discusión renovada, el modelado y los nuevos experimentos incisivos.

Expresiones de gratitud.

Agradezco a los muchos colegas que brindaron comentarios perspicaces sobre borradores de textos anteriores, incluidos Kent Berridge, Peter Dayan, Brian Knutson, Jeff Beeler, Peter Redgrave, John Lisman, Jesse Goldberg y los árbitros anónimos. Lamento que las limitaciones de espacio impidan la discusión de muchos estudios previos importantes. El Instituto Nacional de Trastornos Neurológicos y Accidentes Cerebrovasculares, el Instituto Nacional de Salud Mental y el Instituto Nacional sobre el Abuso de Drogas proporcionaron apoyo esencial.

Referencias:

1. Ungerstedt U Adipsia y afagia después de la degeneración inducida por 6-hidroxidopamina del sistema de dopamina nigroestriatal. Acta Physiol Scand Suppl 367, 95 – 122 (1971). ElPubMed] [Google Scholar]

2. Sacos o Despertares. Despertares (1973).

3. Marshall JF, Levitan D y Stricker EM Restauración inducida por la activación de las funciones sensorimotoras en ratas con lesiones cerebrales que agotan la dopamina. J Comp Physiol Psychol 90, 536 – 46 (1976). ElPubMed] [Google Scholar]

4. Berridge KC, Venier IL y Robinson TE Análisis de reactividad del gusto de la afagia inducida por 6-hidroxidopamina: implicaciones para la activación y hipótesis de anhedonia de la función de la dopamina. Behav Neurosci 103, 36 – 45 (1989). ElPubMed] [Google Scholar]

5. Salamone J y Correa M Las misteriosas funciones motivacionales de la dopamina mesolímbica. Neurona 76, 470–485 (2012).doi:10.1016/j.neuron.2012.10.021 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

6. Mazzoni P, Hristova A y Krakauer JW ¿Por qué no nos movemos más rápido? Enfermedad de Parkinson, vigor del movimiento y motivación implícita.. J Neurosci 27, 7105 – 16 (2007) .doi: 10.1523 / JNEUROSCI.0264-07.2007 [PubMed] [CrossRef] [Google Scholar]

7. Schultz W Respuestas de las neuronas de dopamina del cerebro medio al estímulo del estímulo conductual en el mono. Revista de neurofisiología 56, 1439 – 1461 (1986). ElPubMed] [Google Scholar]

8. Schultz W y Romo R Neuronas de dopamina del mesencéfalo del mono: contingencias de respuestas a estímulos que provocan reacciones de comportamiento inmediatas. J neurofisiol 63, 607 – 24 (1990). ElPubMed] [Google Scholar]

9. Montague PR, Dayan P y Sejnowski TJ Un marco para los sistemas de dopamina mesencefálicos basados en el aprendizaje predictivo de Hebbian. J Neurosci 16, 1936 – 47 (1996). ElPubMed] [Google Scholar]

10. Schultz W, Apicella P y Ljungberg T Respuestas de las neuronas de dopamina de los monos para recompensar y condicionar los estímulos durante los pasos sucesivos del aprendizaje de una tarea de respuesta tardía. J Neurosci 13, 900 – 13 (1993). ElPubMed] [Google Scholar]

11. Sutton RS y Barto AG Aprendizaje de refuerzo: una introducción. Aprendizaje de refuerzo: una introducción (MIT Press: Cambridge, Massachusetts, 1998). [Google Scholar]

12. Cohen JY, Haesler S, Vong L, Lowell BB y Uchida N Señales específicas de tipo neuronal para recompensa y castigo en el área ventral tegmental. Naturaleza 482, 85–8 (2012).doi:10.1038/nature10754 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

13. Eshel N, Tian J, Bukwich M y Uchida N Las neuronas de dopamina comparten una función de respuesta común para el error de predicción de recompensa. Nat Neurosci 19, 479–86 (2016).doi:10.1038/nn.4239 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

14. Steinberg EE, Keiflin R, Boivin JR, Witten IB, Deisseroth K y Janak PH Un vínculo causal entre los errores de predicción, las neuronas de dopamina y el aprendizaje. Nat Neurosci (2013) .doi: 10.1038 / nn.3413 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

15. Hamid AA, Pettibone JR, Mabrouk OS, Hetrick VL, Schmidt R, Vander Weele CM, Kennedy RT, Aragona BJ y Berke JD La dopamina mesolímbica señala el valor del trabajo. Nat Neurosci 19, 117–26 (2016).doi:10.1038/nn.4173 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

16. Yagishita S, Hayashi-Takagi A, Ellis-Davies GC, Urakubo H, Ishii S y Kasai H Una ventana de tiempo crítica para las acciones de la dopamina en la plasticidad estructural de las espinas dendríticas. Ciencia: 345, 1616–20 (2014).doi:10.1126/science.1255514 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

17. Berke JD y Hyman SE La adicción, la dopamina y los mecanismos moleculares de la memoria.. Neurona 25, 515 – 32 (2000). ElPubMed] [Google Scholar]

18. Beeler JA, Frank MJ, McDaid J, Alexander E, Turkson S, Bernandez MS, McGehee DS y Zhuang X Un papel para el aprendizaje mediado por la dopamina en la fisiopatología y el tratamiento de la enfermedad de Parkinson. Representante celular 2, 1747–61 (2012).doi:10.1016/j.celrep.2012.11.014 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

19. RA sabio Dopamina, aprendizaje y motivación.. Nat Rev Neurosci 5, 483 – 94 (2004) .doi: 10.1038 / nrn1406 [PubMed] [CrossRef] [Google Scholar]

20. Leventhal DK, Stoetzner C, Abraham R, Pettibone J, DeMarco K y Berke JD Efectos disociables de la dopamina en el aprendizaje y el rendimiento en el estriatum sensoriomotor. Ganglios basales 4, 43–54 (2014).doi:10.1016/j.baga.2013.11.001 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

21. Wyvell CL y Berridge KC La anfetamina intraacumosa aumenta el incentivo destacado de la recompensa de sacarosa: mejora de la "falta" de recompensa sin "gusto" o refuerzo de respuesta mejorado. J Neurosci 20, 8122 – 30. (2000). ElPubMed] [Google Scholar]

22. Cagniard B, Beeler JA, Britt JP, McGehee DS, Marinelli M y Zhuang X La dopamina escala el rendimiento en ausencia de un nuevo aprendizaje. Neurona 51, 541 – 7 (2006) .doi: 10.1016 / j.neuron.2006.07.026 [PubMed] [CrossRef] [Google Scholar]

23. Shiner T, Seymour B, Wunderlich K, Hill C, Bhatia KP, Dayan P y Dolan RJ La dopamina y el rendimiento en una tarea de aprendizaje de refuerzo: evidencia de la enfermedad de Parkinson. Cerebro 135, 1871 – 1883 (2012). [Artículo gratuito de PMC] [PubMed] [Google Scholar]

24. McClure SM, Daw ND y Montague PR Un sustrato computacional para la importancia del incentivo.. Tendencias Neurosci 26, 423 – 8 (2003). ElPubMed] [Google Scholar]

25. Schultz W Múltiples funciones de dopamina en diferentes cursos de tiempo.. Annu Rev Neurosci 30, 259 – 88 (2007) .doi: 10.1146 / annurev.neuro.28.061604.135722 [PubMed] [CrossRef] [Google Scholar]

26. Gonon F, Burie JB, Jaber M, Benoit-Marand M, Dumartin B y Bloch B Geometría y cinética de la transmisión dopaminérgica en el estriado de la rata y en ratones que carecen del transportador de dopamina.. Prog Brain Res 125, 291 – 302 (2000). ElPubMed] [Google Scholar]

27. Aragona BJ, Cleaveland NA, Stuber GD, Day JJ, Carelli RM y Wightman RM El aumento preferencial de la transmisión de dopamina dentro de la cáscara del núcleo accumbens por parte de la cocaína es atribuible a un aumento directo en los eventos de liberación de dopamina fásica. J Neurosci 28, 8821–31 (2008).doi:10.1523/JNEUROSCI.2225-08.2008 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

28. Owesson-White CA, Roitman MF, Sombers LA, Belle AM, Keithley RB, Peele JL, Carelli RM y Wightman RM Fuentes que contribuyen a la concentración extracelular media de dopamina en el núcleo accumbens.. J Neurochem 121, 252–62 (2012).doi:10.1111/j.1471-4159.2012.07677.x [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

29. Yapo C, Nair AG, Clement L, Castro LR, Hellgren Kotaleski J y Vincent P Detección de dopamina fásica mediante neuronas espinosas del medio estriado D1 y D2. J Physiol (2017) .doi: 10.1113 / JP274475 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

30. Freed CR y Yamamoto BK Metabolismo regional de la dopamina cerebral: un marcador de la velocidad, la dirección y la postura de los animales en movimiento. Ciencia: 229, 62 – 65 (1985). ElPubMed] [Google Scholar]

31. Niv Y, Daw ND, Joel D y Dayan P Dopamina tónica: costos de oportunidad y control del vigor de respuesta. Psicofarmacología (Berl) 191, 507–20 (2007).doi:10.1007/s00213-006-0502-4 [PubMed] [CrossRef] [Google Scholar]

32. Strecker RE, Steinfels GF y Jacobs BL Actividad de la unidad dopaminérgica en gatos que se mueven libremente: falta de relación con la alimentación, la saciedad y las inyecciones de glucosa. Brain Res. 260, 317 – 21 (1983). ElPubMed] [Google Scholar]

33. Cohen JY, Amoroso MW y Uchida N Las neuronas serotoninérgicas señalan recompensa y castigo en múltiples escalas de tiempo. ELIFE 4, (2015) .doi: 10.7554 / eLife.06346 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

34. Floresco SB, West AR, Ash B, Moore H y Grace AA La modulación aferente de la activación de las neuronas dopaminérgicas regula de manera diferencial la transmisión tónica y fásica de dopamina. Nat Neurosci 6, 968 – 73 (2003) .doi: 10.1038 / nn1103 [PubMed] [CrossRef] [Google Scholar]

35. Grace AA Desregulación del sistema de dopamina en la fisiopatología de la esquizofrenia y la depresión.. Nature Reviews Neuroscience 17, 524 (2016) .doi: 10.1038 / nrn.2016.57 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

36. Phillips PE, Stuber GD, Heien ML, Wightman RM y Carelli RM La liberación de dopamina subsiguiente promueve la búsqueda de cocaína. Naturaleza 422, 614 – 8 (2003) .doi: 10.1038 / nature01476 [PubMed] [CrossRef] [Google Scholar]

37. Wassum KM, Ostlund SB y Maidment NT La señalización de dopamina mesolímbica fásica precede y predice el rendimiento de una tarea de secuencia de acción iniciada por sí misma. Biol Psychiatry 71, 846–54 (2012).doi:10.1016/j.biopsych.2011.12.019 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

38. Howe MW, Tierney PL, Sandberg SG, Phillips PE y Graybiel AM La señalización prolongada de dopamina en el estriado indica la proximidad y el valor de recompensas a distancia. Naturaleza 500, 575–9 (2013).doi:10.1038/nature12475 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

39. Satoh T, Nakai S, Sato T y Kimura M Codificación correlacionada de la motivación y el resultado de la decisión de las neuronas de dopamina. J Neurosci 23, 9913 – 23 (2003). ElPubMed] [Google Scholar]

40. Howe MW y Dombeck DA Señalización rápida en distintos axones dopaminérgicos durante la locomoción y la recompensa. Naturaleza 535, 505–10 (2016).doi:10.1038/nature18942 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

41. Silva JAD, Tecuapetla F, Paixão V y Costa RM La actividad de la neurona de la dopamina antes de la acción inicia las puertas y vigoriza los movimientos futuros. Naturaleza 554, 244 (2018) .doi: 10.1038 / nature25457 [PubMed] [CrossRef] [Google Scholar]

42. du Hoffmann J y Nicola SM La dopamina estimula la búsqueda de recompensas al promover la excitación evocada en el núcleo accumbens. J Neurosci 34, 14349–64 (2014).doi:10.1523/JNEUROSCI.3492-14.2014 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

43. Hart AS, Rutledge RB, Glimcher PW y Phillips PE La liberación fásica de dopamina en el núcleo de rata accumbens codifica simétricamente un término de error de predicción de recompensa. J Neurosci 34, 698–704 (2014).doi:10.1523/JNEUROSCI.2489-13.2014 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

44. Soares S, Atallah BV y Paton JJ Las neuronas de la dopamina del cerebro medio controlan el juicio del tiempo. Ciencia: 354, 1273 – 1277 (2016) .doi: 10.1126 / science.aah5234 [PubMed] [CrossRef] [Google Scholar]

45. Ikemoto S Circuito de recompensa de dopamina: dos sistemas de proyección desde el cerebro medio ventral al núcleo accumbens-complejo tuberculoso olfativo. Brain Res Rev 56, 27–78 (2007).doi:10.1016/j.brainresrev.2007.05.004 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

46. Syed EC, Grima LL, Magill PJ, Bogacz R, Brown P y Walton ME La iniciación de acciones da forma a la codificación de dopamina mesolímbica de recompensas futuras. Nat Neurosci (2015) .doi: 10.1038 / nn.4187 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

47. Floresco SB, Yang CR, Phillips AG y Blaha CD La estimulación basolateral de la amígdala provoca el flujo de dopamina dependiente del receptor de glutamato en el núcleo accumbens de la rata anestesiada. Eur J Neurosci 10, 1241 – 51 (1998). ElPubMed] [Google Scholar]

48. Jones JL, Day JJ, Aragona BJ, Wheeler RA, Wightman RM y Carelli RM La amígdala basolateral modula la liberación terminal de dopamina en el núcleo accumbens y la respuesta condicionada. Biol Psychiatry 67, 737–44 (2010).doi:S0006–3223(09)01327–4 [pii] 10.1016/j.biopsych.2009.11.006 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

49. Cachope R, Mateo Y, Mathur BN, Irving J, Wang HL, Morales M, Lovinger DM y Cheer JF La activación selectiva de las interneuronas colinérgicas mejora la liberación de dopamina fásica accumbal: establece el tono para el procesamiento de recompensa. Representante celular 2, 33–41 (2012).doi:10.1016/j.celrep.2012.05.011 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

50. Threlfell S, Lalic T, Platt NJ, Jennings KA, Deisseroth K y Cragg SJ La liberación de dopamina estriatal se desencadena por la actividad sincronizada en las interneuronas colinérgicas. Neurona 75, 58 – 64 (2012) .doi: 10.1016 / j.neuron.2012.04.038 [PubMed] [CrossRef] [Google Scholar]

51. Grace AA La liberación de dopamina fásica versus tónica y la modulación de la capacidad de respuesta del sistema de dopamina: una hipótesis para la etiología de la esquizofrenia. Neurociencia 41, 1 – 24 (1991). ElPubMed] [Google Scholar]

52. Moyer JT, Wolf JA y Finkel LH Efectos de la modulación dopaminérgica sobre las propiedades integradoras de la neurona espinosa del medio estriado ventral. J neurofisiol 98, 3731 – 48 (2007). ElPubMed] [Google Scholar]

53. Jędrzejewska-Szmek J, Damodaran S, Dorman DB y Blackwell KT La dinámica del calcio predice la dirección de la plasticidad sináptica en las neuronas de proyección espinosa del estriado. Eur J Neurosci 45, 1044–1056 (2017).doi:10.1111/ejn.13287 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

54. Morris G, Arkadir D, Nevet A, Vaadia E y Bergman H Mensajes coincidentes pero distintos de la dopamina del cerebro medio y las neuronas tónicamente activas estriatales. Neurona 43, 133 – 43 (2004). ElPubMed] [Google Scholar]

55. Brown MT, Tan KR, O'Connor EC, Nikonenko I, Muller D y Lüscher C Las proyecciones de GABA del área tegmental ventral detienen las interneuronas colinérgicas accumbal para mejorar el aprendizaje asociativo. Naturaleza (2012) .doi: 10.1038 / nature11657 [PubMed] [CrossRef] [Google Scholar]

56. Yamanaka K, Hori Y, Minamimoto T, Yamada H, Matsumoto N, Enomoto K, Aosaki T, Graybiel AM y Kimura M Los roles de los núcleos parafasciculares centromedianos del tálamo y las interneuronas colinérgicas en el cuerpo estriado dorsal en el aprendizaje asociativo de eventos ambientales. Transmisión Neural J (Viena) (2017).doi:10.1007/s00702-017-1713-z [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

57. Shen W, Plotkin JL, Francardo V, Ko WK, Xie Z, Li Q, Fieblinger T, Wess J, Neubig RR, Lindsley CW, Conn PJ, Greengard P, Bezard E, Cenci MA y Surmeier DJ La señalización del receptor muscarínico M4 mejora los déficits de plasticidad estriatal en modelos de disquinesia inducida por L-DOPA. Neurona 88, 762–73 (2015).doi:10.1016/j.neuron.2015.10.039 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

58. Nair AG, Gutiérrez-Arenas O, Eriksson O, Vincent P y Hellgren Kotaleski J Detección de señales de recompensa positivas y negativas a través de GPCR acoplados a adenilil ciclasa en neuronas espinosas del medio estriado de vía directa e indirecta. J Neurosci 35, 14017–30 (2015).doi:10.1523/JNEUROSCI.0730-15.2015 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

59. Stocco A La entropía basada en la acetilcolina en la selección de la respuesta: un modelo de cómo las interneuronas del estriado modulan la variabilidad de la exploración, la explotación y la respuesta en la toma de decisiones. Fronteras en la neurociencia 6(2012). [Artículo gratuito de PMC] [PubMed] [Google Scholar]

60. Franklin NT y Frank MJ Un circuito de retroalimentación colinérgico para regular la incertidumbre de la población estriada y optimizar el aprendizaje de refuerzo.. ELIFE 4, (2015) .doi: 10.7554 / eLife.12029 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

61. Nougaret S y Ravel S Modulación de las neuronas tónicamente activas del estriado del mono por eventos que llevan información de fuerza y recompensa diferente. J Neurosci 35, 15214 – 26 (2015) .doi: 10.1523 / JNEUROSCI.0039-15.2015 [PubMed] [CrossRef] [Google Scholar]

62. Schultz W Señal de recompensa predictiva de las neuronas dopaminérgicas.. J neurofisiol 80, 1 – 27 (1998). ElPubMed] [Google Scholar]

63. Lammel S, Hetzel A, Häckel O, Jones I, Liss B y Roeper J Propiedades únicas de las neuronas mesoprefrontal dentro de un sistema de dopamina mesocorticolímbica dual. Neurona 57, 760 – 73 (2008) .doi: 10.1016 / j.neuron.2008.01.022 [PubMed] [CrossRef] [Google Scholar]

64. Poulin JF, Zou J, Drouin-Ouellet J, Kim KY, Cicchetti F y Awatramani RB Definición de la diversidad de neuronas dopaminérgicas en el medio cerebro mediante el perfil de expresión génica unicelular. Representante celular 9, 930–43 (2014).doi:10.1016/j.celrep.2014.10.008 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

65. Morales M y Margolis EB Área tegmental ventral: heterogeneidad celular, conectividad y comportamiento.. Nat Rev Neurosci 18, 73 – 85 (2017) .doi: 10.1038 / nrn.2016.165 [PubMed] [CrossRef] [Google Scholar]

66. Matsumoto M y Hikosaka O Dos tipos de neuronas dopaminérgicas transmiten claramente señales motivacionales positivas y negativas. Naturaleza 459, 837 – 41 (2009) .doi: nature08028 [pii] 10.1038 / nature08028 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

67. Pasquereau B y Turner RS Las neuronas de la dopamina codifican errores en la predicción de la aparición del movimiento. Revista de Neurofisiología 113, 1110–1123 (2014).doi:10.1152/jn.00401.2014 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

68. Redgrave P, Prescott TJ y Gurney K ¿Es la respuesta de dopamina de corta latencia demasiado corta para indicar un error de recompensa?? Tendencias Neurosci 22, 146 – 51 (1999). ElPubMed] [Google Scholar]

69. Bromberg-Martin ES, Matsumoto M y Hikosaka O La dopamina en el control motivacional: gratificante, aversiva y alerta. Neurona 68, 815–34 (2010).doi:10.1016/j.neuron.2010.11.022 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

70. Dodson PD, Dreyer JK, Jennings KA, Syed EC, Wade-Martins R, Cragg SJ, Bolam JP y Magill PJ La representación del movimiento espontáneo por las neuronas dopaminérgicas es selectiva de tipo celular y se interrumpe en el parkinsonismo. Proc Natl Acad Sci EE.UU. 113, E2180–8 (2016).doi:10.1073/pnas.1515941113 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

71. Lerner TN, Shilyansky C, Davidson TJ, Evans KE, Beier KT, Zalocusky KA, Crow AK, Malenka RC, Luo L, Tomer R y Deisseroth K Los análisis cerebrales intactos revelan información específica llevada por subcircuitos de dopamina SNc. Celular 162, 635–47 (2015).doi:10.1016/j.cell.2015.07.014 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

72. Parker NF, Cameron CM, Taliaferro JP, Lee J, Choi JY, Davidson TJ, Daw ND y Witten IB La codificación de la recompensa y la elección en terminales de neuronas de dopamina del cerebro medio depende del objetivo estriado. Nat Neurosci (2016) .doi: 10.1038 / nn.4287 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

73. Kim CK, Yang SJ, Pichamoorthy N, Young NP, Kauvar I, Jennings JH, Lerner TN, Berndt A, Lee SY, Ramakrishnan C, Davidson TJ, Inoue M, Bito H y Deisseroth K Medición rápida y simultánea de la dinámica del circuito en múltiples sitios en el cerebro de los mamíferos. Nature Methods 13, 325–328 (2016).doi:10.1038/nmeth.3770 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

74. Menegas W, Babayan BM, Uchida N y Watabe-Uchida M Inicialización opuesta a nuevas señales en la señalización de dopamina en el estriado ventral y posterior en ratones. ELIFE 6, (2017) .doi: 10.7554 / eLife.21886 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

75. Brown HD, McCutcheon JE, Cone JJ, Ragozzino ME y Roitman MF Los estímulos primarios de recompensa y recompensa de alimentos evocan diferentes patrones de señalización fásica de dopamina en todo el estriado. El European Journal of Neuroscience 34, 1997–2006 (2011).doi:10.1111/j.1460-9568.2011.07914.x [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

76. Knutson B y Greer SM Afecto anticipatorio: correlatos neurales y consecuencias para la elección. Philos Trans R Soc Lond B Biol Ciencia 363, 3771–86 (2008).doi:10.1098/rstb.2008.0155 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

77. Bartra O, McGuire JT y Kable JW El sistema de valoración: un metanálisis basado en coordenadas de los experimentos BOLD fMRI que examinan los correlatos neuronales de valor subjetivo. Neuroimagen 76, 412–27 (2013).doi:10.1016/j.neuroimage.2013.02.063 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

78. Ferenczi EA, Zalocusky KA, Liston C, Grosenick L, Warden MR, Amatya D, Katovich K, Mehta H, Patenaude B, Ramakrishnan C, Kalanithi P, Etkin A, Knutson B, Glover GH y Deisseroth K Regulación cortical prefrontal de la dinámica del circuito de todo el cerebro y el comportamiento relacionado con la recompensa. Ciencia: 351, aac9698 (2016) .doi: 10.1126 / science.aac9698 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

79. Bertran-González J, Bosch C, Maroteaux M, Matamales M, Hervé D, Valjent E y Girault JA Patrones opuestos de activación de señalización en neuronas del estriado que expresan el receptor D1 y D2 de dopamina en respuesta a la cocaína y el haloperidol. J Neurosci 28, 5671 – 85 (2008) .doi: 10.1523 / JNEUROSCI.1039-08.2008 [PubMed] [CrossRef] [Google Scholar]

80. Redgrave P, Prescott TJ y Gurney K Los ganglios basales: ¿una solución vertebrada para el problema de selección? Neurociencia 89, 1009 – 23 (1999). ElPubMed] [Google Scholar]

81. Beeler JA, Frazier CR y Zhuang X Poner el deseo en un presupuesto: dopamina y gasto de energía, conciliación de recompensa y recursos. Frente Integr Neurosci 6, 49 (2012) .doi: 10.3389 / fnint.2012.00049 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

82. Anderson BA, Kuwabara H, Wong DF, Gean EG, Rahmim A, Brašić JR, George N, Frolov B, Courtney SM y Yantis S El papel de la dopamina en la orientación atencional basada en el valor. Curr biol 26, 550–5 (2016).doi:10.1016/j.cub.2015.12.062 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

83. Chatham CH, Frank MJ y Badre D Salida corticostriatal durante la selección desde la memoria de trabajo. Neurona 81, 930–42 (2014).doi:10.1016/j.neuron.2014.01.002 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

84. Shenhav A, Botvinick MM y Cohen JD El valor esperado del control: una teoría integradora de la función de la corteza cingulada anterior. Neurona 79, 217–40 (2013).doi:10.1016/j.neuron.2013.07.007 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

85. Aarts E, Roelofs A, Franke B, Rijpkema M, Fernández G, Helmich RC y Cools R La dopamina estriada media la interfaz entre el control motivacional y el control cognitivo en humanos: evidencia de imágenes genéticas. Neuropsicofarmacología 35, 1943–51 (2010).doi:10.1038/npp.2010.68 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

86. Westbrook A y Braver TS La dopamina cumple una doble función al motivar el esfuerzo cognitivo. Neurona 89, 695–710 (2016).doi:10.1016/j.neuron.2015.12.029 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

87. Manohar SG, Chong TT, Aplicaciones MA, Batla A, Stamelou M, Jarman PR, Bhatia KP y Husain M La recompensa paga el costo de la reducción de ruido en el control motor y cognitivo. Curr biol 25, 1707–16 (2015).doi:10.1016/j.cub.2015.05.038 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

88. Wunderlich K, Smittenaar P y Dolan RJ La dopamina mejora el comportamiento basado en el modelo sobre el de elección libre de modelo. Neurona 75, 418–24 (2012).doi:10.1016/j.neuron.2012.03.042 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

89. Nicola SM La hipótesis del enfoque flexible: la unificación del esfuerzo y las hipótesis de respuesta para el papel del núcleo accumbens dopamina en la activación del comportamiento de búsqueda de recompensa. J Neurosci 30, 16585–600 (2010).doi:10.1523/JNEUROSCI.3958-10.2010 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

90. Eban-Rothschild A, Rothschild G, Giardino WJ, Jones JR y de Lecea L Las neuronas dopaminérgicas VTA regulan las conductas de sueño y vigilia etológicamente relevantes. Nat Neurosci (2016) .doi: 10.1038 / nn.4377 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

91. Haber SN, Fudge JL y McFarland NR Las vías estriatonigrostriatales en primates forman una espiral ascendente desde la cáscara hasta el estriado dorsolateral. J Neurosci 20, 2369 – 82 (2000). ElPubMed] [Google Scholar]

92. Reddi BAJ y Carpenter RHS La influencia de la urgencia en el tiempo de decisión.. Neurociencia de la naturaleza 3, 827 (2000). ElPubMed] [Google Scholar]

93. Thura D y Cisek P Los ganglios basales no seleccionan objetivos de alcance pero controlan la urgencia de compromiso. Neurona (2017) .doi: 10.1016 / j.neuron.2017.07.039 [PubMed] [CrossRef] [Google Scholar]

94. Turner RS y Desmurget M Contribuciones de los ganglios basales al control motor: un tutor vigoroso. Curr Opin Neurobiol 20, 704–16 (2010).doi:10.1016/j.conb.2010.08.022 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

95. Hikosaka O, Nakamura K y Nakahara H Ganglios basales orientan los ojos para recompensar.. J neurofisiol 95, 567 – 84 (2006) .doi: 10.1152 / jn.00458.2005 [PubMed] [CrossRef] [Google Scholar]

96. Kelly PH y Moore KE Neuronas dopaminérgicas mesolímbicas en el modelo rotacional de la función nigrostriatal. Naturaleza 263, 695 – 6 (1976). ElPubMed] [Google Scholar]

97. Primos MS, Atherton A, Turner L y Salamone JD Los agotamientos de dopamina de Nucleus accumbens alteran la asignación de respuesta relativa en una tarea de costo / beneficio del laberinto en T. Behav Brain Res 74, 189 – 97. (1996). ElPubMed] [Google Scholar]

98. Redish AD Prueba y error vicarios. Nat Rev Neurosci 17, 147–59 (2016).doi:10.1038/nrn.2015.30 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

99. Rabinovich MI, Huerta R, Varona P y Afraimovich VS Dinámica cognitiva transitoria, metastabilidad y toma de decisiones.. PLoS Comput Biol 4, e1000072 (2008) .doi: 10.1371 / journal.pcbi.1000072 [Artículo gratuito de PMC] [PubMed] [CrossRef] [Google Scholar]

100. Comerciante H, Harrington DL y Meck WH Bases neuronales de la percepción y estimación del tiempo.. Annu Rev Neurosci 36, 313 – 36 (2013) .doi: 10.1146 / annurev-neuro-062012-170349 [PubMed] [CrossRef] [Google Scholar]