Activación De Receptores De Dopamina En El Núcleo Accumbens Promueve El Comportamiento Enfoque Cued Reforzado Con Sacarosa (2016)

Front Behav Neurosci. 2016 Jul 14; 10: 144. doi: 10.3389 / fnbeh.2016.00144. eCollection 2016.

du Hoffmann J1, Nicola SM1.

Resumen

La activación del receptor de dopamina en el núcleo accumbens (NAc) promueve la búsqueda vigorosa de alimentos con estímulo ambiental en ratas hambrientas. Sin embargo, las ratas alimentadas ad libitum responden a menos indicios de predicción de alimentos, particularmente cuando el valor de la recompensa de alimentos es bajo. Aquí, investigamos si esta diferencia podría deberse a diferencias en el grado de activación del receptor de dopamina en el NAc. Primero, observamos que aunque las ratas a las que se les había dado acceso a voluntad a chow en sus jaulas caseras se acercaban a un receptáculo de alimentos en respuesta a señales predictoras de recompensa, el número de tales enfoques disminuyó a medida que los animales acumulaban recompensas. Curiosamente, el enfoque de los alimentos con indicios se produjo en grupos, con varias respuestas seguidas de no respuestas sucesivas.

Este patrón sugiere que el comportamiento fue dictado por transiciones entre dos estados, receptivo y no receptivo. La inyección de agonistas del receptor de dopamina D1 o D2 en el NAc dependía de la dosis de respuesta dependiente promoviendo las transiciones al estado de respuesta y previniendo las transiciones al estado de no respuesta. En contraste, los antagonistas de los receptores D1 o D2 promovieron episodios largos de falta de respuesta al inducir transiciones al estado no sensible y al prevenir las transiciones al estado sensible.

Además, el comportamiento locomotor durante el intervalo entre ensayos se correlacionó con el estado de respuesta, y también se incrementó por los agonistas del receptor de dopamina. Estos resultados sugieren que la activación de los receptores de dopamina NAc juega un papel importante en la regulación de la probabilidad de acercamiento a los alimentos en condiciones de saciedad normativa.

PALABRAS CLAVE: adiccion; extinción; locomoción; mesolímbico obesidad; comportamiento de búsqueda de recompensa; saciedad

PMID: 27471453

PMCID: PMC4943936

DOI: 10.3389 / fnbeh.2016.00144

Introducción

Para un animal hambriento, la decisión de responder a una señal predictiva de alimentos es trivial. Los animales hambrientos y bien entrenados responden a casi todas las señales que indican la disponibilidad de alimentos. La probabilidad y el vigor de estas respuestas, sin embargo, es menor en el estado normativo de saciedad. ¿Cuáles son los mecanismos neuronales que establecen la probabilidad de acercamiento a los alimentos en tales condiciones? Debido a que responder a las señales de predicción de alimentos en ausencia de necesidad calórica probablemente contribuye al consumo elevado de calorías (Boulos et al., ; Boyland y Halford, ), responder a esta pregunta es un paso importante para comprender tanto la ingesta calórica normal como la ingesta desregulada en la obesidad.

Comenzamos con la observación de que la activación del receptor de dopamina en el núcleo accumbens (NAc) es fundamental para el enfoque con indicaciones hacia los objetos asociados con los alimentos en condiciones en las que la posición inicial de una rata varía de un ensayo a otro. En estas condiciones, la inyección de antagonistas de los receptores de dopamina D1 o D2 en el núcleo de NAc reduce la proporción de señales a las que responden los animales aumentando la latencia para iniciar el enfoque (Nicola, ). Estos efectos resultan de una reducción en la magnitud y la prevalencia de las excitaciones provocadas por la dopamina dependientes de dopamina (du Hoffmann y Nicola, ). Estas excitaciones, que se observan en casi la mitad de las neuronas NAc, preceden al inicio del movimiento y son mayores cuando la latencia para iniciar el movimiento es más corta (McGinty et al., ; du Hoffmann y Nicola, ; Morrison y Nicola, ). Una hipótesis para explicar la respuesta reducida en animales sin restricción alimenticia es que se libera menos dopamina en animales con menos hambre, una idea respaldada por evidencia electroquímica, de microdiálisis y electrofisiológica (Ostlund et al., ; Branch et al. ; Cone et al. ). En consecuencia, puede haber menos activación de los receptores de dopamina NAc en condiciones de relativa saciedad, lo que lleva a una menor probabilidad de responder a las señales asociadas con los alimentos.

Para probar esta hipótesis, preguntamos si el bloqueo farmacológico y la activación tónica de los receptores de dopamina NAc en animales no restringidos en alimentos podrían, respectivamente, atenuar y promover la respuesta. En la fase experimental, las ratas tuvieron acceso a comida y agua. ad libitum en sus jaulas para inducir un estado de relativa saciedad, lo que disminuyó enormemente la probabilidad de que los animales respondieran a una determinada presentación. Esta menor probabilidad de respuesta nos permitió evaluar si los agonistas de los receptores de dopamina aumentan esa probabilidad, lo cual no es posible en animales hambrientos porque responden a casi todas las señales. Encontramos que el bloqueo de los receptores de dopamina disminuyó la respuesta, mientras que la activación de los mismos receptores aumentó la respuesta. Estos resultados sugieren que la probabilidad de respuesta y la búsqueda de alimentos en animales relativamente saciados está regulada activamente por la dopamina NAc.

Materiales y métodos

Animales

Ocho hombres Long-Evans que pesaban 275-300 g fueron comprados a Harlan y alojados individualmente en un ciclo de luz / oscuridad 12 h. Todos los experimentos se realizaron en la fase de luz. El cuidado de los animales era idéntico a las cuentas publicadas anteriormente (Nicola, ; du Hoffmann et al. ; McGinty et al. ; du Hoffmann y Nicola, ; Morrison y Nicola, ). Al llegar, las ratas recibieron 1 semana de descanso y luego se acostumbraron a ser manejadas por el experimentador. Después de la habituación, los animales fueron restringidos a los alimentos a ~ 90% del peso corporal de alimentación libre antes de comenzar las etapas iniciales de entrenamiento. Después de las primeras etapas del entrenamiento, los animales tuvieron acceso gratuito a la comida estándar de laboratorio en la jaula de su casa. Todos los procedimientos con animales fueron consistentes con los Institutos Nacionales de Salud de los EE. UU. Guía para el cuidado y uso de animales de laboratorio y fueron aprobados por el Comité Institucional de Cuidado y Uso de Animales en el Colegio de Medicina Albert Einstein.

Camaras operantes

El entrenamiento del comportamiento se llevó a cabo en cámaras operantes (30 × 25 cm) compradas de Med Associates. Los experimentos se llevaron a cabo en gabinetes de atenuación de sonido con luces azules iluminadas. Se jugó un ruido blanco constante (65 dB) dentro de la cámara para limitar las distracciones del ruido exterior. Las cámaras operantes estaban equipadas con un receptáculo de recompensa en una pared. Un rayo fotográfico ubicado en la parte frontal del receptáculo mide los tiempos de entrada y salida del receptáculo. Se usó una bomba de jeringa, ubicada fuera de la cámara, para entregar la recompensa de sacarosa líquida en el receptáculo de recompensa. Las marcas de tiempo de comportamiento se registraron con una resolución de 1 ms.

Entrenamiento de tareas 2CS

A los animales se les restringió la comida durante las etapas iniciales de entrenamiento. La primera etapa de entrenamiento requirió que los animales ingresaran al receptáculo de comida, lo que provocó la entrega de sacarosa líquida al 10%. Después de un retraso de 10 s para permitir el consumo de recompensa, los animales tenían que abandonar el receptáculo y volver a entrar para obtener una recompensa adicional. En las etapas de entrenamiento posteriores, se introdujeron retrasos de 20 sy luego 30 s entre la disponibilidad de recompensas. El rendimiento del criterio se estableció en 100 recompensas obtenidas en 1 h. Una vez establecido el rendimiento del criterio con un retraso de 30 s entre la disponibilidad de la recompensa, se introdujeron dos señales auditivas que predijeron una recompensa pequeña o grande (150 o 250 μl de solución de sacarosa al 10% en agua). Las señales auditivas consistieron en un tono de sirena (que oscilaba en frecuencia de 4 a 8 kHz durante 400 ms) y un tono intermitente (tono de 6 kHz encendido durante 40 ms, apagado durante 50 ms); Se asignaron señales a recompensas grandes y pequeñas de forma aleatoria para cada rata y la relación de magnitud señal-recompensa se mantuvo constante a lo largo del entrenamiento y los experimentos para una rata determinada. La entrega de la recompensa estaba supeditada a que la rata entrara en el receptáculo de recompensa durante la presentación de la señal, momento en el que la señal terminó. Las señales estuvieron encendidas hasta por 5 s. El intervalo entre ensayos se eligió pseudoaleatoriamente a partir de una distribución exponencial truncada con una media de 30 s. Una vez que los animales respondieron a> 80% de las señales, los animales fueron alimentados ad libitum En sus jaulas de origen desde ese punto hasta el final de los experimentos. Después de que el desempeño de la tarea se estabilizó, la concentración de sacarosa de la recompensa líquida se redujo de 10% a 3%; Los volúmenes no fueron cambiados. El comportamiento se monitorizó diariamente hasta que se logró el desempeño de la tarea asintótica.

La cirugía

Después de que se estabilizó el comportamiento, se implantaron crónicamente cánulas de guía bilaterales dirigidas al núcleo de NAc como se describió anteriormente (Nicola, ; Lardeux et al. ). Brevemente, los animales se anestesiaron con isofluorano y se colocaron en un marco estereotáxico con la cabeza plana. Se perforaron pequeños orificios bilateralmente en el cráneo en 1.4 mm anterior y ± 1.5 mm lateral de Bregma. Se usó un brazo estereotáxico para colocar con precisión las cánulas en estos agujeros y luego bajarlas en el cerebro hasta una profundidad final de 6 mm desde la parte superior del cráneo (2 mm por encima de la NAc). Las cánulas se mantuvieron en su lugar con tornillos para huesos y cemento dental. Dos postes roscados se colocaron verticalmente en el cráneo y se incrustaron en cemento dental. Estas publicaciones se conectaron con tornillos a un cabezal que contiene dos LED, lo que permitió el seguimiento automático de video durante los experimentos. Los animales recibieron el antibiótico enrofloxacina antes del 1 y el día posterior a la cirugía. Después de la cirugía, a las ratas se les dio 1 semana para recuperarse antes de que comenzara un breve período de reentrenamiento postquirúrgico en la tarea 2CS.

Drogas

Los medicamentos se adquirieron en Sigma y se disolvieron recientemente en solución salina estéril al 0.9 el día en que se usaron. Las dosis de fármaco por lado fueron: "D1 agonist low", 0.1 μg SKF81297; “D1 agonist high”, 0.4 μg SKF81297; "D1 antagonista", 1.1 μg Schering 23390; "Agonista D2 bajo", 1 μg de quinpirol; "D2 agonista alto", 10 μg de quinpirol; "Antagonista D2", 2.2 μg raclopride.

Procedimiento de microinyeccion

Como se describió anteriormente (Nicola, ; Lardeux et al. ), las ratas se sujetaron suavemente con una toalla, mientras que los inyectores de 33 ga se insertaron en la cánula guía, de modo que el inyector extendió 2 mm ventral más desde la parte inferior de la guía, hasta llegar al centro del núcleo de NAc. Después de 1 min, se inyectaron 0.5 μL de solución de fármaco en 2 min con una bomba de jeringa de precisión. Se administró a las drogas 1 min para difundirlas, después de lo cual los animales se colocaron inmediatamente en las cámaras operantes. El orden de las inyecciones de fármacos fue aleatorio entre las ratas. Las inyecciones se realizaron dos veces por semana (los martes y los jueves o los viernes), con una sesión de intervención no inyectada el día anterior a cada inyección para garantizar que el comportamiento se recuperó de la inyección anterior.

Seguimiento de video

En los días de prueba, la posición de la rata se registró usando una cámara aérea (30 cuadros / s) y un sistema de seguimiento automático (ya sea Plexon Cineplex o Noldus Ethovision). Este sistema rastreó las posiciones xey de los LED rojos y verdes conectados a la cabeza de la rata. Como se describió anteriormente (Nicola, ; McGinty et al. ; du Hoffmann y Nicola, ; Morrison y Nicola, ), para determinar la posición de la rata en la cámara operante, calculamos un centroide (el punto central) entre los LED para cada cuadro de video. Las posiciones faltantes hasta 10 fotogramas sucesivos se interpolaron linealmente; si faltaban> 10 fotogramas sucesivos, los datos se descartaban. Para cada fotograma, calculamos la SD de las distancias de las posiciones del centroide dentro de una ventana temporal de 200 ms. Cuando se transformó logarítmicamente, estos valores SD se distribuyeron bimodalmente, con el pico inferior representando épocas de no movimiento y el pico superior con movimiento. Luego ajustamos dos funciones gaussianas a estas distribuciones y el umbral de movimiento se determinó como el punto donde las distribuciones superior e inferior se superponían menos. El movimiento se definió como 8 fotogramas consecutivos por encima de este umbral.

El análisis de datos

Una rata no logró volver a alcanzar los niveles de rendimiento preoperatorio después de la implantación de la cánula y, por lo tanto, no fue sometida a microinyecciones. Las cánulas de una segunda rata se obstruyeron y, en consecuencia, no se realizaron algunas microinyecciones. Por lo tanto, los datos se obtuvieron de microinyecciones 7 para algunos experimentos y 6 para otros. Los datos de posición de las marcas de tiempo de comportamiento y de seguimiento de video sin procesar se exportaron y el análisis se realizó con rutinas personalizadas en el entorno de computación estadística R (R Core Team, ).

En figuras 1B – ECalculamos la relación de respuesta de la señal dividiendo el número de señales respondidas por la cantidad de señales presentadas en 15 min o 1 h bins y las representamos como medias de sesiones cruzadas. Para evaluar las variables de tareas que influyen en el rendimiento en cada medicamento, utilizamos ANOVA de medidas repetidas con relación de respuesta como variable dependiente frente a dos factores, intervalo de tiempo (1 y 2 h) y tipo de referencia (grande y pequeño). Post hoc emparejado de dos colas tSe usaron pruebas dentro de cada condición de fármaco para probar si el tiempo de la sesión y el tipo de señal (grande y pequeña) influyeron significativamente en la proporción de respuesta. Welch de dos colas tSe utilizaron pruebas para comparar los índices de respuesta de cada fármaco a la solución salina. Valores de p para post-hoc t-Las pruebas se corrigieron utilizando el procedimiento de corrección de comparaciones múltiples de Sidak. El umbral de significación para todas las pruebas estadísticas se estableció en p <0.05. Los resultados de todas las pruebas estadísticas se pueden encontrar en la Tabla Table11.

Figura 1 y XNUMX  

Los agonistas y antagonistas de los receptores D1 y D2, respectivamente, promueven y atenúan el enfoque de recompensa. (A) 2CS + esquema de tareas. El tiempo no es escalar. (ANTES DE CRISTO) Relación de respuesta promedio de sesión única (% de señales respondidas) en intervalos de tiempo mínimo de 15 a señales que ...
Tabla 1  

Resultados estadisticos.

En figuras 2F, G, las señales sin respuesta se marcaron primero y las "pausas" se definieron como ≥2 ensayos sucesivos sin respuesta. La duración de la pausa se definió como el intervalo de tiempo entre cues con respuestas. El tiempo acumulado gastado en pausas se grafica contra el número de pausa secuencial (paneles de la izquierda), y el tiempo acumulado promedio gastado en pausas hasta el final de la sesión se muestra en los gráficos de barras (paneles de la derecha). Se utilizaron ANOVA de una vía con el tipo de fármaco como factor para evaluar si el número de pausas o el tiempo acumulado en las pausas difirió entre los fármacos. Post hoc Welch de dos colas corregido por Sidak t-Las pruebas se utilizaron para comparar el número de pausa y el tiempo total empleado en las pausas en cada medicamento y solución salina.

Figura 2 y XNUMX  

Los agonistas de los receptores D1 y D2 disminuyen el tiempo empleado en el estado de no respuesta. (A – E) Los rásteres muestran cinco sesiones de ejemplo, una para cada medicamento (solo en dosis altas). Cada línea representa el momento en el que una indicación predice una recompensa grande (negra) o pequeña (naranja) ...

In Figuras 4A, C, F, H, cada prueba t fue codificado como provocando una respuesta (R +) o no pudo obtener una respuesta (R−). Luego calculamos la probabilidad empírica de la aparición de R + o R− en t+ 1. Este procedimiento da como resultado medidas de probabilidad 4, cada una de las cuales está asociada con un patrón único de respuesta y no respuesta en los dos ensayos consecutivos, t y t+ 1: P(R + R +), P(R + R−), P(R − R−), P(R − R +). Cuando estas probabilidades se organizan de modo que cada pareado que comienza con el mismo tipo de respuesta (R + o R−) esté en la misma fila de una matriz 2 × 2, cada fila se suma a una; Es decir, la matriz es estocástica derecha. En Figuras 4A, C, F, H, trazamos (separadamente para cada medicamento) las probabilidades medias para cada pareado con los valores de fila de estas matrices en el mismo eje. Por ejemplo, P(R + R +), P(R + R−) están en el eje vertical porque cada pareado comienza con un R +. Debido a que cada fila de cada matriz suma a uno, los valores de la matriz son todos positivos, y la rata puede pasar libremente de un estado sensible (R +) a un estado no sensible (R−), y viceversa, la matriz estocástica puede describir un Markov Cadena para la que se puede calcular un vector de probabilidad estacionario π. Estos vectores de probabilidad son estimaciones de la probabilidad de encontrar la rata en el estado de respuesta y no de respuesta en un estado estable de la cadena de Markov (Figura (Figura 3) .3). Para calcular los componentes de π, transponemos cada matriz, encontramos los valores propios de la izquierda de las matrices transpuestas y luego dividimos estos valores por su suma (lo que garantiza que las componentes de π sumen a 1). El vector de probabilidad media para cada grupo de tratamiento se representa en las Figuras 4B, D, G, I. Por lo tanto, tenemos dos formas únicas de caracterizar el comportamiento: por la matriz estocástica, que muestra gráficamente las probabilidades de transición media, y por el vector de probabilidades estacionarias, que arroja una estimación de la probabilidad de que la rata esté en respuesta o no. estado. Para comparar estos vectores de probabilidad entre drogas y tiempo, restamos los dos componentes de π, un enfoque que preserva la información sobre la dirección relativa del par de estimaciones de probabilidad. En figuras 4E, J, trazamos la mediana de la sesión cruzada y los cuartiles medios de estas diferencias dentro de cada medicamento por separado para cada sesión por hora. Para determinar para cada fármaco si estos vectores de probabilidad diferían entre la primera y la segunda hora de las sesiones, comparamos sus diferencias con las pruebas de rango con signo de Wilcoxon emparejadas. A continuación, realizamos pruebas de rango con signo de Wilcoxon no pareadas (solución salina frente a fármaco) dentro de cada hora y corregimos los valores p de 6 (uno para cada medicamento frente a solución salina) con una corrección de Sidak.

Figura 3 y XNUMX  

Esquema de un modelo de Markov de dos estados. En una prueba dada, una rata puede permanecer en el estado de respuesta (círculo izquierdo y flecha en bucle) o no sensible (círculo derecho y flecha en bucle) o pasar al otro estado (flechas entre los círculos). Cada ...
Figura 4 y XNUMX  

Los agonistas de los receptores D1 y D2 promueven transistiones desde el estado de no respuesta al estado de respuesta. (A, C, F, H). Estos gráficos muestran las probabilidades de transición asociadas para todos los pares de respuestas posibles / no respuesta de 4, calculadas con la ecuación dada en la ...

En figuras 5A, BLas señales a las que respondió el animal fueron aisladas por primera vez. En figura Figura5A, 5ALas latencias del animal para comenzar el movimiento dirigido hacia el receptáculo (barras de la izquierda) y para alcanzar el recipiente de recompensa (barras de la derecha) se calcularon y representaron como la media de la sesión cruzada. En figura Figura5B, 5B, calculamos, para cada prueba, la longitud del camino (en cm) que el animal tomó hasta el receptáculo desde su posición en el inicio de la señal. Luego calculamos la relación de dos valores: (A) la distancia en línea recta entre la posición de la rata en el inicio de la señal y el receptáculo, y (B) la longitud del camino real que se tomó para llegar al receptáculo. Estas relaciones A: B se denominan valores de "eficiencia de trayectoria"; van de 0 a 1, con valores más cercanos a 1 que indican caminos más eficientes (menos tortuosos). Las eficiencias de la ruta se representaron gráficamente como medias de sesiones cruzadas para cada tipo de fármaco. Para evaluar si cada uno de estos valores de latencia o la medida de eficiencia de la ruta diferían entre los fármacos, realizamos ANOVA unidireccionales con el fármaco como factor. En figura Figura5C, 5C, para cada prueba con una entrada de receptáculo con recompensa, contamos el número de entradas de receptáculo 5 s antes del inicio de cue y 5 s después del inicio de cue. Luego, estos conteos se convirtieron a tasas (entradas por s) al sumarlos en todos los ensayos con recompensa de la sesión y al dividir este valor por el número de ensayos con recompensa multiplicado por 5 s (la mayor duración posible del ensayo). Las tasas medias de cada sesión para cada medicamento se muestran en los gráficos de barras en la Figura Figura5C.5C. Para comparar estas dos tasas, para cada fármaco, utilizamos ANOVA de medidas repetidas con intervalo de tiempo (intervalos pre y post señal) como variable independiente. Para comparar las tasas de entrada de receptáculo entre la solución salina y el fármaco dentro de cada intervalo de tiempo, realizamos pruebas de Welch corregidas por Sidak t-pruebas En figura Figura5D, 5D, clasificamos los ensayos según la longitud del intervalo entre ensayos anterior (ITI) y agrupamos estos valores en contenedores de 10. Luego, calculamos los índices de respuesta para los ensayos con ITI que se encontraban dentro de cada intervalo y calculamos la media de la sesión cruzada para cada medicamento. Utilizamos un número de ITI bin como factor en un ANOVA de medidas repetidas para evaluar si, en cada medicamento, la probabilidad de respuesta variaba a lo largo de las duraciones de ITI. En figura Figura5E, 5E, para cada prueba, calculamos la distancia total recorrida (en cm) durante el inicio de la señal ITI anterior. Luego, calculamos la distancia media recorrida dentro de la sesión en las ITI anteriores a las señales a las que el animal respondió, y de manera similar a las señales a las que el animal no respondió. Para evaluar si la distancia total recorrida difirió entre los ensayos con y sin una respuesta indicada posterior, dentro de cada fármaco utilizamos ANOVA de medidas repetidas con el tipo de respuesta como factor. A continuación, realizamos post-hoc Welch corregido por Sidak t-pruebas para comparar la longitud promedio de las rutas recorridas para cada tipo de respuesta (fármaco frente a solución salina).

Figura 5 y XNUMX  

Los agonistas de la dopamina aumentan la locomoción, pero el aumento de la respuesta de respuesta no es atribuible al aumento de la locomoción. (UNA) El grupo de barras de la izquierda muestra los efectos de la inyección de solución salina, D1 y D2 agonistas en la latencia media para iniciar el movimiento después de ...

Histología

Los animales fueron profundamente anestesiados con Euthasol y decapitados con una guillotina. Los cerebros se extrajeron rápidamente del cráneo y luego se fijaron en formalina. Antes de cortar con un criostato, los cerebros se sometieron a crioprotección mediante inmersión en 30% de sacarosa durante varios días. Las secciones (50 μm) se tiñeron para la sustancia Nissl para visualizar la cánula y las pistas del inyector. Las estimaciones de los sitios de inyección para cada animal se muestran en la Figura Figura66.

Figura 6 y XNUMX  

Reconstrucción histológica de los sitios de inyección.. La figura muestra dos secciones coronales de cerebro de rata que abarcan la mayor parte de la extensión anterior-posterior de la NAc (0.8-2.8 mm anterior de Bregma). Los puntos negros representan estimaciones de la ubicación ...

Resultados

Probabilidad de respuesta

Capacitamos ratas 8 para responder a señales auditivas distintas que predijeron una recompensa de sacarosa pequeña o grande (Figura (Figura 1A) .1A). A pesar de que los animales no tenían restricción de alimentos, respondieron a casi todas las señales predictivas de 10% de sacarosa líquida (Figuras 1B, C, líneas negras) mientras que no discrimina sustancialmente entre grandes (Figura (Figura 1B) 1B) y pequeño (Figura (Figura 1C) 1C) recompensar la disponibilidad. En contraste, desde el primer día en que la concentración de la recompensa de sacarosa se redujo de 10% a 3%, se observó un pronunciado descenso de las respuestas indicadas en todo el 2 h de la prueba (Figuras 1B, C, líneas grises). Hay al menos dos explicaciones posibles para este efecto. Primero, podría deberse a un estado de saciedad, ya que los animales acumulan nutrientes con respuestas sucesivas. Sin embargo, esto es poco probable debido a que los nutrientes se acumulan más rápido con 10% que con 3% de recompensas de sacarosa del mismo volumen, sin embargo, la reducción fue mucho más pronunciada con 3% de sacarosa. La segunda posibilidad, que favorecemos, es que mientras que 10% de sacarosa es lo suficientemente reforzado para mantener la respuesta durante toda la sesión, los volúmenes equivalentes de 3% de sacarosa no lo son. Cualquiera que sea su causa, el efecto de reducción nos permitió preguntarnos si la activación de los receptores de dopamina mediante el uso de agonistas exógenos aumenta la proporción de respuesta. Esta pregunta no puede responderse utilizando 10% de recompensas de sacarosa o en animales con restricción de alimentos porque la respuesta inicial es cercana al 100% en esas condiciones y, por lo tanto, no se puede aumentar.

Cuando el rendimiento se estabilizó, 4 días después de cambiar a 3% de recompensas de sacarosa, fue evidente una diferencia en la respuesta a las señales de recompensa grandes y pequeñas hacia el comienzo de la sesión (compare la Figura Figura1B1B con la figura Figura 1C); 1C); esta diferencia disminuyó a medida que la sesión avanzaba y la respuesta a ambos tipos de referencia disminuyó. Esta diferencia significativa entre respuestas de respuesta grandes y pequeñas también es evidente en la relación de respuesta promedio durante la primera hora de la sesión después de las inyecciones de solución salina (control del vehículo) en el NAc: los sujetos respondieron al 54 ± 5% de las grandes claves asociadas a la recompensa y 33 ± 3% de señales asociadas con pequeñas recompensas (Figuras 1D, E, círculos negros izquierdos). La probabilidad de responder a ambas señales fue menor en la segunda hora; además, la relación de respuesta para las señales grandes y pequeñas fue estadísticamente indistinguible durante este período (Figuras 1D, E, círculos negros derechos; ver tabla Table11 para resultados estadísticos). Por lo tanto, los animales respondieron más a las señales que predicen recompensas grandes que pequeñas solo en la primera mitad de la sesión.

Para examinar el patrón temporal de respuesta con mayor detalle, construimos gráficos de trama que muestran el tiempo de cada presentación de referencia y si el animal respondió (ráster superior, Figura Figura 2A) 2A) o no (raster inferior). Como se muestra en una sesión de ejemplo anterior a la que se había inyectado la solución salina, tanto las respuestas como las fallas en la respuesta ocurrieron típicamente en grupos de varias señales sucesivas (Figura (Figura 2A) .2A). Esto sugiere que hay dos estados que dictan la probabilidad de respuesta: sensible y no sensible. Además, a medida que avanzaba la sesión, la reducción en la probabilidad de respuesta se debió a períodos de tiempo más largos en el estado de falta de respuesta (Figura (Figura 2A, 2A, top raster). Para cuantificar la duración cambiante de los estados no sensibles, trazamos, para cada sesión, el tiempo acumulado pasado en el estado pausado (no sensible) contra el número de pausa secuencial. Básicamente, en todas las sesiones de inyección de solución salina, estas líneas se volvieron más pronunciadas hacia el final de la sesión, lo que indica que los estados individuales que no responden se hicieron más largos a medida que avanzaban las sesiones (Figuras 2F, G, lineas negras).

Para evaluar la contribución de la dopamina en el núcleo de NAc a la decisión de responder a las señales predictivas de recompensa, aumentamos o disminuimos farmacológicamente la señalización del receptor de dopamina D1 o D2 mediante la microinyección del agonista del receptor D1 SKF 81297 o el antagonista SCH 23390, o el agonista del receptor D2 o el antagonista SCH 1 o el D2 agonista del receptor. antagonista de la racloprida. Encontramos que tanto los agonistas de DXNUMX como los de DXNUMX aumentaron significativamente respondiendo a las señales (Figura (Figura 1D, 1D, cuadrados rojos claros; Figura Figura1E, 1E, cuadrados azules claros); en particular, la dosis baja de cada agonista aumentó la respuesta solo en la segunda hora, mientras que la dosis alta aumentó la respuesta en toda la sesión (Figura (Figura 1D, 1D, luz de cuadrados rojos abiertos; Figura Figura1E, 1E, cuadrados azules claros abiertos). En general, la respuesta a señales de recompensa grandes y pequeñas se incrementó a grados aproximadamente equivalentes, y este fue el caso de los agonistas de los receptores D1 y D2 (Figuras 1D, E y mesa Table11).

Estos aumentos en la proporción de respuesta fueron acompañados por un patrón diferente de respuesta en comparación con los animales tratados con solución salina (Figuras 2B, C). En contraste con la condición de control, donde el tiempo pasado en el estado de no respuesta aumentó a medida que avanzaba la sesión, las respuestas de los animales tratados con agonistas se mantuvieron comparativamente durante toda la sesión, con transiciones breves pero relativamente frecuentes al estado de no respuesta (Figura (Figura 2F, 2F, Agonista de D1, líneas rojas claras; Figura Figura2G, 2G, Agonista D2, lineas azul claro). Ambos agonistas redujeron significativamente el tiempo acumulado en el estado de pausa no sensible y evitaron en gran medida el gran aumento del tiempo acumulado en las pausas que ocurrieron en la segunda hora de la sesión en animales tratados con solución salina.

Los antagonistas de los receptores D1 y D2 tuvieron el efecto opuesto de los agonistas. Los antagonistas redujeron en gran medida la respuesta a las señales en la primera mitad de la sesión, mientras que la respuesta en la segunda mitad se mantuvo sin cambios (probablemente debido a un efecto de piso) (Figura (Figura 1D), 1D), triángulos rojo oscuro; (Figura (Figura 1E, 1E, triángulos azul oscuro). Ambos antagonistas también prolongaron significativamente el tiempo acumulado pasado en el estado de no respuesta (Figuras 2D, E, F, G).

Probabilidades de transición

El aumento en las respuestas de respuesta causadas por los agonistas de D1 y D2, así como el mayor tiempo empleado en el estado de respuesta que en el estado de falta de respuesta, podrían explicarse por una mayor probabilidad de transición del estado de no respuesta al estado de respuesta. o, a la inversa, una probabilidad menor de pasar del estado de respuesta al estado de no respuesta (o ambos). Para determinar cuál de estos fue el caso, implementamos un modelo simple de Markov de dos estados (Figura (Figura 3) 3) calculando matrices de probabilidad de transición empíricas para los posibles pares de sucesos sucesivos de 4: dos respuestas indicadas sucesivas (R + R +), una respuesta a una señal seguida de una no respuesta a la siguiente señal (R + R−), una no -respuesta seguida de una respuesta (R − R +), y una no respuesta seguida de una no respuesta (R − R−). Tenga en cuenta que R + R + y R − R − corresponden a permanecer en los estados de respuesta y no respuesta, respectivamente; y que R + R− y R − R + corresponden a la transición de un estado a otro. La probabilidad de cada uno de estos pares de resultados se calculó dividiendo el número de veces que se produjo el par en una ventana de tiempo dada (por ejemplo, la primera hora de la sesión) por el número de veces que ocurrió el primer miembro del par (por ejemplo, P(R + R−) = N(R + R−) / n(R +); ver la sección de Métodos Análisis de datos). Tenga en cuenta que la probabilidad de realizar la transición de un estado es, por lo tanto, 1 menos la probabilidad de permanecer en un estado (por ejemplo, P(R + R−) = 1 - P(R + R +)). Así, en Figuras. 4A, C, F, H, los datos en el eje vertical de los gráficos de la izquierda muestran la probabilidad promedio (entre ratas) de mantener o hacer la transición fuera del estado de respuesta, mientras que los datos en el eje horizontal muestran la probabilidad de mantener o hacer la transición fuera del estado de no respuesta .

En la primera hora de las pruebas de comportamiento, las ratas tratadas con solución salina tendían a agrupar su respuesta: si respondían a una respuesta, la probabilidad de una respuesta a la siguiente indicación era mayor que la de una no respuesta (P(R + R +) > P(R + R−); Figura Figura4A, 4A, eje vertical); a la inversa, si no respondieron a una señal, la probabilidad de una no respuesta a la siguiente señal fue mayor que la de una respuesta (P(R − R−) > P(R − R +); Figura Figura4A, 4A, eje horizontal). El tratamiento con el agonista D1 o D2 no cambió fuertemente la probabilidad de permanecer en el estado de respuesta (R + R +) [o, equivalentemente, la probabilidad de transición al estado de no respuesta (R + R−)] en comparación con la solución salina inyecciones (figura (Figura 4A, 4A, eje vertical). Sin embargo, los animales tratados con agonistas hicieron una transición significativamente más frecuente del estado que no responde al estado de respuesta (y, de manera equivalente, permanecieron en el estado de no respuesta con menos frecuencia; Figura4A, 4A, eje horizontal).

En la segunda hora de la sesión, las ratas tratadas con solución salina mostraron una disminución marcada en la probabilidad de que pasaran del estado de no respuesta al estado de respuesta en comparación con la primera hora (Figura (Figura 4C4C vs. Figura Figura4A, 4A, eje horizontal). Además, era más probable que pasaran del estado de respuesta al estado de no respuesta en la segunda hora que en la primera (Figura (Figura 4C4C vs. Figura Figura4A, 4A, eje vertical). Por lo tanto, a medida que avanzaba la sesión, el control condiciona la disminución en la respuesta (Figuras 1B, D) se debió tanto a estados sin respuesta más largos como a estados de respuesta más cortos. El tratamiento con agonistas D1 o D2 modificó las probabilidades de respuesta en la segunda hora en ambos ejes (Figura (Figura 4C) .4C). Por lo tanto, mientras que en la primera hora los agonistas aumentaron la probabilidad de hacer la transición del estado no sensible sin afectar las transiciones del estado sensible, en la segunda hora, los agonistas aumentaron las transiciones del estado no sensible y disminuyeron las transiciones fuera del estado de respuesta, lo que significa que los agonistas aumentaron la longitud de los estados de respuesta y disminuyeron la longitud de los estados de no respuesta. En particular, estos efectos de los agonistas hicieron que las probabilidades de transición de la segunda hora se parecieran a las de la primera hora en la condición de control. Es decir, los agonistas evitaron la disminución en la respuesta en la segunda hora al evitar el cambio normal hacia las probabilidades de transición que favorecieron el estado de no respuesta.

Tanto el D1 como el antagonista de D2 cambiaron respondiendo en la primera hora a lo largo de ambos ejes, lo que indica que fomentaron las transiciones hacia el estado de no respuesta y evitaron las transiciones al estado de respuesta (Figura (Figura 4F) .4F). Curiosamente, en la segunda hora, las probabilidades de transición en el antagonista y en la solución salina fueron casi idénticas (Figura (Figura 4H), 4H), y las probabilidades de transición en animales tratados con antagonistas no fueron significativamente diferentes en la primera y la segunda hora (Figura (Figura 4F4F vs. Figura Figura 4H) .4H). Estos resultados indican que los antagonistas de D1 y D2 inducen, en la primera hora, un conjunto de probabilidades de transición que es casi idéntico al que normalmente ocurre en la segunda mitad de la sesión en condiciones de control, que corresponde a largos tramos de falta de respuesta a las señales. .

Para comparar estadísticamente estas probabilidades de transición en drogas y solución salina, resolvimos cada matriz en vectores de probabilidad; es decir, estimamos, a partir de las matrices de transición, la probabilidad de que cada rata en cada condición se encuentre en un estado de respuesta y no de respuesta en el estado estacionario de una cadena de Markov (consulte Métodos, sección Análisis de datos y Figura Figura3) .3). En figuras 4B, D, es evidente que en la condición de control (solución salina), las distribuciones de probabilidad para el estado de respuesta y no de respuesta se desplazan fuertemente hacia el estado de no respuesta en la segunda hora. En contraste, estas probabilidades son relativamente estables en ambos agonistas a lo largo de toda la sesión. En antagonista (Figuras 4G, yo), la distribución de las probabilidades de cada estado está fuertemente desplazada hacia el estado de no respuesta en ambas horas y estas probabilidades son casi idénticas a las de la segunda hora en animales tratados con solución salina. En figuras 4E, J Se restaron, para cada hora de sesión y cada medicamento, los componentes de los vectores de probabilidad que se muestran en las Figuras. 4B, D, G, I. Por lo tanto, los valores por encima y por debajo de cero indican una mayor probabilidad de estar en el estado de respuesta y no de respuesta, respectivamente. Durante la primera hora en solución salina, hubo una probabilidad casi igual de estar en los estados de respuesta y no respuesta. En la segunda hora, esta distribución de probabilidades de estado se desvió significativamente hacia el estado de no respuesta (Figura (Figura 4E, 4E, puntos negros izquierdos vs. puntos negros derechos). En la dosis alta de cualquiera de los agonistas, hubo un aumento significativo en la probabilidad de estar en el estado de respuesta en la primera hora en comparación con la solución salina (Figura (Figura 4E, 4E, puntos a la izquierda) y esto se mantuvo en la segunda hora de la sesión (Figura (Figura 4E, 4E, puntos correctos). Por lo tanto, la activación constitutiva de los receptores de dopamina es suficiente para promover y mantener el estado de respuesta en condiciones de saciedad normativa. Los antagonistas tuvieron el efecto contrario; cambiaron de manera fuerte y significativa las distribuciones de probabilidad del estado hacia el estado de no respuesta tanto en la primera como en la segunda hora de la sesión. Además, no hubo diferencias estadísticamente significativas entre las distribuciones de probabilidad del estado en antagonista y en solución salina durante la segunda hora de la sesión. Por lo tanto, el bloqueo de la activación del receptor de dopamina induce un estado no sensible con la misma eficacia que la experiencia de la tarea a lo largo del tiempo en la condición de control. Además, la activación de estos mismos receptores promueve poderosamente una transición al estado de respuesta a señales que predicen la recompensa de los alimentos incluso en ausencia de necesidad calórica.

Locomoción cued y sin codo

Es posible que los efectos agonistas resulten de mayores entradas de receptáculos no dirigidas debido a un aumento no específico en la locomoción en lugar de un aumento en las respuestas de aproximación dirigidas a receptáculos. Para comparar estas hipótesis, utilizamos datos de seguimiento de video para examinar los parámetros de movimiento posteriores a la señal en los ensayos en los que el animal respondió a la señal. No hubo diferencias estadísticamente significativas entre el control y las sesiones tratadas con agonistas en la latencia para iniciar la locomoción después del inicio de la señal (Figura (Figura 5A, 5A, barras a la izquierda) o la latencia para alcanzar el receptáculo (Figura (Figura 5A, 5A, barras de la derecha). Además, la eficacia de la trayectoria del movimiento con señales (la relación entre la longitud de una línea recta entre el animal y el receptáculo y la longitud de la trayectoria que realmente siguió el animal) no fue modificada por los tratamientos con agonistas (Figura (Figura 5B) .5B). Dado que se esperaría que los movimientos aleatorios no dirigidos que resultaran en la entrada al receptáculo fueran menos directos (y, por lo tanto, menos eficientes) y / o que ocurrieran en una latencia más prolongada, estas observaciones sugieren que los animales tratados con agonistas hicieron movimientos dirigidos hacia el receptáculo de recompensa después de Indicar el inicio de una manera similar a sus movimientos de aproximación indicados en solución salina.

A continuación, evaluamos si los aumentos inducidos por los agonistas en las entradas indicadas podrían haberse debido a un aumento no específico. Al examinar solo los ensayos con una respuesta, comparamos la tasa de entradas de receptáculos en los 5 antes del inicio de la señal con la tasa de entrada en los 5 después del inicio de la señal. Los agonistas no aumentaron significativamente la tasa promedio de entradas espontáneas o indicadas (Figura (Figura 5C) 5C) lo que sugiere que la entrada del receptáculo permanece bajo control de señal en el agonista. Juntos, los resultados en cifras. 5A – C demuestre que el aumento en la probabilidad de aproximación indicada causada por los agonistas no es atribuible a factores inespecíficos, como un aumento en la locomoción no dirigida o la tasa de entradas de receptáculos sin cables.

Locomoción durante las ITIs.

Aunque el aumento inducido por el agonista en la respuesta con señales no fue atribuible a un aumento en la locomoción no dirigida, esta conclusión no excluye la posibilidad de que los agonistas sin embargo induzcan un aumento concomitante en la locomoción no dirigida hacia el receptáculo. Para cuantificar la locomoción durante el ITI, primero preguntamos si la probabilidad de una respuesta de cue variaba en función de la longitud del ITI. Como se muestra en la Figura Figura5D, 5D, la proporción de respuesta (colapsada en señales grandes y pequeñas) fue bastante constante en todo el rango de longitudes de ITI, tanto en agonista como en solución salina. A continuación, calculamos la distancia promedio recorrida por s de la ITI para cada uno de los grupos de tratamiento y comparamos esta tasa de locomoción en los ensayos en los que las ratas respondieron y no respondieron a la indicación posterior. Curiosamente, en la condición de control (solución salina), hubo una locomoción significativamente mayor durante las ITI seguidas por un enfoque de receptáculo con señales (Figura (Figura 5E, 5E, barra negra derecha) que cuando los animales no pudieron realizar un acercamiento posterior de receptáculos con señales (Figura (Figura 5E, 5E, barra negra izquierda). Estos resultados sugieren que la locomoción sin cables se produce con mayor frecuencia cuando el animal está en el estado de respuesta.

Para determinar si este proceso implica la activación del receptor de dopamina en la NAc, evaluamos los efectos de los agonistas de la dopamina en la locomoción durante la ITI. El agonista de D1 aumentó significativamente la locomoción durante las ITI con y sin una respuesta posterior; de manera similar, el agonista D2 causó un aumento significativo (ensayos sin respuesta) o una tendencia a un aumento (ensayos de respuesta) (Figura (Figura 5E) .5E). Por lo tanto, los agonistas de la dopamina causaron un aumento general de la locomoción durante las ITI. En presencia de agonistas, esta locomoción ocurrió en niveles igualmente altos, independientemente de que el animal respondiera o no, lo que sugiere que la locomoción ITI es más sensible a la activación del receptor de dopamina que a la respuesta. En resumen, los resultados mostrados en la figura. Figura55 sugiere que, a través de un mecanismo dentro de la NAc, la activación del receptor de dopamina desvía a los animales hacia una mayor probabilidad de responder a las señales y mayores tasas de locomoción espontánea, y aunque la dopamina tiene ambos efectos, la mayor probabilidad de respuesta provocada por la dopamina no es una consecuencia espuria de mayores tasas de locomoción espontánea.

Discusión

NAc dopamina es necesaria y suficiente para un enfoque imperativo.

El enfoque provocado por el estímulo depende en gran medida de la proyección de dopamina mesolímbica del VTA al NAc solo en circunstancias muy específicas: aquellas en las que la respuesta involucra un "enfoque flexible" (Nicola, ) [también llamado "taxista" (Petrosini et al., ) o "orientación" (O'keefe y Nadel, ) Acercarse; el término "enfoque fiscal" se utilizará aquí]. El enfoque táctico se refiere a la locomoción que se dirige hacia un objeto visible desde ubicaciones de inicio que varían según las ocasiones de aproximación. Es importante destacar que el enfoque taxativo requiere que el cerebro calcule una ruta de movimiento novedosa para cada evento de aproximación [a diferencia del enfoque "práxico", "orientación" o "inflexible", que ocurre cuando las ubicaciones de inicio y finalización son constantes en todos los eventos de aproximación (O'keefe y Nadel, ; Petrosini et al. ; Nicola, )]. El presente estudio extiende la conclusión de que la dopamina NAc es necesaria para el enfoque de los taxistas de cuatro maneras. Primero, mientras que la dependencia de la aproximación del impuesto a la dopamina mesolímbica se estableció primero mediante una tarea de estímulo discriminativo (DS) que requería que el animal se acercara a un operando (palanca o nariz) para obtener la recompensa de sacarosa entregada en un receptáculo cercano (Yun et al. , ,; Ambroggi et al. ; Nicola, ), en la presente tarea, los animales simplemente tenían que acercarse al receptáculo de recompensa. Al igual que en la tarea DS, las señales se presentaron a intervalos largos y variables, lo que resultó en diversas ubicaciones de inicio en el inicio de la señal debido al movimiento del animal alrededor de la cámara durante el intervalo entre ensayos (no se muestra), condiciones bajo las cuales el comportamiento de aproximación es necesariamente taxativo. Nuestra observación de que la inyección del antagonista del receptor de dopamina D1 y D2 en el núcleo de NAc redujo la proporción de señales a las que respondió el animal es similar a las observaciones anteriores con la tarea de DS (Yun et al., ,; Ambroggi et al. ; Nicola, ). Similar a hallazgos anteriores con una tarea de retraso progresivo (Wakabayashi et al., ), nuestros resultados confirman, en una tarea mucho más sencilla, que la inclusión de una contingencia operante explícita en un lugar que difiere del sitio de entrega de recompensa no es una función de tarea crítica que hace que el comportamiento del enfoque del impuesto dependa de la dopamina NAc.

En segundo lugar, mientras que los estudios anteriores se realizaron en animales con restricción de alimentos, el presente trabajo demuestra que el enfoque fiscal se ve afectado por la inyección de antagonistas de dopamina NAc incluso en animales que reciben ad libitum acceso a chow. La dependencia del enfoque taxonómico de la dopamina mesolímbica no es, por tanto, una función del déficit de nutrientes o del estado de hambre del sujeto. De hecho, los resultados actuales apoyan el papel de la dopamina mesolímbica en la promoción de un enfoque inducido por señales de alimentos ricos en calorías incluso en ausencia de una necesidad homeostática de calorías, lo que respalda la hipótesis de que este circuito contribuye a la sobrealimentación y la obesidad (Berridge et al., ; Kenny ; Stice et al. ; Meye y Adan, ).

En tercer lugar, mientras que estudios anteriores utilizaron antagonistas de la dopamina para demostrar que la dcamina NAc es necesaria para un enfoque taxista, en el presente trabajo demostramos que el aumento de la activación del receptor de dopamina NAc D1 o D2 por inyección de agonistas de estos receptores es suficiente para aumentar la probabilidad de que cue provocará enfoque taxico. Este experimento no fue posible en la mayoría de los estudios previos porque las ratas con restricción de alimentos responden a cerca del 100% de las señales que predicen de manera confiable los nutrientes, imponiendo un límite máximo a los posibles efectos agonistas. Sin embargo, cuando la predicción de la sacarosa se hizo menos confiable en una tarea de "estímulo probabilístico" (PS) en la que el PS predijo la recompensa de sacarosa del 10 solo en el 15% de los ensayos, la probabilidad de respuesta fue menor y el bloqueo farmacológico de la recaptación de dopamina aumentó esta probabilidad (Nicola et al., ). En el presente estudio, las ratas fueron alimentadas con chow. ad libitum y la recompensa por responder fue 3% en lugar de 10% sacarosa. Bajo estas condiciones, a pesar de que las señales predijeron de manera confiable la recompensa, los animales respondieron a una fracción más pequeña de las condiciones que en condiciones de sucrosa 10% con restricción de alimentos, eliminando el efecto de techo y permitiéndonos evaluar los efectos de los agonistas en el enfoque de los taxis. De acuerdo con los resultados de la tarea de PS, la inyección de agonista de dopamina en el núcleo de NAc produjo un aumento robusto en la respuesta de respuesta. Los resultados actuales establecen, por lo tanto, que la activación del receptor de dopamina central de NAc es necesaria y suficiente para promover un enfoque de carácter fiscal, lo que apoya nuestra conclusión previa de que la dopamina mesolímbica es parte del mecanismo causal para el inicio del enfoque de taxis (du Hoffmann y Nicola, ).

En cuarto lugar, nuestra observación de que los agonistas D1 y D2 tienen efectos muy similares que son opuestos a los efectos de los antagonistas D1 y D2 tiene implicaciones importantes para las conclusiones sobre la especificidad de los efectos de los fármacos. En la mayoría de los estudios anteriores, los antagonistas D1 y D2 microinyectados tenían un comportamiento muy similar (Hiroi y White, ; Ozer et al. ; Koch et al. ; Yun et al. ; Eiler et al. ; Pezze et al. ; Lex y Hauber, ; Liao, ; Nicola, ; Shin et al. ; Haghparast et al. ; Steinberg et al. ) y electrofisiológicos (du Hoffmann y Nicola, ) efectos. Debido a que la concentración de antagonistas inyectados requerida para observar los efectos es mucho mayor que las constantes de unión de estos fármacos para sus receptores objetivo, la similitud de los efectos antagonistas de D1 y D2 cuestiona su especificidad: es posible que los fármacos se unan al mismo receptor de dopamina, o para una tercera clase de receptores que no es un receptor de dopamina en absoluto. En el primer caso, la activación de uno de los receptores no debería producir ningún efecto de comportamiento; en este último caso, la activación de ninguno de los receptores debería producir un efecto de comportamiento. Sin embargo, encontramos que los agonistas D1 y D2 producen efectos de comportamiento, y que sus efectos son idénticos entre sí y exactamente opuestos a los de los antagonistas. Sería notable si todos los medicamentos 4 actuaran en el mismo receptor fuera del objetivo. Por lo tanto, el escenario más probable es que todas las drogas actúen específicamente en sus receptores objetivo.

Los efectos de los agonistas de la dopamina no se deben a un aumento generalizado de la locomoción.

Una posible complicación con la interpretación de que los agonistas de la dopamina promovieron la respuesta a la señal es que el efecto podría deberse a un aumento generalizado de la locomoción, lo que resultó en entradas de receptáculos espurios que habrían ocurrido si se hubiera presentado o no una señal. De hecho, en la condición de control, los datos de seguimiento de video obtenidos durante la sesión revelaron que la tasa de locomoción durante el intervalo interial se correlacionó en una base de prueba por prueba con la probabilidad de entrada del receptáculo durante la siguiente presentación de referencia. Además, los agonistas aumentaron tanto la locomoción durante los intervalos entre ensayos como la probabilidad de respuesta de respuesta. Una forma de descartar un efecto motor generalizado es usar un estímulo predictivo sin recompensa (NS) para demostrar que los agonistas no aumentan la respuesta a la presentación de NS. No incluimos un NS en nuestro diseño. Nuestra hipótesis es que si lo hubiéramos hecho, habríamos observado un aumento en la locomoción durante el NS (como ocurrió durante el intervalo intertrial) pero no un aumento en las entradas de receptáculos. Esta hipótesis se basa en varias observaciones que indican que la mayor probabilidad de entrada después de la presentación de la señal no fue el resultado de un aumento de la locomoción generalizada. Primero, el aumento en la locomoción durante el intervalo entre ensayos causado por los agonistas se desacopló del aumento en la respuesta de respuesta, que se produce incluso durante los intervalos que fueron seguidos por una falta de respuesta a la respuesta (Figura (Figura 5E) .5E). En segundo lugar, los agonistas no aumentaron la probabilidad de una entrada de receptáculo sin cables durante el ITI. (Figura 5C) .5C). Finalmente, en comparación con las entradas dirigidas, se esperaría que las entradas resultantes de un aumento generalizado de la locomoción se produjeran en una latencia más prolongada después del inicio de la señal, y se esperaría que el animal siguiera un camino más tortuoso desde su ubicación al inicio de la señal hasta el receptáculo; sin embargo, los agonistas no aumentaron las latencias de entrada de señal (Figura (Figura 5A) 5A) ni disminuyó la eficiencia de la trayectoria de movimiento (Figura (Figura 5B) .5B). En conjunto, estos resultados indican que el aumento en las entradas de receptáculos con señales causadas por los agonistas no se debe al aumento concomitante de la locomoción. Una explicación más probable es que algunos eventos locomotores espontáneos fueron acercamientos taxonómicos hacia objetos dentro de la cámara, y los agonistas aumentaron la probabilidad de tales acercamientos, al igual que aumentaron las probabilidades de aproximación taxonómica en respuesta a nuestras señales presentadas explícitamente.

Falta de una diferencia pronunciada en la respuesta a las señales que predicen recompensas grandes y pequeñas

Otra diferencia entre la tarea actual y nuestros estudios anteriores que utilizan tareas de DS y PS es que presentamos dos claves de predicción de recompensa, que predijeron volúmenes grandes y pequeños de sacarosa, en lugar de una señal de recompensa predictiva y un estímulo no predictivo de recompensa ( NS). Incluimos dos señales predictivas de recompensa en el diseño de la tarea para evaluar si las manipulaciones de los receptores de dopamina NAc influyen diferencialmente en el comportamiento desencadenado por señales predictivas de diferentes magnitudes de recompensa. Sin embargo, no pudimos llevar a cabo un análisis de este tipo porque los animales no diferenciaron fuertemente entre las dos señales. Cuando la recompensa fue 10% de sacarosa, no hubo diferencias significativas en la proporción de respuesta entre las señales predictivas de recompensa grande y pequeña; y cuando la recompensa fue 3% de sacarosa, se observó una pequeña diferencia (~ 20%) solo en la primera hora de la sesión (Figura (Figura 1) .1). Estas observaciones contrastan con el comportamiento típico en la tarea de SD utilizando exactamente los mismos estímulos auditivos, en los que los animales responden a> 80% de las presentaciones de SD y <10% de las presentaciones de NS (Nicola, ). Más recientemente, encontramos que en una tarea similar a la actual, usando los mismos dos estímulos auditivos pero con una señal predictiva de recompensa supeditada a la entrada del receptáculo y una NS, la respuesta a la NS fue bastante alta (> 20%; no se muestra ). Esta alta respuesta (en comparación con la baja tasa de respuesta NS en tareas de DS con un requisito operante explícito) probablemente se deba a cierto grado de generalización entre las señales predictivas y no predictivas, así como a la falta de una contingencia de respuesta operante. La ausencia de tal contingencia significa que responder a las señales es menos difícil y requiere menos esfuerzo que responder a las señales en la tarea de DS, lo que potencialmente explica la diferencia en la probabilidad de respuesta de NS. Si son comunes las proporciones de respuesta> 20% para un NS, entonces deberían ser aún mayores cuando la señal predice una pequeña cantidad de recompensa, precisamente como se observó en el presente estudio.

La disminución en la respuesta a lo largo del tiempo puede ser un efecto similar a la extinción

Un rasgo notable del comportamiento observado en nuestra ad libitum los animales alimentados con chow fueron una disminución en la probabilidad de respuesta de referencia en la sesión de 2 h, que fue mucho más pronunciada cuando la recompensa fue 3% de sacarosa que cuando fue 10% de sacarosa. Las ratas a las que se les dio acceso gratuito a la sacarosa muestran una disminución similar en la tasa de lick desde el comienzo de la sesión, lo cual es atribuible a la saciedad: los mecanismos de detección de nutrientes post-ingestivos envían señales al cerebro, lo que resulta en un consumo reducido (Smith, ). Sin embargo, es poco probable que la saciedad sea responsable de la disminución en la respuesta de respuesta observada aquí porque la mayor ingesta de nutrientes cuando 10% de sacarosa fue la recompensa que se espera que produzca una disminución más rápida en la respuesta que cuando se entregó 3% de sacarosa, pero ocurrió lo contrario. (Figura (Figura 1) .1). Otra posible explicación es que la disminución es un efecto similar a la extinción que se debe a la entrega de refuerzos que son de una magnitud insuficiente para seguir respondiendo a las señales en los ensayos posteriores. Aunque no tenemos evidencia directa de que este sea el caso, el simple hecho de dejar de suministrar sacarosa también produce una disminución en la respuesta (no se muestra). Si bien este verdadero efecto de extinción es más rápido que el observado aquí, se esperaría el curso más lento de la extinción en el presente caso porque se entregó una pequeña cantidad de sacarosa. Además, cuando se administró una mayor concentración de sacarosa (10%), casi no se observó disminución, lo que concuerda con la idea de que los reforzadores de 3% de sacarosa fueron de magnitud insuficiente para mantener la respuesta.

El hecho de que 3% de sacarosa sea menos reforzante que 10% no es sorprendente, dado que no solo 3% de sacarosa es menos preferido sobre el agua que 10% (Sclafani, ), pero también que es probable que 10% sacarosa active con mayor fuerza los procesos post-ingestivos que detectan la ingesta de nutrientes, lo que puede contribuir al refuerzo incluso en ausencia de sabor (de Araujo et al., ; Sclafani y Ackroff, ; Sclafani, ; de araujo ). Estos procesos promueven la señalización de la dopamina y, de hecho, parecen ser responsables de la capacidad de los reforzadores nutritivos de sacarosa para mantener el rendimiento de la tarea de relación progresiva en un grado mucho mayor que los refuerzos dulces no nutritivos (Beeler et al., ). De hecho, las señales predictivas de sacarosa provocan más liberación de dopamina en la NAc que las señales predictivas de edulcorante no nutritivo (McCutcheon et al., ) y, bajo ciertas condiciones, la sacarosa en sí produce más liberación de dopamina que la edulcorante (Beeler et al., ). Estos resultados sugieren que una señal de dopamina atenuada durante las sesiones de 3% de sacarosa (vs. 10%) podría ser responsable de la disminución similar a la extinción en la respuesta cuando se usó la concentración de sacarosa más baja.

De acuerdo con esta hipótesis, la activación y la inhibición de los receptores de dopamina interactúan con el efecto similar a la extinción. La inyección del agonista del receptor de dopamina D1 o D2 aumentó la tasa de respuesta inicial (la primera hora) y redujo en gran medida la magnitud de la disminución normal en la respuesta de la primera a la segunda hora en comparación con la condición de control (Figuras 1D, E), esencialmente impidiendo el efecto de extinción. En contraste, la inyección de antagonistas D1 o D2 redujo la tasa de respuesta en la primera hora de la sesión a valores indistinguibles de los observados normalmente en la segunda hora, esencialmente imitando y / o acelerando la extinción. Una posibilidad es que la dopamina central de NAc sea parte del mecanismo de refuerzo que previene la extinción. Esta idea es consistente con el papel propuesto para la dopamina como una señal de error de predicción de recompensa, que se cree que es la base de los cambios aprendidos en la representación neural del valor predicho por los estímulos (Montague et al., ; Schultz et al. ; Schultz, ). También es consistente con un papel para la dopamina en el "reinicio" de tales representaciones de valor (Berridge, ). Por otro lado, se esperaría que los agonistas de la dopamina activen constitutivamente los receptores de dopamina, imitando así la llamada dopamina "tónica"; aunque los agonistas activarían los receptores de dopamina en el momento en que se entrega la recompensa, también activarán los receptores en un grado similar en todos los demás momentos. Es difícil conceptualizar cómo una señal constante de este tipo podría interpretarse como un error de predicción o como una señal de "reinicio" que sirve para indicar que se ha producido un evento de refuerzo discreto.

Una hipótesis alternativa es que las drogas de dopamina no interfirieron con el refuerzo, sino con un mecanismo neuronal que activa directamente el comportamiento de aproximación con señales. Esta propuesta está respaldada por nuestros estudios previos que demuestran que una gran proporción (casi la mitad) de las neuronas NAc están excitadas por señales en una tarea de DS (Ambroggi et al., ; McGinty et al. ; du Hoffmann y Nicola, ; Morrison y Nicola, ); además, en una tarea de aproximación de receptáculo con señales similar a la que se usa aquí (es decir, sin una contingencia de respuesta operante), se excita una proporción similar de neuronas NAc (Caref y Nicola, ). Utilizando el seguimiento de video, establecimos que estas excitaciones preceden el inicio de la locomoción de aproximación y predicen la latencia en la que ocurrirá (McGinty et al., ; du Hoffmann y Nicola, ; Morrison y Nicola, ). Por otra parte, la inyección de antagonistas de la dopamina en la NAc redujo la magnitud de estas excitaciones al mismo tiempo que afectó la capacidad de iniciar el acercamiento con señales (du Hoffmann y Nicola, ). Estos resultados sugieren que la dopamina facilita directamente las excitaciones evocadas por señales de las neuronas NAc que impulsan el enfoque, tal vez haciéndolas más excitables en respuesta a la entrada glutamatérgica (Nicola et al., , ; Hopf et al. ). Por lo tanto, el tratamiento de las neuronas NAc con agonistas del receptor de dopamina puede haber incrementado la probabilidad de un comportamiento de aproximación orientado al imitar un efecto neuromodulador excitador de la dopamina endógena y, por lo tanto, aumentar la magnitud de las excitaciones evocadas por el indicio.

El patrón de respuesta agrupado puede deberse a fluctuaciones en los niveles tónicos de dopamina

Otra característica del desempeño de las tareas de los animales es que las respuestas y no respuestas a las señales no se distribuyeron al azar, sino que parecían agruparse en ráfagas de varias respuestas consecutivas o no respuestas. En las condiciones de control (inyección de vehículo o sin inyección), los grupos de respuesta fueron más largos y más frecuentes hacia el comienzo de la sesión, volviéndose más cortos y menos frecuentes hacia el final de la sesión; y necesariamente viceversa para los grupos de no respuesta. Este patrón sugiere que hay dos estados, receptivo y no receptivo (Figura (Figura 3), 3), que fluctúan con el transcurso del tiempo de minutos, y que cambian de un sesgo inicial hacia el estado de respuesta a un sesgo posterior hacia el estado de no respuesta. La inyección de agonistas de la dopamina promovió el estado de respuesta al disminuir la probabilidad de transición al estado de no respuesta (grupos de respuesta de alargamiento) y al aumentar la probabilidad de hacer la transición al estado de respuesta (grupos de no respuesta de acortamiento), mientras que los antagonistas tuvieron el efecto contrario. Las consecuencias más notables de los efectos agonistas ocurrieron en la segunda hora de la sesión, cuando los medicamentos parecen haber evitado el sesgo mayor normal hacia el estado de no respuesta: las probabilidades de transición de la segunda hora siguieron pareciéndose a las de la primera hora en lugar de cambiando hacia favorecer el estado de no respuesta. En contraste, los antagonistas tuvieron sus mayores efectos en la primera hora, cuando causaron que las probabilidades de transición favorecieran el estado de falta de respuesta, similar a las probabilidades de transición que normalmente ocurren en la segunda hora.

Los efectos de los agonistas y antagonistas de la dopamina en las probabilidades de transición son consistentes con la hipótesis de que el estado de respuesta es una función de la ocupación del receptor de dopamina. Por lo tanto, cuando los niveles de dopamina NAc alcanzan y exceden un umbral, el animal está en el estado de respuesta; por debajo de este umbral, el animal se encuentra en el estado de no respuesta. Probar esta hipótesis requeriría medir los niveles tónicos de dopamina cuando los animales realizan esta o una tarea similar; la hipótesis predice que los niveles de dopamina deberían ser más altos durante los grupos de respuesta que los grupos de no respuesta. Aunque, según nuestro conocimiento, los estudios de microdiálisis anteriores no han examinado si las fluctuaciones en el nivel de dopamina se correlacionan con la probabilidad del enfoque del impuesto local, una investigación previa encontró que los niveles de dopamina NAc eran mayores cuando los gránulos de alimentos se depositaban en recipientes en los intervalos mínimos de 45 o 4 (ambas condiciones probablemente requiriendo un enfoque fiscal para obtener el alimento en cada ensayo) que cuando la comida estaba disponible libremente (una situación que minimiza la necesidad de un enfoque fiscal) (McCullough y Salamone, ). Los estudios que han variado los requisitos de la tasa de respuesta operante han producido resultados un tanto contradictorios, con algunos observando una correlación positiva entre la tasa de respuesta operante y el nivel de dopamina (McCullough et al., ; Sokolowski et al. ; Cousins ​​et al. ) y otros que encuentran excepciones a esta relación propuesta (Salamone et al., ; Primos y Salamone, ; Ahn y Phillips, ; Ostlund et al. ). Una posible explicación de esta discordancia es que las diferentes tareas operantes implican la necesidad de un enfoque fiscal en diferentes grados (Nicola, ); las correlaciones con el nivel de dopamina pueden ser más sólidas para la probabilidad del enfoque del impuesto que para la tasa de respuesta operante

Una propuesta relacionada es que los niveles tónicos de dopamina no solo conducen a tasas de respuesta más rápidas (o quizás una mayor probabilidad de enfoque impositivo), sino también que los niveles de dopamina están establecidos por la tasa de refuerzo (Niv et al., , ), una idea que recientemente ha ganado apoyo experimental (Hamid et al., ). En consecuencia, los niveles de dopamina en animales que trabajan para reforzadores nutritivos deben ser más bajos en ad libitum- alimentado que en animales hambrientos [como en realidad es el caso (Ostlund et al., )], y más bajo cuando el reforzador es 3% de sacarosa que cuando es un volumen equivalente de 10% de sacarosa. Los bajos niveles de dopamina propuestos en 3% de sacarosa podrían resultar en una reacción en cadena, y la baja dopamina daría como resultado una baja probabilidad de responder a cualquier indicio dado; las fallas en responder a su vez hacen que la tasa de refuerzo y por lo tanto el nivel de dopamina sea aún más bajo, y por lo tanto, la probabilidad de respuesta en la siguiente presentación de referencia también se vuelve más baja. El resultado sería una reducción progresiva en la tasa de respuesta similar a la observada aquí.

Conclusiones: el enfoque de tratamiento cuedido es un modelo para la investigación de la regulación de la dopamina mesolímbica por estado nutricional

La baja probabilidad de respuesta dependiente de la dopamina en ad libitumLos animales alimentados observados aquí son consistentes con muchos estudios recientes sobre la regulación de las neuronas de dopamina por mensajeros, como colecistoquinina, orexina, grelina, leptina, insulina y péptido 1 similar al glucagón, que señalan el estado de nutrientes del cuerpo detectado a través de varios mecanismos. En general, las señales que informan un déficit de nutrientes aumentan la actividad neuronal de la dopamina, mientras que las señales que informan de saciedad o exceso de nutrientes la disminuyen (Ladurelle et al., ; Helm et al. ; Krügel et al. ; Abizaid et al. ; Fulton et al. ; Hommel et al. ; Narita et al. ; Kawahara y otros, ; Leinninger et al. ; Quarta et al. , ; Jerlhag et al. ; Perry et al. ; Domingos et al. ; España et al. ; Skibicka et al. , ,, ; Davis et al. ,; Mebel et al. ; Patyal et al. ; Egecioglu et al. ; Cone et al. , ; Mietlicki-Baase y otros, ). La exquisita sensibilidad de la señalización de la dopamina mesolímbica al estado nutricional es consistente con la propuesta de que la probabilidad de que la conducta dependiente de la dopamina mesolímbica pueda cambiar instantáneamente como resultado del valor, relativo al estado nutricional, del reforzador (Berridge, ). Observamos que los reforzadores de bajo valor entregados a animales relativamente saciados dan como resultado probabilidades de respuesta fluctuantes superpuestas a una disminución general en la probabilidad de respuesta. Estas observaciones, junto con los cambios dramáticos en la respuesta y las probabilidades de transición producidas por la inyección de agonistas y antagonistas de dopamina en la NAc, sugieren que, en nuestras condiciones, el nivel de dopamina se mantiene en niveles bajos mediante mecanismos de detección de nutrientes. El control de los niveles de dopamina mediante estos y otros parámetros (como la tasa de reforzamiento reciente) puede producir niveles de dopamina que fluctúan alrededor del umbral para provocar una respuesta, lo que provoca que se produzcan respuestas clave y no respuestas en grupos. El paradigma de comportamiento que utilizamos aquí: el enfoque de taxis con claves impulsadas por la sacarosa dependiente de la dopamina mesolímbica en ad libitumAnimales alimentados: por lo tanto, es ideal para una investigación adicional de la regulación de la dinámica de la dopamina por el estado de los nutrientes, la tasa de refuerzo y otros parámetros, y del mecanismo por el cual estas variables impactan el comportamiento dependiente de la dopamina.

Contribuciones de autor

JD diseñó y realizó el experimento, analizó los datos y coescribió el documento. SN asesoró a JD en el diseño y análisis y coescribió el documento.

Declaracion de conflicto de interes

Los autores declaran que la investigación se llevó a cabo en ausencia de cualquier relación comercial o financiera que pudiera interpretarse como un posible conflicto de intereses.

AGRADECIMIENTOS

Este trabajo fue apoyado por subvenciones del NIH (DA019473, DA038412, DA041725), la Fundación de la Familia Klarman y NARSAD a SN.

Referencias

  1. Abizaid A., Liu ZW, Andrews ZB, Shanabrough M., Borok E., Elsworth JD, y otros. . (2006). Ghrelin modula la actividad y la organización de entrada sináptica de las neuronas de dopamina del cerebro medio mientras promueve el apetito. J. Clin. Invertir. 116, 3229 – 3239. 10.1172 / JCI29867 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  2. Ahn S., Phillips AG (2007). Salida de dopamina en el núcleo accumbens durante la extinción dentro de la sesión, respuesta dependiente del resultado y respuesta basada en el hábito para la recompensa de alimentos. Psicofarmacología (Berl.) 191, 641 – 651. 10.1007 / s00213-006-0526-9 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  3. Ambroggi F., Ishikawa A., Fields HL, Nicola SM (2008). Las neuronas basolaterales de la amígdala facilitan el comportamiento de búsqueda de recompensa al estimular las neuronas del núcleo accumbens. Neuron 59, 648 – 661. 10.1016 / j.neuron.2008.07.004 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  4. Beeler JA, Mccutcheon JE, Cao ZF, Murakami M., Alexander E., Roitman MF, y otros. . (2012). El sabor desacoplado de la nutrición no mantiene las propiedades de refuerzo de los alimentos. EUR. J. Neurosci. 36, 2533 – 2546. 10.1111 / j.1460-9568.2012.08167.x [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  5. Berridge KC (2012). Del error de predicción a la importancia del incentivo: cálculo mesolímbico de la motivación de recompensa. EUR. J. Neurosci. 35, 1124 – 1143. 10.1111 / j.1460-9568.2012.07990.x [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  6. Berridge KC, Ho CY, Richard JM, Difeliceantonio AG (2010). El cerebro tentado come: circuitos de placer y deseo en la obesidad y trastornos de la alimentación. Brain Res. 1350, 43 – 64. 10.1016 / j.brainres.2010.04.003 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  7. Boulos R., Vikre EK, Oppenheimer S., Chang H., Kanarek RB (2012). ObesiTV: cómo la televisión está influyendo en la epidemia de obesidad. Fisiol. Behav. 107, 146 – 153. 10.1016 / j.physbeh.2012.05.022 [PubMed] [Cross Ref.]
  8. Boyland EJ, Halford JC (2013). Publicidad televisiva y branding. Efectos sobre el comportamiento alimentario y preferencias alimentarias en niños. Appetite 62, 236 – 241. 10.1016 / j.appet.2012.01.032 [PubMed] [Cross Ref.]
  9. Sucursal SY, Goertz RB, Sharpe AL, Pierce J., Roy S., Ko D., y otros. . (2013). La restricción de alimentos aumenta la activación por estallido de las neuronas de dopamina mediada por el receptor de glutamato J. Neurosci. 33, 13861 – 13872. 10.1523 / JNEUROSCI.5099-12.2013 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  10. Caref K., Nicola SM (2014). Los opioides de Nucleus accumbens conducen al enfoque condicionado de la recompensa alta en calorías solo en ausencia de un impulso homeostático, en la Reunión Anual de la Sociedad de Neurociencia (Washington, DC:).
  11. Cono JJ, Mccutcheon JE, Roitman MF (2014). La grelina actúa como una interfaz entre el estado fisiológico y la señalización de dopamina fásica. J. Neurosci. 34, 4905 – 4913. 10.1523 / JNEUROSCI.4404-13.2014 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  12. Cono JJ, Roitman JD, Roitman MF (2015). La grelina regula la dopamina fásica y el núcleo accumbens, señalización evocada por estímulos predictivos de alimentos. J. Neurochem. 133, 844 – 856. 10.1111 / jnc.13080 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  13. Primos MS, Salamone JD (1996). Participación de la dopamina del estriado ventrolateral en el inicio y la ejecución del movimiento: una microdiálisis y una investigación del comportamiento. Neurociencia 70, 849 – 859. 10.1016 / 0306-4522 (95) 00407-6 [PubMed] [Cross Ref.]
  14. Primos MS, Trevitt J., Atherton A., Salamone JD (1999). Diferentes funciones conductuales de la dopamina en el núcleo accumbens y el estriado ventrolateral: una microdiálisis y una investigación del comportamiento. Neurociencia 91, 925 – 934. 10.1016 / S0306-4522 (98) 00617-4 [PubMed] [Cross Ref.]
  15. Davis JF, Choi DL, Schurdak JD, Fitzgerald MF, Clegg DJ, Lipton JW, y otros. . (2011a). La leptina regula el equilibrio energético y la motivación a través de la acción en distintos circuitos neuronales. Biol. Psiquiatría 69, 668 – 674. 10.1016 / j.biopsych.2010.08.028 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  16. Davis JF, Choi DL, Shurdak JD, Krause EG, Fitzgerald MF, Lipton JW, y otros. . (2011b). Las melanocortinas centrales modulan la actividad mesocorticolímbica y el comportamiento de búsqueda de alimento en la rata. Fisiol. Behav. 102, 491 – 495. 10.1016 / j.physbeh.2010.12.017 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  17. De Araujo IE (2016). Circuito de organización del refuerzo del azúcar. Fisiol. Behav. [Epub antes de imprimir]. 10.1016 / j.physbeh.2016.04.041 [PubMed] [Cross Ref.]
  18. de Araujo IE, Ferreira JG, Tellez LA, Ren X., Yeckel CW (2012). El eje de la dopamina intestino-cerebro: un sistema regulador para la ingesta calórica. Fisiol. Behav. 106, 394 – 399. 10.1016 / j.physbeh.2012.02.026 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  19. Domingos AI, Vaynshteyn J., Voss HU, Ren X., Gradinaru V., Zang F., et al. . (2011). La leptina regula el valor de recompensa del nutriente. Nat. Neurosci. 14, 1562 – 1568. 10.1038 / nn.2977 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  20. du Hoffmann J., Kim JJ, Nicola SM (2011). Un conjunto de microelectrodos canulados de bajo costo manejable para el registro simultáneo de unidades y la infusión de medicamentos en el mismo núcleo cerebral de ratas que se comportan. J. Neurofisiol. 106, 1054 – 1064. 10.1152 / jn.00349.2011 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  21. du Hoffmann J., Nicola SM (2014). La dopamina estimula la búsqueda de recompensas al promover la excitación evocada en el núcleo accumbens. J. Neurosci. 34, 14349 – 14364. 10.1523 / JNEUROSCI.3492-14.2014 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  22. Egecioglu E., Engel JA, Jerlhag E. (2013). El péptido similar al glucagón 1 análogo Exendin-4 atenúa la estimulación locomotora inducida por nicotina, la liberación de dopamina accumbal, la preferencia de lugar condicionado, así como la expresión de la sensibilización locomotora en ratones. PLoS ONE 8: e77284. 10.1371 / journal.pone.0077284 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  23. Eiler WJ II, Masters, J., Mckay PF, Hardy L., III, Goergen J., Mensah-Zoe B., et al. . (2006). La anfetamina reduce el umbral de recompensa de estimulación cerebral (BSR) en ratas que prefieren el alcohol (P) y no preferente (NP): regulación por D-sub-1 y D-sub-2 receptores en el núcleo accumbens. Exp. Clinica Psychopharmacol. 14, 361 – 376. 10.1037 / 1064-1297.14.3.361 [PubMed] [Cross Ref.]
  24. España RA, Melchior JR, Roberts DC, Jones SR (2011). La hipocretina 1 / orexina A en el área tegmental ventral mejora las respuestas de la dopamina a la cocaína y promueve la autoadministración de la cocaína. Psicofarmacología (Berl.) 214, 415 – 426. 10.1007 / s00213-010-2048-8 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  25. Fulton S., Pissios P., Manchon RP, Stiles L., Frank L., Pothos EN, et al. . (2006). Regulación de la leptina de la vía de la dopamina mesoaccumbens. Neuron 51, 811 – 822. 10.1016 / j.neuron.2006.09.006 [PubMed] [Cross Ref.]
  26. Haghparast A., Ghalandari-Shamami M., Hassanpour-Ezatti M. (2012). El bloqueo de los receptores de dopamina D1 / D2 dentro del núcleo accumbens atenuó el efecto antinociceptivo del agonista del receptor de cannabinoides en la amígdala basolateral. Brain Res. 1471, 23 – 32. 10.1016 / j.brainres.2012.06.023 [PubMed] [Cross Ref.]
  27. Hamid AA, Pettibone JR, Mabrouk OS, Hetrick VL, Schmidt R., Vander Weele CM, et al. . (2016). La dopamina mesolímbica señala el valor del trabajo. Nat. Neurosci. 19, 117 – 126. 10.1038 / nn.4173 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  28. Yelmo KA, Rada P., Hoebel BG (2003). La colecistocinina combinada con serotonina en el hipotálamo limita la liberación de dopamina de los accumbens al tiempo que aumenta la acetilcolina: un posible mecanismo de saciedad. Brain Res. 963, 290 – 297. 10.1016 / S0006-8993 (02) 04051-9 [PubMed] [Cross Ref.]
  29. Hiroi N., White NM (1991). La preferencia de lugar condicionada por la anfetamina: afectación diferencial de los subtipos de receptores de dopamina y dos áreas terminales dopaminérgicas. Brain Res. 552, 141 – 152. 10.1016 / 0006-8993 (91) 90672-I [PubMed] [Cross Ref.]
  30. Hommel JD, Trinko R., Sears RM, Georgescu D., Liu ZW, Gao XB, et al. . (2006). La señalización del receptor de leptina en las neuronas de la dopamina del cerebro medio regula la alimentación. Neuron 51, 801 – 810. 10.1016 / j.neuron.2006.08.023 [PubMed] [Cross Ref.]
  31. Hopf FW, Cascini MG, Gordon AS, Diamante I., Bonci A. (2003). La activación cooperativa de los receptores D1 y D2 de la dopamina aumenta la activación de picos de las neuronas del núcleo accumbens a través de las subunidades β de la proteína G. J. Neurosci. 23, 5079 – 5087. Disponible en línea en: http://www.jneurosci.org/content/23/12/5079.long [PubMed]
  32. Jerlhag E., Egecioglu E., Dickson SL, Engel JA (2010). El antagonismo de los receptores de ghrelina atenúa la estimulación locomotora inducida por cocaína y anfetamina, la liberación de dopamina accumbal y la preferencia de lugar condicionado. Psicofarmacología (Berl.) 211, 415 – 422. 10.1007 / s00213-010-1907-7 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  33. Kawahara Y., Kawahara H., Kaneko F., Yamada M., Nishi Y., Tanaka E., et al. . (2009). La grelina administrada periféricamente induce efectos bimodales en el sistema de dopamina mesolímbico en función de los estados de consumo de alimentos. Neurociencia 161, 855 – 864. 10.1016 / j.neuroscience.2009.03.086 [PubMed] [Cross Ref.]
  34. Kenny PJ (2011). Mecanismos de recompensa en la obesidad: nuevas perspectivas y orientaciones futuras. Neuron 69, 664 – 679. 10.1016 / j.neuron.2011.02.016 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  35. Koch M., Schmid A., Schnitzler HU (2000). Papel de los músculos accumbens Receptores de dopamina D1 y D2 en paradigmas instrumentales y pavlovianos de recompensa condicionada. Psicofarmacología (Berl.) 152, 67 – 73. 10.1007 / s002130000505 [PubMed] [Cross Ref.]
  36. Krügel U., Schraft T., Kittner H., Kiess W., Illes P. (2003). La liberación de dopamina basal y provocada por la alimentación en el núcleo de rata accumbens está deprimida por la leptina. EUR. J. Pharmacol. 482, 185 – 187. 10.1016 / j.ejphar.2003.09.047 [PubMed] [Cross Ref.]
  37. Ladurelle N., Keller G., Blommaert A., Roques BP, Daugé V. (1997). El agonista de CCK-B, BC264, aumenta la dopamina en el núcleo accumbens y facilita la motivación y la atención después de la inyección intraperitoneal en ratas. EUR. J. Neurosci. 9, 1804 – 1814. 10.1111 / j.1460-9568.1997.tb00747.x [PubMed] [Cross Ref.]
  38. Lardeux S., Kim JJ, Nicola SM (2015). El consumo compulsivo de acceso intermitente de un líquido dulce con alto contenido de grasa no requiere receptores de opioides o dopamina en el núcleo accumbens. Behav. Brain Res. 292, 194 – 208. 10.1016 / j.bbr.2015.06.015 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  39. Leinninger GM, Jo YH, Leshan RL, Louis GW, Yang H., Barrera JG, et al. . (2009). La leptina actúa a través de las neuronas hipotalámicas laterales que expresan el receptor de leptina para modular el sistema de dopamina mesolímbica y suprimir la alimentación. Metab Célula. 10, 89 – 98. 10.1016 / j.cmet.2009.06.011 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  40. Lex A., Hauber W. (2008). Los receptores de dopamina D1 y D2 en el núcleo accumbens del núcleo y la cáscara median la transferencia pavloviana-instrumental. Aprender. Mem. 15, 483 – 491. 10.1101 / lm.978708 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  41. Liao RM (2008). El desarrollo de la preferencia de lugar condicionada inducida por la infusión intra-accumbens de anfetamina se atenúa mediante la co-infusión de antagonistas de los receptores de dopamina D1 y D2. Pharmacol. Biochem. Behav. 89, 367 – 373. 10.1016 / j.pbb.2008.01.009 [PubMed] [Cross Ref.]
  42. McCullough LD, Cousins ​​MS, Salamone JD (1993). El papel de la dopamina del núcleo accumbens en la respuesta en un programa operante de refuerzo continuo: un estudio neuroquímico y conductual. Pharmacol. Biochem. Behav. 46, 581 – 586. 10.1016 / 0091-3057 (93) 90547-7 [PubMed] [Cross Ref.]
  43. McCullough LD, Salamone JD (1992). Participación del núcleo accumbens dopamina en la actividad motora inducida por la presentación periódica de alimentos: un estudio de microdiálisis y comportamiento. Brain Res. 592, 29 – 36. 10.1016 / 0006-8993 (92) 91654-W [PubMed] [Cross Ref.]
  44. McCutcheon JE, Beeler JA, Roitman MF (2012). Las señales predictivas de sacarosa evocan una mayor liberación fásica de dopamina que las señales predictivas de sacarina. Synapse 66, 346 – 351. 10.1002 / syn.21519 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  45. McGinty VB, Lardeux S., Taha SA, Kim JJ, Nicola SM (2013). Fortalecimiento de la búsqueda de recompensas por cue y codificación de proximidad en el núcleo accumbens. Neuron 78, 910 – 922. 10.1016 / j.neuron.2013.04.010 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  46. Mebel DM, Wong JC, Dong YJ, Borgland SL (2012). La insulina en el área tegmental ventral reduce la alimentación hedónica y suprime la concentración de dopamina mediante un aumento de la recaptación. EUR. J. Neurosci. 36, 2336 – 2346. 10.1111 / j.1460-9568.2012.08168.x [PubMed] [Cross Ref.]
  47. Meye FJ, Adan RA (2014). Sentimientos sobre la comida: el área ventral tegmental en la recompensa de alimentos y comer emocional. Trends Pharmacol. Sci. 35, 31 – 40. 10.1016 / j.tips.2013.11.003 [PubMed] [Cross Ref.]
  48. Mietlicki-Baase EG, Reiner DJ, Cone JJ, Olivos DR, Mcgrath LE, Zimmer DJ, et al. . (2014). La amilina modula el sistema de dopamina mesolímbico para controlar el balance de energía. Neuropsicofarmacología 40, 372 – 385. 10.1038 / npp.2014.18 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  49. Montague PR, Dayan P., Sejnowski TJ (1996). Un marco para los sistemas de dopamina mesencefálicos basados ​​en el aprendizaje predictivo de Hebbian. J. Neurosci. 16, 1936 – 1947. ElPubMed]
  50. Morrison SE, Nicola SM (2014). Las neuronas en el núcleo accumbens promueven el sesgo de selección para objetos más cercanos. J. Neurosci. 34, 14147 – 14162. 10.1523 / JNEUROSCI.2197-14.2014 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  51. Narita M., Nagumo Y., Hashimoto S., Narita M., Khotib J., Miyatake M., y otros. . (2006). Participación directa de los sistemas orexinérgicos en la activación de la vía de la dopamina mesolímbica y conductas relacionadas inducidas por la morfina. J. Neurosci. 26, 398 – 405. 10.1523 / JNEUROSCI.2761-05.2006 [PubMed] [Cross Ref.]
  52. Nicola SM (2010). La hipótesis del enfoque flexible: la unificación del esfuerzo y las hipótesis de respuesta para el papel del núcleo accumbens dopamina en la activación del comportamiento de búsqueda de recompensa. J. Neurosci. 30, 16585 – 16600. 10.1523 / JNEUROSCI.3958-10.2010 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  53. Nicola SM, Hopf FW, Hjelmstad GO (2004). Mejora del contraste: ¿un efecto fisiológico de la dopamina del cuerpo estriado? Tejido celular res. 318, 93 – 106. 10.1007 / s00441-004-0929-z [PubMed] [Cross Ref.]
  54. Nicola SM, Surmeier J., Malenka RC (2000). Modulación dopaminérgica de la excitabilidad neuronal en el cuerpo estriado y el núcleo accumbens. Annu. Rev. Neurosci. 23, 185 – 215. 10.1146 / annurev.neuro.23.1.185 [PubMed] [Cross Ref.]
  55. Nicola SM, Taha SA, Kim SW, Fields HL (2005). La liberación de dopamina en el núcleo accumbens es necesaria y suficiente para promover la respuesta conductual a las señales predictivas de recompensa. Neurociencia 135, 1025 – 1033. 10.1016 / j.neuroscience.2005.06.088 [PubMed] [Cross Ref.]
  56. Niv Y., Daw N., Dayan P. (2005). Qué tan rápido para trabajar: respuesta vigor, motivación y dopamina tónica, en Sistemas de procesamiento de información neuronal 18, eds Weiss Y., Scholkopf B., Platt J., editores. (Cambridge, MA: MIT Press;), 1019 – 1026.
  57. Niv Y., Daw N., Joel D., Dayan P. (2007). Dopamina tónica: costos de oportunidad y control del vigor de respuesta. Psicofarmacología 191, 507 – 520. 10.1007 / s00213-006-0502-4 [PubMed] [Cross Ref.]
  58. O'keefe J., Nadel L. (1978). El hipocampo como mapa cognitivo. Oxford: Clarendon.
  59. Ostlund SB, Wassum KM, Murphy NP, Balleine BW, Maidment NT (2011). Los niveles de dopamina extracelular en las subregiones estriatales rastrean los cambios en la motivación y el costo de respuesta durante el condicionamiento instrumental. J. Neurosci. 31, 200 – 207. 10.1523 / JNEUROSCI.4759-10.2011 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  60. Ozer H., Ekinci AC, Starr MS (1997). La catalepsia dependiente de D1 y D2 de la dopamina en la rata requiere receptores funcionales NMDA en el cuerpo estriado, el núcleo accumbens y la sustancia negra pars reticulata. Brain Res. 777, 51 – 59. 10.1016 / S0006-8993 (97) 00706-3 [PubMed] [Cross Ref.]
  61. Patyal R., Woo EY, Borgland SL (2012). La hipocretina local-1 modula la concentración terminal de dopamina en la capa del núcleo accumbens. Frente. Behav. Neurosci. 6: 82. 10.3389 / fnbeh.2012.00082 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  62. Perry ML, Leinninger GM, Chen R., Luderman KD, Yang H., Gnegy ME, y otros. . (2010). La leptina promueve la actividad del transportador de dopamina y la tirosina hidroxilasa en el núcleo accumbens de ratas Sprague-Dawley. J. Neurochem. 114, 666 – 674. 10.1111 / j.1471-4159.2010.06757.x [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  63. Petrosini L., Molinari M., Dell'anna ME (1996). Contribución cerebelosa al procesamiento de eventos espaciales: laberinto de agua de Morris y laberinto en T. EUR. J. Neurosci. 8, 1882–1896. 10.1111 / j.1460-9568.1996.tb01332.x [PubMed] [Cross Ref.]
  64. Pezze MA, Dalley JW, Robbins TW (2007). Funciones diferenciales de los receptores de dopamina D1 y D2 en el núcleo accumbens en el desempeño de atención en la tarea de tiempo de reacción en serie de cinco opciones. Neuropsicofarmacología 32, 273 – 283. 10.1038 / sj.npp.1301073 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  65. Quarta D., Di Francesco C., Melotto S., Mangiarini L., Heidbreder C., Hedou G. (2009). La administración sistémica de grelina aumenta la dopamina extracelular en la cáscara, pero no la subdivisión central del núcleo accumbens. Neurochem. En t. 54, 89 – 94. 10.1016 / j.neuint.2008.12.006 [PubMed] [Cross Ref.]
  66. Quarta D., Leslie CP, Carletti R., Valerio E., Caberlotto L. (2011). Administración central de NPY o un aumento agonista selectivo de NPY-Y5 in vivo Niveles de monoamina extracelular en áreas de proyección mesocorticolímbica. Neurofarmacología 60, 328 – 335. 10.1016 / j.neuropharm.2010.09.016 [PubMed] [Cross Ref.]
  67. R Core Team (2013). R: Un lenguaje y entorno para la computación estadística. Fundación para la computación estadística. Disponible en línea en: http://www.R-project.org/ (Accedido a 2016).
  68. Salamone JD, Cousins ​​MS, McCullough LD, Carriero DL, Berkowitz RJ (1994). El núcleo accumbens aumenta la liberación de dopamina durante el prensado de palanca instrumental para alimentos, pero no para el consumo de alimentos gratis. Pharmacol. Biochem. Behav. 49, 25 – 31. 10.1016 / 0091-3057 (94) 90452-9 [PubMed] [Cross Ref.]
  69. Schultz W. (1998). Señal de recompensa predictiva de las neuronas dopaminérgicas. J. Neurofisiol. 80, 1 – 27. ElPubMed]
  70. Schultz W., Dayan P., Montague PR (1997). Un sustrato neural de la predicción y la recompensa. Ciencia 275, 1593 – 1599. 10.1126 / science.275.5306.1593 [PubMed] [Cross Ref.]
  71. Sclafani A. (1987). El sabor, el apetito y la obesidad de los carbohidratos: una visión general. Neurosci. Biobehav. Rev. 11, 131 – 153. 10.1016 / S0149-7634 (87) 80019-2 [PubMed] [Cross Ref.]
  72. Sclafani A. (2013). Señalización de nutrientes del intestino. Apetición frente a la saciedad. Appetite 71, 454 – 458. 10.1016 / j.appet.2012.05.024 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  73. Sclafani A., Ackroff K. (2012). El papel de la percepción intestinal de nutrientes para estimular el apetito y condicionar las preferencias de los alimentos. A.m. J. Physiol. Regul Integrar Comp. Fisiol. 302, R1119 – R1133. 10.1152 / ajpregu.00038.2012 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  74. Shin R., Cao J., Webb SM, Ikemoto S. (2010). La administración de anfetamina en el cuerpo estriado ventral facilita la interacción conductual con señales visuales no condicionadas en ratas. PLoS ONE 5: e8741. 10.1371 / journal.pone.0008741 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  75. Skibicka KP, Hansson C., Alvarez-Crespo M., Friberg PA, Dickson SL (2011). Ghrelin se dirige directamente al área tegmental ventral para aumentar la motivación de los alimentos. Neurociencia 180, 129 – 137. 10.1016 / j.neuroscience.2011.02.016 [PubMed] [Cross Ref.]
  76. Skibicka KP, Hansson C., Egecioglu E., Dickson SL (2012a). El papel de la grelina en la recompensa de alimentos: el impacto de la grelina en la autoadministración de sacarosa y la expresión del gen del receptor de dopamina mesolímbica y acetilcolina. Adicto. Biol. 17, 95 – 107. 10.1111 / j.1369-1600.2010.00294.x [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  77. Skibicka KP, Shirazi RH, Hansson C., Dickson SL (2012b). La grelina interactúa con el neuropéptido Y Y1 y los receptores opioides para aumentar la recompensa de los alimentos. Endocrinología 153, 1194 – 1205. 10.1210 / es.2011-1606 [PubMed] [Cross Ref.]
  78. Skibicka KP, Shirazi RH, Rabasa-Papio C., Alvarez-Crespo M., Neuber C., Vogel H., et al. . (2013). Circuitos divergentes que subyacen a la recompensa de alimentos y los efectos de la ingesta de grelina: la proyección dopaminérgica de VTA-accumbens media el efecto de la grelina sobre la recompensa de alimentos, pero no la ingesta de alimentos. Neurofarmacología 73, 274-283. 10.1016 / j.neuropharm.2013.06.004 [PubMed] [Cross Ref.]
  79. Smith GP (2001). John Davis y los significados de lamer. Appetite 36, 84 – 92. 10.1006 / appe.2000.0371 [PubMed] [Cross Ref.]
  80. Sokolowski JD, Conlan AN, Salamone JD (1998). Un estudio de microdiálisis del núcleo accumbens y la dopamina de la cáscara durante la respuesta operante en la rata. Neurociencia 86, 1001 – 1009. 10.1016 / S0306-4522 (98) 00066-9 [PubMed] [Cross Ref.]
  81. Steinberg EE, Boivin JR, Saunders BT, Witten IB, Deisseroth K., Janak PH (2014). El refuerzo positivo mediado por las neuronas de dopamina del cerebro medio requiere la activación de los receptores D1 y D2 en el núcleo accumbens. PLoS ONE 9: e94771. 10.1371 / journal.pone.0094771 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  82. Stice E., Figlewicz DP, Gosnell BA, Levine AS, Pratt WE (2013). La contribución de los circuitos de recompensa cerebral a la epidemia de obesidad. Neurosci. Biobehav. Rev. 37, 2047 – 2058. 10.1016 / j.neubiorev.2012.12.001 [Artículo gratuito de PMC] [PubMed] [Cross Ref.]
  83. Wakabayashi KT, Fields HL, Nicola SM (2004). Disociación del papel del núcleo accumbens dopamina en respuesta a las señales predictivas de recompensa y en espera de recompensa. Behav. Brain Res. 154, 19 – 30. 10.1016 / j.bbr.2004.01.013 [PubMed] [Cross Ref.]
  84. Yun IA, Nicola SM, Fields HL (2004a). Los efectos contrastantes de la inyección de antagonistas de la dopamina y el receptor de glutamato en el núcleo accumbens sugieren un mecanismo neural que subyace en el comportamiento dirigido hacia el objetivo, provocado por la señal. EUR. J. Neurosci. 20, 249 – 263. 10.1111 / j.1460-9568.2004.03476.x [PubMed] [Cross Ref.]
  85. Yun IA, Wakabayashi KT, Fields HL, Nicola SM (2004b). El área ventral tegmental es necesaria para las respuestas de activación neuronal del comportamiento y del núcleo accumbens a las señales de incentivo. J. Neurosci. 24, 2923 – 2933. 10.1523 / JNEUROSCI.5282-03.2004 [PubMed] [Cross Ref.]