Dopamina, tiempo e impulsividad en humanos (2010)

J Neurosci. 2010 Jun 30;30(26):8888 - 96. doi: 10.1523 / JNEUROSCI.6028-09.2010.

Pino un1, Shiner T, Seymour B, Dolan RJ.

Información del autor

Resumen

La neurotransmisión de dopamina desordenada está implicada en la mediación de la impulsividad a través de una variedad de conductas y trastornos que incluyen adicción, juego compulsivo, trastorno por déficit de atención / hiperactividad y síndrome de desregulación de dopamina. Si bien las teorías existentes sobre la función de la dopamina resaltan los mecanismos basados ​​en el aprendizaje de recompensa aberrante o la desinhibición conductual, no ofrecen una explicación adecuada de la hipersensibilidad patológica al retraso temporal que forma un fenotipo conductual crucial observado en estos trastornos. Aquí proporcionamos evidencia de que un papel para la dopamina en el control de la relación entre el tiempo de las recompensas futuras y su valor subjetivo puede salvar esta brecha explicativa. Usando una tarea de elección intertemporal, demostramos que la mejora farmacológica de la actividad de la dopamina aumenta la impulsividad al aumentar la influencia diminuta del retraso creciente en el valor de la recompensa (descuento temporal) y su correspondiente representación neural en el estriado. Esto conduce a un estado de descuento excesivo de las recompensas temporalmente distantes, en relación con las anteriores. Por lo tanto, nuestros hallazgos revelan un nuevo mecanismo mediante el cual la dopamina influye en la toma de decisiones humanas que puede explicar las aberraciones de comportamiento asociadas con un sistema de dopamina hiperfuncionante.

Introducción

La pérdida característica de autocontrol e impulsividad asociada con la función aberrante de la dopamina se ejemplifica mediante trastornos como la adicción, el trastorno por déficit de atención / hiperactividad (TDAH) y el síndrome de desregulación de la dopamina (Winstanley et al., 2006; Dagher y Robbins, 2009; O'Sullivan et al., 2009). En este último, la terapia de reemplazo de dopamina en el tratamiento de la enfermedad de Parkinson (EP) hace que algunos pacientes sean propensos a un comportamiento compulsivo, que se manifiesta como un exceso de juego, compras, comida y otros comportamientos miopes. Sin embargo, el amplio fenotipo de impulsividad que caracteriza estos comportamientos subsume una diversidad de distintos procesos de toma de decisiones que pueden disociarse neurobiológicamente y farmacológicamente (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a, 2006; Dalley et al., 2008). Estos incluyen la falta de inhibición de las respuestas motoras prepotentes, la sobreponderación de las recompensas en relación con las pérdidas, la desaceleración frente a los conflictos de decisión y la propensión a elegir recompensas más pequeñas, más pronto que más grandes.

En principio, algunos de los déficits antes mencionados pueden estar relacionados con los efectos dopaminérgicos por medio del papel establecido de la dopamina en el aprendizaje de recompensas (Redish, 2004; Frank et al., 2007; Dagher y Robbins, 2009). Sin embargo, la impulsividad temporal (o elección), la preferencia por recompensas más pequeñas, más pronto que más grandes, más tarde, debido al descuento excesivo de las recompensas futuras (Ainslie, 1975; Evenden, 1999; Ho et al., 1999; Cardinal et al., 2004): Es mucho más difícil de explicar en términos de aprendizaje, aunque sigue siendo una característica importante de la supuesta impulsividad dopaminérgica. De hecho, las pruebas de laboratorio de elección intertemporal indican que los adictos y un subgrupo de pacientes con TDAH parecen tener tasas de descuento temporal anormalmente altas, prefiriendo las recompensas más pequeñas y pronto (Sagvolden y Sargento, 1998; Bickel y Marsch, 2001; Solanto et al., 2001; Winstanley et al., 2006; Bickel et al., 2007). Esto plantea la cuestión de si la dopamina tiene un papel específico en el cálculo de cómo la proximidad temporal de una recompensa se relaciona con su valor subjetivo (es decir, la tasa de descuento temporal), independientemente de su contribución establecida para recompensar el aprendizaje.

Para investigar si la dopamina modula la codificación del valor dependiente del tiempo, administramos el precursor de dopamina l-dopa, el antagonista de la dopamina haloperidol y el placebo a voluntarios sanos que realizan una tarea de elección intertemporal. La tarea requería que los sujetos tomaran decisiones genuinas entre diferentes cantidades de dinero, ofrecidas en períodos de tiempo variables, en su mayoría involucrando la elección entre recompensas monetarias más pequeñas, más tempranas, más rápidas, más tarde. Tales opciones están bien caracterizadas por modelos que incorporan tanto los efectos de descuento del tiempo como los efectos de descuento de la magnitud de recompensa creciente (utilidad marginal decreciente) (Pine et al., 2009). En consecuencia, la utilidad descontada o el valor subjetivo de una recompensa retrasada está determinada por el producto del factor de descuento (un número entre cero y uno) y la utilidad de la recompensa. Si la dopamina modula la elección de un individuo en esta tarea, podría reflejar un cambio en la tasa de descuento o en la concavidad / convexidad de la utilidad (ver Materiales y métodos), una distinción que pudimos probar aquí tanto a nivel conductual como neurofisiológico, utilizando Imagen de resonancia magnética funcional (fMRI). Además, evaluamos si la dopamina tenía algún efecto sobre la tasa de desaceleración generada por el conflicto de decisiones (Frank et al., 2007; Pochon et al., 2008) para distinguir influencias globales de discretas en la impulsividad.

Materiales y Métodos

Usamos fMRI mientras que los sujetos eligieron entre dos opciones presentadas en serie de diferente magnitud (de £ 1 a £ 150) y retraso (de la semana 1 al año 1) ( ). Cada sujeto realizó la tarea en tres ocasiones distintas (relacionadas con las tres condiciones de la droga). Estas opciones a menudo eran más pequeñas, más pronto que opciones más grandes, más tarde. Una de las opciones de los sujetos se seleccionó al azar al final del experimento (en cada sesión experimental) y se pagó de forma real (es decir, en la fecha futura especificada) mediante transferencia bancaria. Usamos las elecciones de los sujetos para evaluar el grado de descuento tanto por magnitud como por tiempo. Evaluamos un modelo que combinaba una función de utilidad (convertir magnitud en utilidad) con una función de descuento hiperbólico estándar. En términos simples, la función para la utilidad descontada (valor subjetivo) de una recompensa retrasada (V) es igual a D × U donde D es un factor de descuento entre 0 y 1 y U Es una utilidad no descontada. D es típicamente una función hiperbólica del retraso a la recompensa e incorpora el parámetro de tasa de descuento (K), lo que determina la rapidez con la que uno devalúa las recompensas futuras. U Es (típicamente) una función cóncava de la magnitud de una recompensa y depende de un parámetro individual (r) que determina la concavidad / convexidad de la función, o la tasa de utilidad marginal marginal decreciente para las ganancias y, en consecuencia, el valor instantáneo de la relación mayor a la recompensa menor. El mayor K or r, cuanto más probable es que el individuo elija la opción más rápida y, por lo tanto, más impulsivo es el individuo (Ho et al., 1999; Pine et al., 2009). De acuerdo con la teoría de la utilidad, la elección está determinada por el principio de maximización de la utilidad mediante el cual se selecciona la opción con la mayor utilidad descontada.

Figura 1 y XNUMX 

Diseño de tareas. Los sujetos recibieron un conjunto de opciones binarias intertemporales 220, en su mayoría entre recompensas más pequeñas y más tempranas y tardías, que variaban en cantidades desde £ 1- £ 150 con retrasos asociados de 1-52 semanas. Nota ...

Participantes

Catorce voluntarios sanos y diestros se incluyeron en el experimento (hombres 6; mujeres 8; edad media, 21; rango, 18-30). Los sujetos fueron evaluados para excluir a aquellos con antecedentes de enfermedades neurológicas o psiquiátricas. Todos los sujetos dieron su consentimiento informado y el estudio fue aprobado por el comité de ética del University College London. Un sujeto abandonó el estudio después de la primera sesión y no se incluyó en los resultados. Otro no completó la sesión final (placebo) en el escáner, pero sus datos de comportamiento de todas las sesiones y los datos de imágenes de dos sesiones se incluyeron en los resultados.

Descripción del procedimiento y de la tarea.

Cada sujeto fue probado en tres ocasiones diferentes. Al llegar a cada ocasión, los sujetos recibieron una hoja de instrucciones para leer y explicar cómo se implementaría el cegamiento de la droga. Luego completaron una escala analógica visual (Bond y Lader, 1974) que midieron estados subjetivos, como el estado de alerta, y posteriormente se les dio un sobre que contenía dos píldoras que eran 1.5 mg de haloperidol o placebo. Una hora y media después de tomar el primer conjunto de píldoras, los sujetos recibieron otro sobre que contenía dos píldoras que eran Madopar (que contenían 150 mg de l-dopa) o placebo. Los comprimidos de placebo (vitamina C o multivitaminas) fueron indistinguibles de los fármacos. En total, cada sujeto recibió una dosis de Madopar en una sesión, una dosis de haloperidol en otra sesión y en una sesión ambos grupos de comprimidos recibieron placebo. El orden de cada condición de fármaco en relación con la sesión de prueba fue contrabalanceado entre los sujetos y era desconocido para el experimentador para lograr un diseño de doble ciego. Las pruebas comenzaron 30 min después de la ingestión del segundo conjunto de tabletas. El objetivo de los intervalos fue lograr una concentración plasmática máxima del fármaco aproximadamente a la mitad de la prueba. Después de la prueba, los sujetos completaron otra escala analógica visual (idéntica). No se realizaron dos sesiones de prueba dentro de la semana 1 una de la otra.

La tarea de comportamiento fue principalmente como se describe por Pine et al. (2009). Cada prueba consistió en una elección entre una recompensa más pequeña y más temprana y una recompensa más grande y más tarde. La elección fue presentada en serie, en tres etapas ( ). Las primeras dos etapas consistieron en la presentación de los detalles de cada opción, es decir, la magnitud de la recompensa en libras y la demora en su recepción en meses y semanas. Después de la presentación de las opciones, una tercera pantalla le pidió al sujeto que eligiera entre la opción 1 (la opción presentada primero) o la opción 2, por medio de un botón, usando su mano derecha. El retraso de un 3 siguió cada una de las tres fases. La elección solo se puede hacer durante la presentación de la pantalla de selección de 3. Una vez que se hizo una elección, la opción elegida se resaltó en azul. Siempre que hubiera tiempo suficiente, el sujeto podría cambiar de opinión. Hubo una demora jittered de 1 – 4 s después de la fase de elección, seguido de la presentación de una cruz de fijación para 1 s.

El experimento consistió en un total de ensayos 200. La opción 1 fue la recompensa más pequeña y más temprana en 50% de las pruebas. Además, incluimos otras pruebas de "captura" de 20, donde una de las opciones fue mayor en valor y disponible antes que la otra. Estos ensayos de captura ocurrieron aproximadamente cada diez ensayos y nos permitieron determinar qué tan bien los sujetos se estaban concentrando en la tarea, suponiendo que la norma era preferir la recompensa más grande y más pronto en estas elecciones. A cada sujeto se le dio la misma variedad de opciones en cada sesión de prueba (es decir, cada condición de medicamento) con la excepción de los dos primeros sujetos que recibieron un conjunto diferente de opciones en su primera sesión de prueba. Los valores de las opciones se crearon utilizando magnitudes generadas aleatoriamente que varían desde £ 1 a £ 150 en unidades de £ 1 y retrasos que van desde 1 week hasta 1 year en unidades de semanas individuales (pero presentados como un número de meses y semanas), nuevamente con un distribución aleatoria Esta naturaleza aleatoria de los valores ayudó a ortogonalizar la magnitud y el retraso. Para crear opciones entre recompensas más pequeñas (antes y después), introdujimos la restricción de que la opción con mayor magnitud debería retrasarse más que las más pequeñas, y viceversa para las pruebas de captura. Los sujetos se asignaron a una de las dos matrices de elección según sus respuestas en los ensayos de práctica en su primera sesión. Esto se hizo para adaptar las opciones presentadas al nivel de impulsividad del sujeto.

El pago se realizó utilizando una lotería para seleccionar un ensayo de cada sesión de prueba. Para imponer la validez ecológica, utilizamos un sistema de pago que garantizaba que todas las opciones se tomarían de una manera realista, con consecuencias realistas. Crucial para este diseño fue la selección aleatoria de una de las elecciones realizadas durante el experimento, con un pago real de la opción elegida para esa elección. Esto se logró por medio de una transferencia bancaria realizada en el momento asociado y que consiste en el monto de la opción seleccionada. La selección de pago se implementó utilizando una lotería manual después de completar todas las pruebas. La lotería contenía bolas numeradas 220, cada una representando un solo ensayo de la tarea. La bola que se seleccionó correspondió a la prueba recompensada para esa sesión de prueba. La magnitud y el retraso de la opción que el sujeto eligió en el ensayo seleccionado se determinó y otorgó mediante una transferencia bancaria. Por lo tanto, el pago que recibió cada sujeto se determinó mediante una combinación de la lotería y las elecciones que hicieron, una manipulación que aseguró que los sujetos trataran todas las elecciones como reales. El sistema de pago se diseñó para que, en promedio, cada sujeto recibiera £ 75 por sesión. Ningún otro pago fue otorgado por la participación en el experimento.

Antes de ingresar los temas en el escáner, se les mostró la máquina de lotería y se les explicó cómo se implementaría la transferencia bancaria, para asegurarles que el sistema de pago y selección era genuino. Después de una breve práctica de seis ensayos, fueron llevados al escáner donde realizaron dos sesiones de ensayos 110 cada uno, con una duración total de ~ 50 mín.

Procedimiento de imagen

Las imágenes funcionales se realizaron mediante el uso de un escáner de resonancia magnética de cabeza única de Allegra 3-tesla Siemens para adquirir gradiente de eco. Imágenes eco-planas ponderadas en T2 * (EPI) con contraste dependiente del nivel de oxigenación de la sangre (BOLD). Utilizamos una secuencia diseñada para optimizar la sensibilidad funcional en la corteza orbitofrontal (Deichmann et al., 2003). Esto consistió en la adquisición inclinada en una orientación oblicua en 30 ° a la línea cingulada anterior-cingulada posterior AC-PC, así como la aplicación de un pulso de preparación con una duración de 1 ms y una amplitud de −2 mT / m en la selección de corte dirección. La secuencia permitió obtener cortes axiales 36 de 3 mm de grosor y 3 mm en resolución en plano con un tiempo de repetición (TR) de 2.34 s. Los sujetos se colocaron en un reposacabezas ligero dentro del escáner para limitar el movimiento de la cabeza durante la adquisición. Los datos de imágenes funcionales se adquirieron en dos sesiones de volumen 610 separadas. Una imagen estructural ponderada por T1 y mapas de campo también se adquirieron para cada sujeto después de las sesiones de prueba.

Analisis de comportamiento

Para obtener una medida general de la elección impulsiva, contamos el número de opciones más tempranas elegidas de los ensayos 220, bajo cada condición de fármaco, para cada sujeto. Los ensayos en los que no se realizó una respuesta se excluyeron de esta suma en las tres condiciones del fármaco. Por ejemplo, si un sujeto no respondió a tiempo para el número de ensayo 35 en la condición de placebo, este ensayo se excluyó del conteo en las otras dos condiciones para ese sujeto. Esto aseguró que las comparaciones se hicieran en una base de prueba por prueba (ya que se dio la misma serie de pruebas en cada sesión de prueba) y cualquier efecto del fármaco en esta medida no se relacionó con el número de elecciones realizadas en cada condición. Se usó un ANOVA de medidas repetidas para buscar cualquier diferencia en esta medida general a través de las condiciones de los medicamentos.

Estimación de parámetros

Implementamos la regla de decisión de softmax para asignar una probabilidad (PO1 para la opción 1) para cada opción de la opción dado el valor de la opción (VO1 para la opción 1) mediante la cual

POi=e(VOi/β)e(VO1/β)+e(VO2/β).
(1)

VOi representa el valor de una opción (es decir, una recompensa retrasada) de acuerdo con un modelo particular de valoración de la opción (ver más abajo). los β El parámetro representa el grado de estocasticidad del comportamiento del sujeto (es decir, la sensibilidad al valor de cada opción).

Utilizamos un modelo de utilidad con descuento de la valoración de opciones, que informamos anteriormente (Pine et al., 2009) como proporcionar un ajuste preciso a las elecciones del sujeto en esta tarea. Este modelo establece que la utilidad descontada (V) de una recompensa de magnitud (M) y con un retraso (d) se puede expresar de la siguiente manera:

V=D(d)U(M)=1-e(-rM)r(1+Kd),
(2)

donde

D=11+Kd

y

U=1-e(-rM)r.

D se puede considerar como el factor de descuento, el factor dependiente del retardo (entre 0 y 1) por el cual la utilidad se descuenta de una manera hiperbólica estándar (Mazur, 1987). El parámetro de tasa de descuento K cuantifica la tendencia de un individuo a descontar el futuro de tal manera que una persona con un alto K Devalúa rápidamente las recompensas a medida que se vuelven más distantes. U es una utilidad no descontada y se rige por la magnitud de cada opción y r, un parámetro libre que gobierna la curvatura de la relación. Cuanto mayor sea el valor de r, cuanto más cóncava es la función de utilidad, y donde r es negativo, la función de utilidad es convexa. El mayor r (por encima de cero), mayor es la tasa de disminución de la utilidad marginal y más impulsivo es el individuo en la elección. Tenga en cuenta que según los modelos tradicionales de valoración de elección intertemporal, que no tienen en cuenta el descuento de magnitud (Mazur, 1987), la impulsividad, definida por la propensión a elegir la opción más pequeña y más temprana, es únicamente una función de K y así se podría esperar que los dos se correlacionen perfectamente. Por lo tanto, K A menudo se considera una medida de este rasgo. Sin embargo, dado que el descuento de magnitud también se ha demostrado que determina el resultado de la elección en animales y humanos (Ho et al., 1999; Pine et al., 2009), preferimos equiparar la impulsividad con el comportamiento de elección ya que la tasa de descuento temporal no se correlaciona perfectamente con esta medida clave.

Para calcular los parámetros de máxima verosimilitud para cada modelo, así como una medida del ajuste, se utilizó la estimación de máxima verosimilitud. Cada uno de los parámetros (incluyendo β) se le permitió variar libremente. Para cada tema, la probabilidad se calculó para cada una de las opciones 220 elegidas de las opciones 220 (incluidas las pruebas de captura), utilizando la fórmula softmax e implementada con funciones de optimización en Matlab (MathWorks). La probabilidad logarítmica se calculó utilizando la probabilidad de la opción elegida en el juicio t (PO(t)) de Ec. 1 tal que

lnL=ΣtlnPO(t).
(3)

Se utilizó un ANOVA de medidas repetidas para probar cualquier diferencia en la tasa de descuento (K) y la concavidad de la utilidad (r) a través de condiciones de drogas.

Para los fines de los análisis de imágenes y de tiempo de reacción, se realizó una estimación adicional mediante la cual todas las elecciones de cada sujeto en cada condición se agruparon (como si fuera un sujeto) y se modelaron como un sujeto canónico para estimar los valores de parámetros canónicos (utilizando el procedimiento de ajuste anterior, estimación de parámetros). Esto se realizó para reducir el ruido asociado con el procedimiento de ajuste en el nivel de sujeto único. Además, no deseamos construir las diferencias de comportamiento en nuestros modelos de regresión al analizar los datos de fMRI, ya que buscamos evidencia independiente para nuestros hallazgos de comportamiento.

Análisis de imágenes

El análisis de la imagen se realizó utilizando SPM5 (www.fil.ion.ucl.ac.uk/spm). Para cada sesión, las primeras cinco imágenes se descartaron para tener en cuenta los efectos de equilibrio de T1. Las imágenes restantes se alinearon con el sexto volumen (para corregir los movimientos de la cabeza), no se deformaron utilizando mapas de campo, se normalizaron espacialmente a la plantilla de cerebro estándar del Instituto de Neurología de Montreal (MNI) y se suavizaron espacialmente con un núcleo gaussiano tridimensional de 8 mm completo ancho a la mitad del máximo (FWHM) (y remuestreado, resultando en vóxeles 3 × 3 × 3 mm). Los artefactos de baja frecuencia se eliminaron utilizando un filtro de paso alto de 1 / 128 Hz y la autocorrelación temporal intrínseca a la serie de tiempo fMRI se corrigió mediante el procedimiento de pre-cierre usando un proceso AR (1).

Se generaron mapas de contraste de un solo sujeto utilizando modulación paramétrica en el contexto del modelo lineal general. Realizamos un análisis, examinando la varianza en la respuesta BOLD regional atribuible a diferentes regresores de interés: U, Dy V para todas las opciones sobre todas las condiciones de drogas. Esto nos permitió identificar las regiones implicadas en la evaluación e integración de diferentes componentes de valor (en la condición de placebo) y buscar cualquier diferencia en estas activaciones entre las condiciones de los medicamentos.

U, Dy V para cada opción (dos por ensayo) se calcularon utilizando las estimaciones de los parámetros canónicos (K y r) en el contexto de nuestro modelo de utilidad con descuento y convuelto con la función de respuesta hemodinámica canónica (HRF) en el inicio de cada opción. Todos los complementos fueron modelados como funciones de palanca y todos los regresores en el mismo modelo fueron ortogonalizados (en los pedidos indicados anteriormente) antes del análisis por SPM5. Para corregir los artefactos de movimiento, los seis parámetros de realineación se modelaron como regresores sin interés en cada análisis. En un análisis adicional, eliminamos cualquier posible confusión relacionada con la ortogonalización de los regresores en nuestro análisis fMRI mediante la implementación de otro modelo de regresión, pero ahora eliminamos el paso de ortogonalización. Aquí se permitió que los regresores compitieran por la variación, de manera que en este modelo más conservador se eliminaron todos los componentes de variación compartidos, revelando solo componentes únicos de U, Dy V. Bajo este modelo, observamos nuevamente las mismas diferencias en D y V a través de condiciones de drogas y no hay diferencia en U, aunque se redujo la magnitud de las diferencias.

En el segundo nivel (análisis de grupo), las regiones que muestran una modulación significativa por cada uno de los regresores especificados en el primer nivel se identificaron mediante un análisis de efectos aleatorios de la β Imágenes de los mapas de contraste de un solo sujeto. Incluimos el cambio en la medida de impulsividad (diferencia en el número de elegidos antes) como covariable al realizar el contraste relacionado con las diferencias en los ensayos con l-dopa y placebo. Informamos los resultados para las regiones donde el nivel máximo de voxel t valor correspondió a p <0.005 (sin corregir), con un tamaño de agrupación mínimo de cinco. Las coordenadas se transformaron de la matriz MNI a la matriz estereotáxica de Talairach y Tournoux (1988) (http://imaging.mrc-cbu.cam.ac.uk/imaging/MniTalairach).

Las imágenes estructurales de T1 se registraron en las imágenes medias de EPI funcionales para cada sujeto y se normalizaron utilizando los parámetros derivados de las imágenes de EPI. La localización anatómica se realizó superponiendo la t mapas en una imagen estructural normalizada promediada en los sujetos y con referencia al atlas anatómico de Mai et al. (2003).

Datos de latencia de decisión

Para examinar el efecto del conflicto de decisión (dificultad de elección) en la latencia de decisión, calculamos una medida de dificultad para cada una de las opciones de 220 calculando la diferencia en la utilidad con descuento (ΔV) de las dos opciones. Esta medida se calculó utilizando el modelo de utilidad descontado y las estimaciones de los parámetros canónicos (por la misma razón que se utilizaron en los análisis fMRI). Luego se realizó una regresión lineal para modelar la relación entre la latencia de decisión para cada elección y la medida de dificultad. Los parámetros estimados (βs) luego se usaron como resumen estadístico y se realizó un análisis de segundo nivel por medio de una muestra t prueba comparando el βs contra cero. Esto se realizó por separado para el grupo en cada condición de fármaco. Para probar cualquier diferencia en la relación entre conflicto y latencia en las condiciones de las drogas, utilizamos muestras pareadas t pruebas.

Resultados

En primer lugar, analizamos los efectos de la manipulación del fármaco en el comportamiento considerando la proporción de opciones más pequeñas, antes en comparación con las más grandes, más tarde elegidas, de un total de opciones de 220, realizadas en cada condición. Estos datos revelaron un marcado aumento en el número de opciones más tempranas elegidas en la condición de l-dopa en relación con la condición de placebo (media de 136 frente a 110, p = 0.013) (Tabla 1, ). Sorprendentemente, este patrón se observó en todos los sujetos en los que se pudo hacer esta comparación. No hubo diferencias significativas entre las condiciones de haloperidol y placebo en esta disposición. Tenga en cuenta que la tarea consistía en la misma matriz de elección en cada condición.

Figura 2 y XNUMX 

Comparaciones de comportamiento y estimaciones de parámetros en condiciones de placebo y l-dopa. a, Los sujetos realizaron exactamente el mismo conjunto de opciones (220) en las tres condiciones de tratamiento, pero más a menudo eligieron las más pequeñas, antes que las más grandes, más tarde ...
Tabla 1 

Resumen de hallazgos de comportamiento

A continuación, utilizamos la estimación de máxima verosimilitud para encontrar los parámetros que mejor se ajustan (K y r) para el modelo de utilidad con descuento, para cada sujeto en cada condición, para determinar si un efecto específico en cualquiera de estos parámetros medió el aumento observado en la impulsividad conductual. Al comparar los parámetros estimados que controlan la tasa de descuento y la concavidad de la utilidad en todas las condiciones, se encontró un efecto específico de la l-dopa en la tasa de descuento, sin efecto en la concavidad de la utilidad (Tabla 1, y Tabla suplementaria 1, disponible en www.jneurosci.org as material suplementario). Por lo tanto, bajo l-dopa, se observó una tasa de descuento más alta en comparación con el placebo (p = 0.01), lo que lleva a una mayor devaluación de las recompensas futuras. A modo de ilustración, al utilizar una estimación de parámetros canónicos de grupo para trazar una función de descuento para cada condición de fármaco, se puede observar que bajo placebo se requería un retraso de ~ 35 semanas para que una recompensa de £ 150 tenga un valor presente (subjetivo) de £ 100, sin embargo, bajo l-dopa, la misma devaluación tuvo lugar con un retraso de solo 15 semanas ( ). Las estimaciones de parámetros canónicos utilizadas para los análisis de imágenes fueron 0.0293 para K y 0.0019 para r (todos los valores de K Los reportados se calculan a partir de unidades de tiempo de semanas).

De acuerdo con Pine et al. (2009), las estimaciones de los parámetros para cada sujeto (según las condiciones) fueron mayores que cero, lo que revela un efecto significativo del descuento temporal (p <0.001) y no linealidad (concavidad) de utilidad instantánea (p <0.05). Tenga en cuenta que, a diferencia de los modelos tradicionales de elección intertemporal (Mazur, 1987), donde el resultado de la elección es únicamente una función de K, el modelo utilizado aquí implica que el número de opciones elegidas antes también depende de la r parámetro (ver Materiales y Métodos) (Pine et al., 2009) y por lo tanto K no es en sí mismo una medida pura de impulsividad de elección. Además, la precisión de los parámetros estimados depende tanto de la estocasticidad como de la coherencia de las respuestas de los sujetos. Por ejemplo, los parámetros estimados en el ensayo de placebo del sujeto 13 fueron anómalos en relación con el resto de los datos (Tabla suplementaria 1, disponible en www.jneurosci.org as material suplementario), indicando que este tema podría haber tomado decisiones inconsistentes en esta sesión. Al comparar entre sujetos, tenga en cuenta que el número de elecciones más rápidas también depende de la elección establecida en el sujeto recibido (uno de dos).

Además, examinamos si una desaceleración en las latencias de decisión era evidente a medida que las opciones se volvían cada vez más difíciles, como consecuencia de la proximidad creciente en los valores de las opciones, y si las diferencias de grupo eran evidentes en esta medida. Realizamos una regresión para evaluar la relación entre la latencia de la decisión y la dificultad de cada elección según la diferencia en la utilidad con descuento (ΔV) entre las dos opciones de elección, calculadas utilizando los valores estimados de los parámetros. En placebo (p <0.001), l-dopa (p <0.001) y haloperidol (p <0.001) condiciones, las latencias de decisión de los sujetos aumentaron como ΔV se hizo más pequeño, es decir, a medida que la diferencia en el valor subjetivo entre las opciones se hizo más pequeña. Sin embargo, no se observó una diferencia general en esta medida a través de las condiciones del fármaco. Esto indica que, a diferencia del resultado de la elección, la manipulación de la dopamina no influyó en la cantidad de tiempo dada para sopesar una decisión o la capacidad de "sostener a tus caballos", y corrobora la sugerencia de que la impulsividad no es una construcción unitaria (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Esta observación concuerda con un hallazgo previo de que el estado de la medicación con dopamina en la EP no se asoció con un cambio en las latencias de decisión en una tarea de elección diferente (Frank et al., 2007).

Los efectos subjetivos se analizaron comparando los cambios en los tres factores identificados por Bond y Lader (1974), es decir, estado de alerta, satisfacción y calma, en relación con el cambio en las puntuaciones observadas en la condición de placebo. Se encontraron diferencias en las condiciones de haloperidol versus placebo, donde los sujetos estaban menos alertas con el haloperidol (p <0.05).

Para establecer cómo se representó la impulsividad mejorada bajo l-dopa a nivel neuronal, se aplicaron tres regresores paramétricos (ortogonalizados), U, Dy V, asociado con la presentación de cada opción, según lo dicta nuestro modelo, a los datos de imágenes cerebrales. Los regresores se crearon para cada sujeto, en cada condición, utilizando valores de parámetros canónicos estimados a partir de las elecciones de todos los sujetos durante todas las sesiones, en una prueba de la hipótesis nula de que la actividad cerebral no difiere entre las condiciones.

En un análisis preliminar, examinamos las correlaciones de estos tres regresores en la condición de placebo para replicar hallazgos anteriores (Pine et al., 2009). Nuestros resultados (Resultados suplementarios, disponible en www.jneurosci.org as material suplementario) fueron consistentes con los mostrados anteriormente, en ese D, Uy V todos se correlacionaron de forma independiente con la actividad en el núcleo caudado (entre otras regiones). Esto admite una vista jerárquica e integrada de la valoración de opciones donde los subcomponentes de valor se codifican de forma disociable y luego se combinan para proporcionar un valor general utilizado para guiar la elección.

Los análisis críticos de fMRI se enfocaron en la diferencia de comportamiento clave en la valoración de opciones bajo l-dopa en comparación con las condiciones de placebo. Al comparar la actividad neuronal para U, Dy V, se encontraron diferencias significativas para ambos D y V, un hallazgo que coincide con el resultado de comportamiento. Específicamente, observamos una actividad mejorada en las regiones relacionadas con el factor de descuento D bajo l-dopa en relación con las condiciones de placebo ( a y Resultados suplementarios, disponible en www.jneurosci.org as material suplementario) y ningún efecto del haloperidol (es decir, los coeficientes de regresión en la condición de placebo y haloperidol no difirieron significativamente). Estas regiones incluían el cuerpo estriado, la ínsula, el cingulado subgenual y las cortezas orbitofrontales laterales. Estos resultados muestran que la disminución característica en la actividad de estas regiones a medida que las recompensas se retrasan (o aumentan a medida que se acercan temporalmente) (McClure et al., 2004; Tanaka et al., 2004; Kable y Glimcher, 2007; Pine et al., 2009) (ver también Resultados suplementarios para placebo, disponible en www.jneurosci.org as material suplementario) está más marcado en la L-dopa en relación con las condiciones de placebo, de una manera que es paralela al hallazgo de comportamiento, donde la l-dopa aumentó la preferencia por recompensas más tempranas al aumentar la tasa de descuento, por lo que las recompensas más rápidas son más atractivas en comparación con las recompensas posteriores. Además, al igual que no hubo diferencia significativa en el estimado r parámetro a través de estos ensayos, no observamos diferencias significativas en U actividad entre los ensayos con l-dopa y placebo, lo que indica que la l-dopa no afectó la codificación de la utilidad de la recompensa.

Figura 3 y XNUMX 

Diferencias en la actividad neural entre las condiciones de l-dopa y placebo en respuesta al valor subjetivo y al factor de descuento (mapas estadísticos paramétricos y estimaciones de parámetros). a, Regiones que se correlacionaron con el factor de descuento (D) (es decir, recompensa la proximidad) ...

Estudios previos (Kable y Glimcher, 2007; Pine et al., 2009), así como un análisis del grupo placebo solo, implican regiones del estriado, entre otras, en la codificación de la utilidad descontada (V). Al comparar regiones correlacionadas con V, se observó una disminución de la actividad en las regiones caudada, ínsula y frontal inferior lateral, en l-dopa en comparación con las condiciones de placebo ( b y Resultados suplementarios, disponible en www.jneurosci.org as material suplementario). Este resultado indica que para una recompensa de una magnitud y retraso determinados, la actividad reducida en regiones que codifican valores subjetivos (utilidad descontada) fue generada por l-dopa. Esta reducción se asoció con el descuento temporal mejorado y condujo a un aumento en la selección de opciones más pequeñas y más tempranas (impulsivas) en esta condición en relación con el placebo.

Debido a que los datos de fMRI usaron el mismo conjunto único de parámetros canónicos (en todas las condiciones, probando la hipótesis nula de que todos son iguales), estos hallazgos concuerdan con los resultados conductuales por los cuales el aumento de la tasa de descuento bajo l-dopa conduce a una reducción en D, lo que lleva a una reducción correspondiente en V y, por lo tanto, una mayor preferencia relativa para recompensas más tempranas. Tenga en cuenta que si la dopamina codificara la utilidad descontada solo, uno podría predecir el resultado opuesto, con una mayor actividad en la condición de l-dopa.

Inspección de los resultados de comportamiento (Tabla 1, ) reveló que un aumento en la impulsividad después de la l-dopa se expresó en mayor medida en algunos sujetos que en otros. Sobre esta base, realizamos un análisis de covariables sobre los contrastes anteriores al calcular una puntuación de diferencia del número de opciones más tempranas elegidas en los ensayos de placebo y l-dopa. Cuanto mayor sea esta métrica, mayor será el aumento de la impulsividad (tasa de descuento) inducida por la l-dopa. Regresando esta cantidad como covariable en el contraste comparando D en condiciones de l-dopa menos placebo ( a), encontramos una correlación significativa con la actividad en la amígdala (bilateralmente) ( ). Debido a que la diferencia en la puntuación de elección entre los sujetos puede haber sido afectada parcialmente por el hecho de que los sujetos se asignaron a uno de los dos conjuntos de opciones posibles, y para aumentar el poder (pudiendo incluir más sujetos), repetimos este análisis, esta vez utilizando el diferencia en estimado K Valores desde placebo hasta ensayos de l-dopa. El resultado de este análisis (ver Resultados suplementarios, disponible en www.jneurosci.org as material suplementario) nuevamente demostró una fuerte correlación positiva entre la actividad de la amígdala y el grado de aumento en K de placebo a ensayos de l-dopa. Estos resultados sugieren que la susceptibilidad de los sujetos individuales a la impulsividad bajo la influencia de l-dopa está modulada por el grado de respuesta de la amígdala a la proximidad temporal de la recompensa.

Figura 4 y XNUMX 

Variabilidad intersujética en el aumento de la impulsividad después de la l-dopa. aMapa estadístico paramétrico que muestra las áreas que expresan una sensibilidad general al factor de descuento (en condiciones de l-dopa menos placebo) y que se asocian con el grado en que ...

Discusión

Las teorías existentes sobre la dopamina se centran en su papel en el aprendizaje de recompensa, donde se piensa que la dopamina media una señal de error de predicción utilizada para actualizar los valores de los estados y acciones que permiten la predicción y el control, respectivamente, durante la toma de decisiones. Estos modelos se han utilizado para ilustrar cómo el procesamiento anormal de la dopamina puede llevar a conductas impulsivas y adictivas, sobre la base de la experiencia (es decir, a través del aprendizaje) (Redish, 2004; Frank et al., 2007; Dagher y Robbins, 2009). Aquí, se exploró explícitamente un aspecto distinto de la impulsividad, basado en la relación del momento de las recompensas y su utilidad, independientemente de la retroalimentación y el aprendizaje. En la elección intertemporal, los tomadores de decisiones deben elegir entre recompensas de diferente magnitud y retraso. Esto se logra descontando el valor de las cantidades futuras de utilidad (de acuerdo con su retraso) para comparar sus valores actuales. En este marco, la dopamina podría potencialmente aumentar la elección impulsiva de dos maneras distintas (Pine et al., 2009), como sigue: como resultado de una mayor tasa de utilidad marginal marginal para las ganancias (lo que disminuiría el valor instantáneo subjetivo de mayor magnitud en relación con las recompensas de menor magnitud), o mediante un descuento temporal mejorado de futuras recompensas. Nuestros resultados sugieren que la dopamina tiene un impacto selectivo en la tasa de descuento, sin ningún efecto significativo en la función de utilidad. Además, estos resultados de comportamiento fueron respaldados de forma independiente por los datos de fMRI, ya que la diferencia clave generada por la l-dopa fue una modulación de las respuestas neuronales en regiones asociadas con el descuento de recompensas y, en consecuencia, su valor subjetivo general, sin efectos evidentes para la utilidad real de las recompensas. En resumen, este estudio proporciona evidencia de que la dopamina controla cómo se incorpora el momento de una recompensa en la construcción de su valor final. Esto sugiere un mecanismo novedoso a través del cual la dopamina controla la elección humana y, en consecuencia, rasgos como la impulsividad.

Nuestros resultados añaden peso a la sugerencia de que la impulsividad no es una construcción unitaria y, además, que diferentes subtipos de impulsividad pueden disociarse farmacológica y neurobiológicamente (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Los efectos de la dopamina solo fueron observables en la elección impulsiva, medida por el resultado / preferencia de la elección, pero no tuvieron impacto en la deliberación: "sujetar a sus caballos" (Frank et al., 2007): Esto ocurre cuando las opciones se valoran de cerca, generando decisión-conflicto (Botvinick, 2007; Pochon et al., 2008) también relacionado con la reflexión o la preparación impulsiva (Evenden, 1999; Clark et al., 2006).

Ningún estudio en humanos ha demostrado hasta ahora la propensión de la dopamina a mejorar la impulsividad temporal. Las manipulaciones previas de la dopamina en roedores han mostrado efectos inconsistentes en la elección intertemporal, y algunos han demostrado que el aumento de la dopamina conduce a una disminución de la elección impulsiva o que la atenuación de la dopamina conduce a un aumento (Richards et al., 1999; Cardinal et al., 2000; Wade et al., 2000; Isles et al., 2003; Winstanley et al., 2003; van Gaalen y otros, 2006; Bizot et al., 2007; Floresco et al., 2008), mientras que otros demuestran lo contrario, un efecto dependiente de la dosis o ningún efecto (Logue et al., 1992; Charrier y Thiébot, 1996; Evenden y Ryan, 1996; Richards et al., 1999; Cardinal et al., 2000; Isles et al., 2003; Helms et al., 2006; Bizot et al., 2007; Floresco et al., 2008). Una serie de factores pueden contribuir a estas discrepancias, a saber, si la manipulación se produce antes del aprendizaje o después del aprendizaje, si existe una señal durante el retraso, efectos del fármaco presináptico versus postsináptico, el paradigma utilizado, el fármaco utilizado / receptor dirigido, la participación de la serotonina. , y en particular la dosificación del fármaco. Los estudios en humanos de elección intertemporal han observado un aumento en el autocontrol (de Wit et al., 2002) o ningún efecto (Acheson y de Wit, 2008; Hamidovic et al., 2008) cuando mejora la función de la dopamina. La mayoría de estos estudios se complican por el uso de estimulantes monoaminérgicos como la anfetamina o el metilfenidato, que a menudo se piensa que disminuyen la impulsividad. Estos estudios podrían verse confundidos por la liberación concomitante de serotonina (Kuczenski y Segal, 1997), que también está implicado en la modulación de la elección intertemporal. Específicamente, se ha demostrado que mejorar la función de la serotonina puede reducir la impulsividad en la elección intertemporal o viceversa (Wogar et al., 1993; Richards y Seiden, 1995; Poulos et al., 1996; Ho et al., 1999; Mobini et al., 2000) y que la destrucción de las neuronas serotoninérgicas puede bloquear los efectos de la anfetamina (Winstanley et al., 2003). Además, se piensa que, sobre la base de la evidencia extensa, las dosis moderadas de anfetamina reducen la neurotransmisión de dopamina a través de los efectos presinápticos, lo que puede explicar sus efectos dependientes de la dosis en muchos estudios previos, así como su eficacia terapéutica (en dosis moderadas) en una supuestamente TDAH hiperdopaminérgico (Seeman y Madras, 1998, 2002; Solanto, 1998, 2002; Solanto et al., 2001; de Wit et al., 2002). La l-Dopa no se ha utilizado anteriormente para afectar la elección impulsiva y quizás ofrece una evidencia más convincente y directa del papel de la dopamina. Aunque la l-dopa puede producir aumentos de la noradrenalina y no se comprende bien su modo de acción preciso, no se cree que la noradrenalina desempeñe un papel importante en la regulación de la elección intertemporal (van Gaalen y otros, 2006). Además, es posible que la l-dopa haya causado efectos subjetivos que no fueron detectados por las escalas subjetivas utilizadas aquí.

Es probable que nuestra incapacidad para encontrar una reducción correspondiente en la impulsividad en relación con el placebo con la administración del supuesto antagonista dopaminérgico haloperidol refleje una serie de factores. Estos incluyen efectos farmacológicos o dosis inespecíficos y generalizados del haloperidol; algunos estudios indican que, paradójicamente, el haloperidol puede estimular la dopamina en pequeñas dosis, debido a los efectos presinápticos sobre el autorreceptor D2 (Frank y O'Reilly, 2006). Además, los efectos subjetivos causados ​​por el medicamento, incluida la reducción del estado de alerta, pueden haber hecho que los datos sean más ruidosos. Otros estudios deberían usar antagonistas de dopamina más específicos para evaluar si una reducción en la función de la dopamina puede disminuir la impulsividad en los humanos.

Se sabe que la dopamina tiene un efecto dominante en los comportamientos primitivos de recompensa, como el enfoque y la consumación (Parkinson et al., 2002). Tales efectos son consistentes con un papel amplio en la construcción de la importancia del incentivo (Berridge, 2007; Robinson y Berridge, 2008) y son más difíciles de explicar en términos de aprendizaje, per se. La mediación de respuestas no condicionadas y condicionadas por la dopamina se relaciona con el concepto de impulsividad pavloviana, donde las respuestas asociadas con valores primarios e innatos forman un conjunto de acciones simple, evolutivamente especificado, que opera junto con otros mecanismos de control, como a veces en competencia, acción basada en objetivos y dirigida (Dayan et al., 2006; Seymour et al., 2009). Es importante destacar que estos "valores y acciones pavlovianas" son característicamente dependientes de la proximidad espacial y temporal a las recompensas y, como tal, proporcionan un posible mecanismo a través del cual la dopamina podría controlar la tasa aparente de descuento temporal. Si tal proceso subyace a la impulsividad inducida por dopamina en esta tarea, entonces sugeriría que este sistema de respuesta innata (pavloviana) funciona en un contexto mucho más amplio que el que se aprecia actualmente, ya que las recompensas en esta tarea son recompensas secundarias que se producen a un mínimo de 1 semana. Esta explicación contrasta con la idea de una mejora dopaminérgica selectiva de un sistema (basado en áreas límbicas) que solo valora las recompensas a corto plazo (McClure et al., 2004). Dicha cuenta del sistema de duelo sería difícil de conciliar con estudios anteriores (Kable y Glimcher, 2007; Pine et al., 2009), que sugieren que las áreas límbicas valoran las recompensas en todos los retrasos.

Dicha cuenta plantea importantes preguntas sobre la susceptibilidad dependiente de la amígdala a la impulsividad inducida por dopamina que observamos en nuestros datos. Aquí, la actividad de la amígdala en respuesta a D Covarió con el grado en que el comportamiento se volvió más impulsivo después de la l-dopa. En la transferencia pavloviana-instrumental (PIT), un fenómeno que depende de la conectividad entre la amígdala y el estriado (Cardinal et al., 2002; Seymour y Dolan, 2008), y cuya expresión se sabe que está modulada por la dopamina (Dickinson et al., 2000; Lex y Hauber, 2008), los valores de Pavlovian apetitivos aumentan respondiendo por recompensas. En particular, la susceptibilidad individual a esta influencia se correlaciona con la actividad de la amígdala (Talmi et al., 2008), sugiriendo que la amígdala podría modular la medida en que los valores de recompensa condicionados e incondicionados primarios influyen en la elección instrumental (basada en el hábito y dirigida hacia el objetivo). Si este es realmente el caso, entonces predice que la presentación concurrente e independiente de señales de recompensa durante la elección intertemporal podría provocar una impulsividad temporal mejorada a través de un mecanismo dependiente de la amígdala. Notamos evidencia de que las lesiones de la amígdala basolateral aumentan la impulsividad de elección en roedores (Winstanley et al., 2004b), una observación opuesta a lo que esperaríamos en base a los datos actuales. Por el contrario, se ha informado previamente que la actividad de la amígdala se correlaciona con la magnitud del descuento temporal en un estudio de IRMF (Hoffman et al., 2008). Estos temas proporcionan una base para futuras investigaciones que pueden probar sistemáticamente estas predicciones divergentes en humanos.

Por último, estos resultados hablan de un contexto clínico más amplio y ofrecen una explicación de por qué se observa un aumento en los comportamientos impulsivos y de riesgo en el síndrome de desregulación de la dopamina, la adicción y el TDAH, todos los cuales están asociados con estados hiperdopaminérgicos causados ​​por la inundación de dopamina estriatal o sensibilizaciónSolanto, 1998, 2002; Seeman y Madras, 2002; Berridge, 2007; Robinson y Berridge, 2008; Dagher y Robbins, 2009; O'Sullivan et al., 2009). En apoyo de esta tesis, Voon et al. (2009) encontraron que el estado de la medicación con dopamina en pacientes con EP con trastornos del control de impulsos se asoció con mayores tasas de descuento temporal. En conclusión, los resultados presentados aquí demuestran la capacidad de la dopamina para mejorar la impulsividad en los seres humanos y ofrecen una visión novedosa de su papel en la modulación de la elección impulsiva en el contexto del descuento temporal. Estos hallazgos sugieren que los humanos pueden ser susceptibles a períodos temporales de mayor impulsividad cuando los factores que aumentan la actividad de la dopamina, como las cualidades sensoriales de las recompensas, están presentes durante la toma de decisiones.

Material suplementario

información adicional

AGRADECIMIENTOS

Este trabajo fue financiado por una Subvención del Programa Wellcome Trust a RJD, y AP fue apoyado por una beca del Consejo de Investigación Médica. Agradecemos a K. Friston, J. Roiser y V. Curran por su ayuda con la planificación y los análisis, y por las discusiones perspicaces.

Referencias

  1. Acheson A, de Wit H. Bupropion mejora la atención pero no afecta el comportamiento impulsivo en adultos jóvenes sanos. Exp Clin Psicofarmacol. 2008; 16: 113 – 123. ElPubMed]
  2. Ainslie G. Recompensa especiosa: una teoría conductual de la impulsividad y el control de los impulsos. Psychol Bull. 1975; 82: 463 – 496. ElPubMed]
  3. Berridge KC. El debate sobre el papel de la dopamina en la recompensa: el caso de la prominencia de los incentivos. Psicofarmacología. 2007; 191: 391–431. [PubMed]
  4. Bickel WK, Marsch LA. Hacia una comprensión económica del comportamiento de la dependencia de drogas: procesos de descuento por demora. Adiccion. 2001; 96: 73 – 86. ElPubMed]
  5. Bickel WK, Miller ML, Yi R, Kowal BP, Lindquist DM, Pitcock JA. Comportamiento y neuroeconomía de la adicción a las drogas: sistemas neuronales en competencia y procesos de descuento temporal. Dependen de drogas y alcohol 2007; 90 (Suppl 1): S85 – S91. ElArtículo gratuito de PMC] [PubMed]
  6. Bizot JC, Chenault N, Houzé B, Herpin A, David S, Pothion S, Trovero F. Methylphenidate reduce el comportamiento impulsivo en ratas Wistar juveniles, pero no en ratas Wistar, SHR y WKY adultas. Psicofarmacología (Berl) 2007; 193: 215 – 223. ElPubMed]
  7. Bond AJ, Lader MH. El uso de escalas analógicas en la valoración de sentimientos subjetivos. Br J Med. Psychol. 1974; 47: 211 – 218.
  8. Botvinick MM. Monitoreo de conflictos y toma de decisiones: conciliación de dos perspectivas sobre la función cingulada anterior. Cogn Afectan Behav Neurosci. 2007; 7: 356 – 366. ElPubMed]
  9. Cardenal RN, Robbins TW, Everitt BJ. Los efectos de la d-anfetamina, clordiazepóxido, alfa-flupentixol y las manipulaciones conductuales en la elección del refuerzo retardado señalizado y no marcado en ratas. Psicofarmacología. 2000; 152: 362 – 375. ElPubMed]
  10. Cardenal RN, Parkinson JA, Hall J, Everitt BJ. Emoción y motivación: el papel de la amígdala, el estriado ventral y la corteza prefrontal. Neurosci Biobehav Rev. 2002; 26: 321 – 352. ElPubMed]
  11. Cardenal RN, Winstanley CA, Robbins TW, Everitt BJ. Sistema corticostriatal límbico y refuerzo retardado. Ann NY Acad Sci. 2004; 1021: 33 – 50. ElPubMed]
  12. Charrier D, Thiébot MH. Efectos de las drogas psicotrópicas en la respuesta de la rata en un paradigma operante que involucra la elección entre reforzadores retrasados. Pharmacol Biochem Behav. 1996; 54: 149 – 157. ElPubMed]
  13. Clark L, Robbins TW, Ersche KD, Sahakian BJ. Reflexión de la impulsividad en usuarios actuales y anteriores de sustancias. Psiquiatría Biol. 2006; 60: 515 – 522. ElPubMed]
  14. Dagher A, Robbins TW. Personalidad, adicción, dopamina: conocimientos de la enfermedad de Parkinson. Neurona. 2009; 61: 502–510. [PubMed]
  15. Dalley JW, Mar AC, Economidou D, Robbins TW. Mecanismos neuroconductuales de la impulsividad: sistemas fronto-estriatales y neuroquímica funcional. Pharmacol Biochem Behav. 2008; 90: 250 – 260. ElPubMed]
  16. Dayan P, Niv Y, Seymour B, Daw ND. El mal comportamiento del valor y la disciplina de la voluntad. Redes neuronales. 2006; 19: 1153 – 1160. ElPubMed]
  17. Deichmann R, Gottfried JA, Hutton C, Turner R. EPI optimizado para estudios de RMF de la corteza orbitofrontal. Neuroimagen. 2003; 19: 430 – 441. ElPubMed]
  18. de Wit H, Enggasser JL, Richards JB. La administración aguda de d-anfetamina disminuye la impulsividad en voluntarios sanos. Neuropsicofarmacología. 2002; 27: 813 – 825. ElPubMed]
  19. Dickinson A, Smith J, Mirenowicz J. Disociación del aprendizaje pavloviano e instrumental bajo agonistas de la dopamina. Behav Neurosci. 2000; 114: 468 – 483. ElPubMed]
  20. Evenden JL. Variedades de impulsividad. Psicofarmacología. 1999; 146: 348 – 361. ElPubMed]
  21. Evenden JL, Ryan CN. La farmacología del comportamiento impulsivo en ratas: los efectos de los fármacos en la elección de respuesta con diferentes retrasos de refuerzo. Psicofarmacología. 1996; 128: 161 – 170. ElPubMed]
  22. Floresco SB, Tse MT, Ghods-Sharifi S. Regulación dopaminérgica y glutamatérgica de la toma de decisiones basada en el esfuerzo y el retraso. Neuropsicofarmacología. 2008; 33: 1966 – 1979. ElPubMed]
  23. Frank MJ, O'Reilly RC. Una explicación mecanicista de la función de la dopamina estriatal en la cognición humana: estudios psicofarmacológicos con cabergolina y haloperidol. Behav Neurosci. 2006; 120: 497–517. [PubMed]
  24. Frank MJ, Samanta J, Moustafa AA, Sherman SJ. Sostén a tus caballos: impulsividad, estimulación cerebral profunda y medicación en el parkinsonismo. Ciencia. 2007; 318: 1309 – 1312. ElPubMed]
  25. Hamidovic A, Kang UJ, de Wit H. Efectos de dosis agudas de pramipexol de bajas a moderadas sobre la impulsividad y la cognición en voluntarios sanos. J Clin Psychopharmacol. 2008; 28: 45 – 51. ElPubMed]
  26. Helms CM, Reeves JM, Mitchell SH. Impacto de la cepa y la D-anfetamina en la impulsividad (descuento por retraso) en ratones consanguíneos. Psicofarmacología (Berl) 2006; 188: 144 – 151. ElPubMed]
  27. Ho MY, Mobini S, Chiang TJ, Bradshaw CM, Szabadi E. Teoría y método en el análisis cuantitativo del comportamiento de "elección impulsiva": implicaciones para la psicofarmacología. Psicofarmacología. 1999; 146: 362 – 372. ElPubMed]
  28. Hoffman WF, Schwartz DL, Huckans MS, McFarland BH, Meiri G, Stevens AA, Mitchell SH. Activación cortical durante el descuento por demora en individuos dependientes de metanfetamina abstinentes. Psicofarmacología. 2008; 201: 183 – 193. ElArtículo gratuito de PMC] [PubMed]
  29. Islas AR, Humby T, Wilkinson LS. Medición de la impulsividad en ratones que utilizan una nueva tarea de refuerzo retrasado operante: efectos de las manipulaciones conductuales y la d-anfetamina. Psicofarmacología (Berl) 2003; 170: 376 – 382. ElPubMed]
  30. Kable JW, Glimcher PW. Los correlatos neurales del valor subjetivo durante la elección intertemporal. Nat Neurosci. 2007; 10: 1625 – 1633. ElArtículo gratuito de PMC] [PubMed]
  31. Kuczenski R, Segal DS. Efectos del metilfenidato en la dopamina extracelular, la serotonina y la norepinefrina: Comparación con la anfetamina. J Neurochem. 1997; 68: 2032 – 2037. ElPubMed]
  32. Los receptores Lex A, Hauber W. Dopamine D1 y D2 en el núcleo accumbens del núcleo y la cáscara median la transferencia instrumental-plovloviana. Aprender mem. 2008; 15: 483 – 491. ElArtículo gratuito de PMC] [PubMed]
  33. Logue AW, Tobin H, Chelonis JJ, Wang RY, Geary N, Schachter S. La cocaína disminuye el autocontrol en ratas: un informe preliminar. Psicofarmacología. 1992; 109: 245 – 247. ElPubMed]
  34. Mai JK, Assheuer J, Paxinos G. Atlas del cerebro humano. Ed 2 Academic; San Diego: 2003.
  35. Mazur JE. Un procedimiento de ajuste para estudiar el refuerzo retardado. En: Commons ML, Mazur JE, Nevin JA, Rachlin H, editores. Análisis cuantitativos del comportamiento. V. El efecto de la demora y de los eventos que intervienen en el valor de refuerzo. Lawrence Erlbaum; Hillsdale, NJ: 1987. pp. 55 – 73.
  36. McClure SM, Laibson DI, Loewenstein G, Cohen JD. Los sistemas neuronales separados valoran las recompensas monetarias inmediatas y retrasadas. Ciencia. 2004; 306: 503 – 507. ElPubMed]
  37. Mobini S, Chiang TJ, Al-Ruwaitea AS, Ho MY, Bradshaw CM, Szabadi E. Efecto del agotamiento de 5-hidroxitriptamina central en la elección intertemporal: un análisis cuantitativo. Psicofarmacología (Berl) 2000; 149: 313 – 318. ElPubMed]
  38. O'Sullivan SS, Evans AH, Lees AJ. Síndrome de desregulación de la dopamina: una descripción general de su epidemiología, mecanismos y manejo. Drogas del SNC. 2009; 23: 157-170. [PubMed]
  39. Parkinson JA, Dalley JW, Cardenal RN, Bamford A, Fehnert B, Lachenal G, Rudarakanchana N, Halkerston KM, Robbins TW, Everitt BJ. El agotamiento de la dopamina de Nucleus accumbens afecta tanto la adquisición como el rendimiento del comportamiento del abordaje pavloviano apetitivo: implicaciones para la función de la dopamina mesoaccumbens. Behav Brain Res. 2002; 137: 149 – 163. ElPubMed]
  40. Pine A, Seymour B, Roiser JP, Bossaerts P, Friston KJ, Curran HV, Dolan RJ. Codificación de la utilidad marginal a través del tiempo en el cerebro humano. J Neurosci. 2009; 29: 9575 – 9581. ElArtículo gratuito de PMC] [PubMed]
  41. Pochon JB, Riis J, Sanfey AG, Nystrom LE, Cohen JD. Imagen funcional del conflicto de decisión. J Neurosci. 2008; 28: 3468 – 3473. ElPubMed]
  42. Poulos CX, Parker JL, Le AD. La dexfenfluramina y 8-OHDPAT modulan la impulsividad en un paradigma de demora de recompensa: implicaciones para una correspondencia con el consumo de alcohol. Behav Pharmacol. 1996; 7: 395 – 399. ElPubMed]
  43. Redish AD. La adicción como proceso de cómputo salió mal. Ciencia. 2004; 306: 1944 – 1947. ElPubMed]
  44. Richards JB, Seiden LS. El agotamiento de la serotonina aumenta el comportamiento impulsivo en ratas. Soc. Neurosci Abstr. 1995; 21: 1693.
  45. Richards JB, Sabol KE, de Wit H. Efectos de la metanfetamina en el procedimiento de ajuste de la cantidad, un modelo de comportamiento impulsivo en ratas. Psicofarmacología. 1999; 146: 432 – 439. ElPubMed]
  46. Robinson TE, Berridge KC. La teoría de la sensibilización al incentivo de la adicción: algunos temas actuales. Philos Trans R Soc Lond B Biol Sci. 2008; 363: 3137 – 3146. ElArtículo gratuito de PMC] [PubMed]
  47. Sagvolden T, Sargento JA. Trastorno por déficit de atención / hiperactividad: desde disfunciones cerebrales hasta comportamiento. Behav Brain Res. 1998; 94: 1 – 10. ElPubMed]
  48. Seeman P, Madras BK. Medicamentos anti-hiperactivos: metilfenato y anfetamina. Mol psiquiatría. 1998; 3: 386 – 396. ElPubMed]
  49. Seeman P, Madras B. El metilfenidato eleva la dopamina en reposo, lo que disminuye la liberación de dopamina desencadenada por impulsos: una hipótesis. Behav Brain Res. 2002; 130: 79 – 83. ElPubMed]
  50. Seymour B, Dolan R. Emoción, toma de decisiones y la amígdala. Neurona. 2008; 58: 662 – 671. ElPubMed]
  51. Seymour B, Yoshida W, Dolan R. Aprendizaje altruista. Frente Behav Neurosci. 2009; 3: 23. ElArtículo gratuito de PMC] [PubMed]
  52. Solanto MV. Mecanismos neuropsicofarmacológicos de la acción de los medicamentos estimulantes en el trastorno por déficit de atención con hiperactividad: una revisión e integración. Behav Brain Res. 1998; 94: 127 – 152. ElPubMed]
  53. Solanto MV. Disfunción de la dopamina en el TDA / H: integración de la investigación de neurociencia clínica y básica. Behav Brain Res. 2002; 130: 65 – 71. ElPubMed]
  54. Solanto MV, Abikoff H, Sonuga-Barke E, Schachar R, Logan GD, Wigal T, Hechtman L, Hinshaw S, Turkel E. La validez ecológica de la aversión al retraso y la inhibición de la respuesta como medidas de impulsividad en AD / HD: un suplemento para El estudio de tratamiento multimodal NIMH de TDA / H. J Abnorm Child Psychol. 2001; 29: 215 – 228. ElPubMed]
  55. Talairach J, Tournoux P. Atlas estereotáxico co-planar del cerebro humano. Grupo de Publicaciones Thieme; Stuttgart: 1988.
  56. Talmi D, Seymour B, Dayan P, Dolan RJ. Transferencia pavloviana-instrumental humana. J Neurosci. 2008; 28: 360 – 368. ElArtículo gratuito de PMC] [PubMed]
  57. Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, Yamawaki S. La predicción de recompensas inmediatas y futuras recluta diferencialmente los lazos de los ganglios cortico-basales. Nat Neurosci. 2004; 7: 887 – 893. ElPubMed]
  58. van Gaalen MM, van Koten R, Schoffelmeer AN, Vanderschuren LJ. Participación crítica de la neurotransmisión dopaminérgica en la toma de decisiones impulsiva. Psiquiatría Biol. 2006; 60: 66 – 73. ElPubMed]
  59. Voon V, Reynolds B, Brezing C, Gallea C, Skaljic M, Ekanayake V, Fernandez H, Potenza MN, Dolan RJ, Hallett M. Impulsiva elección y respuesta en conductas de control de impulsos relacionadas con agonistas de dopamina. Psicofarmacología (Berl) 2009; 207: 645 – 659. ElArtículo gratuito de PMC] [PubMed]
  60. Wade TR, de Wit H, Richards JB. Efectos de los fármacos dopaminérgicos en la recompensa diferida como medida del comportamiento impulsivo en ratas. Psicofarmacología. 2000; 150: 90 – 101. ElPubMed]
  61. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. El agotamiento global de 5-HT atenúa la capacidad de la anfetamina para disminuir la elección impulsiva en una tarea de descuento por demora en ratas. Psicofarmacología. 2003; 170: 320 – 331. ElPubMed]
  62. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. Fraccionamiento de la impulsividad: efectos contrastantes del agotamiento de 5-HT central en diferentes medidas de comportamiento impulsivo. Neuropsicofarmacología. 2004a; 29: 1331 – 1343. ElPubMed]
  63. Winstanley CA, Theobald DE, Cardinal RN, Robbins TW. Los roles contrastantes de la amígdala basolateral y la corteza orbitofrontal en la elección impulsiva. J Neurosci. 2004b; 24: 4718 – 4722. ElPubMed]
  64. Winstanley CA, Eagle DM, Robbins TW. Modelos conductuales de impulsividad en relación con el TDAH: traducción entre estudios clínicos y preclínicos. Clin Psychol Rev. 2006; 26: 379 – 395. ElArtículo gratuito de PMC] [PubMed]
  65. Wogar MA, Bradshaw CM, Szabadi E. Efectos de las lesiones de las vías de 5-hidroxitriptaminérgicas ascendentes en la elección entre reforzadores retardados. Psicofarmacología. 1993; 113: 239 – 243. ElPubMed]