Dopamina, tempo e impulsividade en humanos (2010)

J Neurosci. 2010 xuño 30;30(26):8888-96. doi: 10.1523 / JNEUROSCI.6028-09.2010.

Piñeiro A1, Shiner T, Seymour B, Dolan RJ.

Información do autor

Abstracto

A neurotransmisión de dopamina desordenada está implicada na mediación de impulsividade en toda unha serie de comportamentos e trastornos, como a adicción, o xogo compulsivo, o trastorno por déficit de atención e hiperactividade e a síndrome de desregulación de dopamina. Mentres que as teorías existentes sobre a función de dopamina resaltan mecanismos baseados na aprendizaxe de recompensa aberente ou a desinhibición do comportamento, non ofrecen unha conta adecuada da hipersensibilidade patolóxica ao atraso temporal que constitúe un fenotipo de comportamento crucial visto nestes trastornos. Aquí ofrecemos evidencias de que o papel da dopamina no control da relación entre o momento das futuras recompensas e o seu valor subxectivo pode cubrir este baleiro explicativo. Usando unha tarefa de elección intertemporal, demostramos que a actividade farmacológica de dopamina aumenta a impulsividade aumentando a diminución da influencia do aumento do atraso no valor da recompensa (desconto temporal) e da súa correspondente representación neural no estriado. Isto leva a un estado de exceso de descontos das recompensas temporalmente distantes, relativas a máis cedo. Así, os nosos resultados revelan un novedoso mecanismo polo cal a dopamina inflúe na toma de decisións humanas que pode dar conta de aberracións do comportamento asociadas a un sistema de dopamina hiperfuncional.

introdución

A perda característica de autocontrol e impulsividade asociada a unha función de dopamina aberrante é exemplificada por trastornos como a adicción, o trastorno por déficit de atención e hiperactividade (TDAH) e a síndrome de disregulación de dopamina (TDAH).Winstanley et al., 2006; Dagher e Robbins, 2009; O'Sullivan et al., 2009). Neste último, a terapia substitutiva de dopamina no tratamento da enfermidade de Parkinson (PD) fai que algúns pacientes sexan propensos a un comportamento compulsivo, que se manifesta como exceso de xogos de azar, compras, alimentación e outros comportamentos miopos. Non obstante, o amplo fenotipo de impulsividade que caracteriza estes comportamentos subsume unha diversidade de procesos de toma de decisións distintos que poden disociarse neurobiolóxica e farmacolóxicamente (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a, 2006; Dalley et al., 2008). Estes inclúen a falta de inhibición das respostas motoras prepotentes, o sobrepeso de recompensas en relación coas perdas, a falta de desaceleración fronte ao conflito de decisións e unha propensión a elixir máis pequeno -máis recompensas máis grandes.

En principio, algúns dos déficits mencionados poden estar relacionados con efectos dopaminérxicos a través do papel establecido da dopamina na aprendizaxe de recompensas (Redish, 2004; Frank et al., 2007; Dagher e Robbins, 2009). Non obstante, a impulsividade temporal (ou a elección): a preferencia por recompensas máis pequenas, máis cedo que maiores, debido ao excesivo desconto das recompensas futuras (Ainslie, 1975; Evenden, 1999; Ho et al., 1999; Cardinal et al., 2004) - é moito máis difícil de explicar en termos de aprendizaxe, aínda que segue a ser unha característica importante da suposta impulsividade dopaminérxica. En realidade, as probas de laboratorio de elección intertemporal indican que os adictos e un subgrupo de pacientes con TDAH parecen ter taxas de desconto temporais anormalmente altas, preferindo fortemente recompensas menores (antes)Sagvolden e sarxento, 1998; Bickel and Marsch, 2001; Solanto et al., 2001; Winstanley et al., 2006; Bickel et al., 2007). Isto plantea a cuestión de se a dopamina ten un papel específico no cálculo de como a proximidade temporal dunha recompensa relaciónase co seu valor subxectivo (é dicir, a taxa de desconto temporal), independentemente da súa contribución establecida para premiar a aprendizaxe.

Para investigar se a dopamina modula a codificación dependente do tempo do valor, administramos a precursora de dopamina l-dopa, o antagonista da dopamina haloperidol e o placebo a voluntarios sans que realizan unha tarefa de elección intertemporal. A tarefa requiría que as persoas fixesen eleccións xenuínas entre diferentes cantidades de diñeiro, ofrecidas en períodos de tempo variables, principalmente na elección de recompensas monetarias máis pequenas, máis cedo ou máis tarde. Estas opcións están ben caracterizadas por modelos que incorporan tanto os efectos de desconto do tempo como os efectos de desconto de aumentar a magnitude da recompensa (diminución da utilidade marginal) (Pine et al., 2009). En consecuencia, a utilidade descontada ou o valor subxectivo dunha recompensa atrasada está determinada polo produto do factor de desconto (un número entre cero e un) e a utilidade da recompensa. Se a dopamina modula a elección dun individuo nesta tarefa, pode reflectir un cambio na taxa de desconto ou na concavidade / convexidade da utilidade (ver Materiais e métodos), unha distinción que puidemos sondear aquí tanto a nivel de comportamento como neurofisiolóxico. imaxe de resonancia magnética funcional (RMN). Ademais, avaliamos se a dopamina tivo algún efecto na taxa de desaceleración xerada polo conflito de decisión (Frank et al., 2007; Pochon et al., 2008) para distinguir influencias globais e discretas da impulsividade.

Materiais e Métodos

Usamos fMRI mentres que as persoas escolleron entre dúas opcións presentadas en serie de diferente magnitude (de £ 1 a £ 150) e atraso (desde a semana 1 ata o ano 1) (Fig 1). Cada suxeito realizou a tarefa en tres ocasións separadas (relacionadas coas tres afeccións ás drogas). Estas opcións eran a miúdo opcións máis pequenas (antes que maiores). Unha das opcións dos suxeitos foi seleccionada ao azar ao final do experimento (en cada sesión experimental) e pagouse por real (é dicir, na data futura especificada) mediante transferencia bancaria. Usamos as opcións dos suxeitos para avaliar o grao de desconto tanto pola magnitude como polo tempo. Avaliamos un modelo que combinaba unha función de utilidade (convertendo a magnitude en utilidade) cunha función de desconto hiperbólico estándar. En termos sinxelos, a función para a utilidade descontada (valor subxectivo) dunha recompensa atrasada (V) é igual a D × U onde D é un factor de desconto entre 0 e 1 e U é utilidade descontada. D normalmente é unha función hiperbólica do atraso da recompensa e incorpora o parámetro da taxa de desconto (K), que determina a rapidez con que desvaloriza as recompensas futuras. U é (normalmente) unha función cóncava da magnitude dunha recompensa e depende dun parámetro individual (r) que determina a concavidade / convexidade da función, ou a taxa de diminución da utilidade marginal de ganancias e, consecuentemente, o valor instantáneo do maior en relación á menor recompensa. Canto maior é K or r, máis probablemente o individuo elixa a opción máis cedo e, polo tanto, o máis impulsivo é o individuo (Ho et al., 1999; Pine et al., 2009). De acordo coa teoría da utilidade, a elección vén determinada polo principio de maximización da utilidade polo que se selecciona a opción coa maior utilidade con desconto.

figura 1 

Deseño de tarefas. Aos individuos recibiu un conxunto de opcións binariais intertemporais 220, principalmente entre recompensas menores –más tarde e máis grandes–, que variaron en cantidades de £ 1- £ 150 con atrasos asociados ás semanas 1 – 52. Nota ...

os participantes

No experimento incluíronse catorce voluntarios sanos e dereitos (machos 6; femias 8; idade media, 21; rango, 18-30). Os suxeitos foron preestimados para excluír aqueles con antecedentes de enfermidades neurolóxicas ou psiquiátricas. Todos os suxeitos deron consentimento informado e o estudo foi aprobado polo comité de ética de University College London. Un tema abandonou o estudo despois da primeira sesión e non se incluíu nos resultados. Outro non completou a sesión final (placebo) no escáner, pero os seus datos de comportamento de todas as sesións e datos de imaxes de dúas sesións incluíronse nos resultados.

Procedemento e descrición da tarefa

Cada tema foi probado en tres ocasións distintas. Á súa chegada a cada ocasión, recibíuselles unha folla de instrucións para explicar como se aplicaría a cegadora de drogas. Logo completaron unha escala analóxica visual (Bond e Lader, 1974) que miden estados subxectivos como a alerta e posteriormente recibiron un sobre que contiña dúas pílulas que eran 1.5 mg de haloperidol ou placebo. Unha hora e media despois de tomar o primeiro conxunto de pílulas, aos suxeitos recibíuselle outro sobre que contiña dúas pílulas que foron Madopar (que contén 150 mg de l-dopa) ou placebo. Os comprimidos placebo (vitamina C ou multivitamínicos) non se podían distinguir dos medicamentos. En total, cada suxeito recibiu unha dose de Madopar nunha sesión, unha dose de haloperidol noutro, e nunha sesión os dous conxuntos de comprimidos eran placebo. A orde de cada condición de fármaco en relación á sesión de probas foi compensada entre os suxeitos e era descoñecida para o experimentador para conseguir un deseño en dobre cego. As probas comezaron 30 min despois da inxestión do segundo conxunto de comprimidos. Os calendarios tiñan como obxectivo alcanzar unha concentración plasmática máxima do fármaco aproximadamente á metade das probas. Despois das probas, os suxeitos completaron outra escala analóxica (idéntica). Non se produciron dúas sesións de probas dentro da semana 1 un do outro.

A tarefa de comportamento foi na maior parte descrita por Pine et al. (2009). Cada proba consistía nunha elección entre unha recompensa máis pequena e unha recompensa posterior. A elección presentouse en serie, en tres etapas (Fig 1). As dúas primeiras fases consistiron na presentación dos detalles de cada opción, é dicir, a magnitude da recompensa en libras eo atraso no seu recibo en meses e semanas. Tras a presentación das opcións, unha terceira pantalla pediulle ao suxeito que escolla entre a opción 1 (a opción presentada primeiro) ou a opción 2, mediante unha caixa de botóns, usando a súa man dereita. Un atraso de 3 seguiu cada unha das tres fases. A elección só podería facerse durante a presentación da pantalla de elección da 3. Unha vez que se fixo unha elección, a opción elixida foi resaltada en azul. Se hai tempo suficiente, o suxeito podería cambiar de mente. Houbo un atraso de 1-4 s despois da fase de elección, seguido da presentación dunha cruz de fixación para 1 s.

O experimento consistiu nun total de ensaios 200. A opción 1 foi a recompensa máis pequena-máis cedo en 50% dos ensaios. Ademais, incluímos outros ensaios de "captura" de 20, onde unha das opcións era maior en valor e dispoñible antes do outro. Estes ensaios de captura producíronse aproximadamente cada décimo xuízo e permitíronnos saber de quão ben os suxeitos se concentraban na tarefa, baixo a suposición de que a norma era preferir a recompensa máis grande -máis nestas eleccións. Cada tema recibiu a mesma variedade de opcións en cada sesión de probas (é dicir, cada condición de medicamento), con excepción dos dous primeiros suxeitos aos que se lles deu un conxunto diferente de opcións na súa primeira sesión de probas. Os valores das opcións creáronse utilizando magnitudes xeradas aleatoriamente de £ 1 a £ 150 en unidades de £ 1 e atrasos que van desde a semana 1 ata o ano 1 en unidades de semanas individuais (pero presentadas como un número de meses e semanas), de novo cun distribución aleatoria. Esta natureza aleatoria dos valores axudou na ortogonalización da magnitude e do atraso. Para crear opcións entre recompensas menores –más tarde ou maiores- introducimos a restricción de que a opción con maior magnitude debería atrasarse máis que a menor, e viceversa para os ensaios de captura. Os suxeitos foron asignados a unha das dúas matrices de selección dependendo das súas respostas nos ensaios de práctica na súa primeira sesión. Isto fíxose para combinar as opcións presentadas co nivel de impulsividade do suxeito.

O pagamento realizouse mediante unha lotería para seleccionar un xuízo de cada sesión de proba. Para impoñer a validez ecolóxica, utilizamos un sistema de pago que aseguraba que todas as opcións se realizarían de xeito realista, con consecuencias realistas. É crucial para este deseño a selección aleatoria dunha das opcións feitas durante o experimento, con pago real da opción elixida para esa elección. Isto logrouse mediante unha transferencia bancaria feita no momento asociado e consistente na cantidade da opción seleccionada. A selección de pagamentos realizouse mediante unha lotería manual despois de completar todas as probas. A lotería contiña bolas numeradas 220, cada unha delas representando unha proba única da tarefa. A pelota seleccionada correspondía ao xuízo premiado para esa sesión de probas. A magnitude e atraso da opción que o suxeito elixiu no xuízo seleccionado foi determinada e outorgada mediante transferencia bancaria. Así, o pago recibido de cada suxeito foi determinado por unha combinación da lotería e as opcións que tomaron: unha manipulación que asegurou aos suxeitos trataba todas as opcións como reais. O sistema de pagamentos foi deseñado para que, de media, cada suxeito recibise £ 75 por sesión. Non se outorgou ningún outro pagamento para a participación no experimento.

Antes de que os suxeitos fosen levados ao escáner, mostráronlles a máquina de lotería e déronse unha explicación sobre como se implementaría a transferencia bancaria, para tranquilizarlles que o sistema de pago e selección era xenuíno. Tras unha curta práctica de seis ensaios, foron levados ao escáner onde realizaron dúas sesións de ensaios 110 cada un, durando en total ~ 50 min.

Procedemento de imaxe

A imaxe funcional levouse a cabo mediante un escáner de resonancia magnética só de cabeza 3-tesla Siemens Allegra para adquirir as imaxes planas eco-planas T2 * (EPI) con contraste dependente do nivel de osíxeno no sangue (BOLD). Usamos unha secuencia deseñada para optimizar a sensibilidade funcional no córtex orbitofrontal (Deichmann et al., 2003). Esta consistía en adquisición inclinada nunha orientación oblicua a 30 ° á liña cingulada-cingulada anterior AC-PC, así como a aplicación dun pulso de preparación cunha duración de 1 ms e amplitude de −2 mT / m na selección de porción dirección. A secuencia permitiu adquirir as franxas axiais 36 de espesor 3 mm e a resolución no plano 3 mm cun tempo de repetición (TR) de 2.34 s. Os suxeitos foron colocados nun ligero cabeleiro dentro do escáner para limitar o movemento da cabeza durante a adquisición. Os datos de imaxe funcional adquiríronse en dúas sesións de volume separadas 610. Tamén se adquiriron unha imaxe estrutural ponderada con T1 e mapas de campo para cada tema despois das sesións de probas.

Análise do comportamento

Para obter unha medida global de elección impulsiva, contamos o número de opcións máis tempranas escollidas dos ensaios 220, baixo cada condición de medicamento, para cada suxeito. Estes procedementos excluíronse dos ensaios nos que non se fixo unha resposta. Por exemplo, se un suxeito non respondeu a tempo para o número de proba 35 no estado placebo, este xuízo foi excluído do conteo nas outras dúas condicións para ese suxeito. Isto asegurou que as comparacións se fixeron de xeito experimental (xa que se daba o mesmo conxunto de ensaios en cada sesión de probas) e calquera efecto da droga nesta medida non estaba relacionado co número de opcións feitas en cada condición. Utilizouse un ANOVA de medidas repetidas para buscar as diferenzas nesta medida global en todas as condicións da droga.

Estimación de parámetros

Implementamos a regra de decisión de softmax para asignar unha probabilidade (PO1 para a opción 1) a cada opción da elección dado o valor da opción (VO1 para a opción 1) pola cal

POi=e(VOi/β)e(VO1/β)+e(VO2/β).
(1)

VOi representa o valor dunha opción (é dicir, unha recompensa atrasada) de acordo cun determinado modelo de valoración de opcións (ver abaixo). O β O parámetro representa o grao de estocasticidade do comportamento do suxeito (é dicir, a sensibilidade ao valor de cada opción).

Usamos un modelo de utilidade con desconto de valoración de opcións, que reportamos anteriormente (Pine et al., 2009) como un axuste preciso ás opcións do suxeito nesta tarefa. Este modelo afirma que a utilidade descontada (V) dunha recompensa de magnitude (M) e cun atraso (d) pode expresarse como segue:

V=D(d)U(M)=1-e(-rM)r(1+Kd),
(2)

onde

D=11+Kd

U=1-e(-rM)r.

D pódese considerar como o factor de desconto: o factor dependente do atraso (entre 0 e 1) polo cal a utilidade descontada nunha moda hiperbólica estándar (Mazur, 1987). O parámetro da taxa de desconto K cuantifica a tendencia dun individuo a descontar o futuro de tal xeito que unha persoa cun alto K desvaloriza rapidamente as recompensas mentres se fan máis distantes. U é unha utilidade non descontada e réxese pola magnitude de cada opción e r, un parámetro libre que regula a curvatura da relación. Canto maior é o valor de r, a función de utilidade máis cóncava e onde r é negativo, a función de utilidade é convexa. Canto maior é r (por riba de cero), maior é a taxa de diminución da utilidade marginal e o máis impulsivo é o individuo na elección. Teña en conta que segundo os modelos tradicionais de valoración da elección intertemporal, que non teñen en conta o desconto de magnitude (Mazur, 1987), a impulsividade, definida pola tendencia a elixir a opción menor –máis antes- é unha función de K e así se pode esperar que os dous se correlacionen perfectamente. Por iso, K A miúdo considérase unha medida deste trazo. Non obstante, xa se demostrou que o desconto de magnitude determina o resultado da elección en animais e seres humanos (Ho et al., 1999; Pine et al., 2009), preferimos equiparar a impulsividade coa conduta de elección xa que a taxa de desconto temporal non se correlaciona perfectamente con esta medida clave.

Para calcular os parámetros de máxima verosimilitud para cada modelo, así como unha medida do axuste, empregouse a estimación de máxima verosimilitud. Cada un dos parámetros (incluíndo β) permitíuselle variar libremente. Para cada tema, calculouse a probabilidade de cada unha das opcións 220 escollidas entre as opcións 220 (incluídas as probas de capturas), utilizando a fórmula softmax e implementada con funcións de optimización en Matlab (MathWorks). A probabilidade de log foi calculada empregando a probabilidade da opción elixida no xuízo t (PO(t)) de Eq. 1 tal que

lnL=ΣtlnPO(t).
(3)

Usouse un ANOVA de medidas repetidas para probar as diferenzas na taxa de desconto (K) ea concavidade da utilidade (r) a través de condicións de drogas.

Para os efectos das análises de tempo de reacción e de imaxe, realizouse unha nova estimación na cal agrupáronse todas as eleccións de cada suxeito en cada condición (coma se fose feita por un suxeito) e modeladas como un suxeito canónico para estimar os valores dos parámetros canónicos (usando o procedemento de axuste anterior, estimación de parámetros). Isto foi feito para reducir o ruído asociado co procedemento de axuste no nivel dunha soa materia. Ademais, non desexamos construír as diferenzas de comportamento nos nosos modelos de regresión ao analizar os datos de fMRI, xa que buscamos evidencias independentes dos nosos resultados de comportamento.

Análise de imaxes

A análise de imaxe realizouse usando SPM5 (www.fil.ion.ucl.ac.uk/spm). Para cada sesión, descartáronse as cinco primeiras imaxes para dar conta dos efectos de equilibrio de T1. As imaxes restantes foron reagrupadas ao sexto volume (para corrixir os movementos da cabeza), usando planos de campo inutilizados, normalizados espacialmente no modelo estándar cerebral do Instituto Neurológico de Montreal (MNI) e suavizados espacialmente cun núcleo gaussiano tridimensional de 8 mm completo. ancho a metade máximo (FWHM) (e resampling, resultando XXUMX × 3 × 3 mm voxels). Os artefactos de baixa frecuencia elimináronse usando un filtro de paso alto 3 / 1 Hz e a corrección temporal da autocorrelación intrínseca da serie temporal fMRI foi corrixida mediante un prewhilding usando un proceso AR (128).

Os mapas de contraste dun só suxeito xeráronse usando a modulación paramétrica no contexto do modelo lineal xeral. Realizamos unha análise, examinando a varianza na resposta BOLD rexional atribuível a diferentes regresores de interese: U, De V para todas as opcións en todas as condicións de drogas. Isto permitiu identificar rexións implicadas na avaliación e integración de diferentes compoñentes de valor (no estado placebo) e para buscar calquera diferenza nestas activacións en condicións farmacolóxicas.

U, De V para cada opción (dous por xuízo) calculáronse utilizando as estimacións de parámetros canónicos (K r) no contexto do noso modelo de utilidade con desconto e implicado na función de resposta hemodinámica canónica (HRF) ao comezo de cada opción. Todos os inicios foron modelados como funcións de stick e todos os regresores do mesmo modelo foron ortogonalizados (nas ordes indicadas anteriormente) antes da análise por SPM5. Para corrixir os artefactos de movemento, os seis parámetros de realineación foron modelados como regresores de ningún interese en cada análise. Nunha análise adicional eliminamos calquera confusión potencial relacionada coa ortogonalización dos regresores na nosa análise de fMRI ao implementar outro modelo de regresión pero agora eliminando o paso de ortogonalización. Aquí permitíuselles aos regresores competir para a varianza de xeito que neste modelo máis conservador elimináronse todos os compoñentes de varianza compartidos, revelando só compoñentes únicos de U, De V. Baixo este modelo, observamos de novo as mesmas diferenzas en D V en condicións de drogas e sen diferenza U, aínda que a magnitude das diferenzas reduciuse.

No segundo nivel (análise de grupo) identificáronse rexións que mostraban unha modulación significativa por cada un dos regresores especificados no primeiro nivel mediante unha análise de efectos aleatorios do β imaxes dos mapas de contraste dun único suxeito. Incluímos o cambio na medida de impulsividade (diferenza no número máis cedo elixido) como covariable cando se realiza o contraste relacionado coas diferenzas nos ensaios de l-dopa e placebo. Informamos de resultados para as rexións onde o pico é o nivel de voxel t o valor correspondía p <0.005 (sen corrixir), cun tamaño de clúster mínimo de cinco. As coordenadas transformáronse da matriz MNI á matriz estereotaxica de Talairach e Tournoux (1988) (http://imaging.mrc-cbu.cam.ac.uk/imaging/MniTalairach).

As imaxes estruturais de T1 rexistráronse nas imaxes funcionales medias de EPI para cada suxeito e normalizáronse utilizando os parámetros derivados das imaxes EPI. A localización anatómica realizouse superponiendo a t mapas cunha imaxe estrutural normalizada promediada entre asuntos e con referencia ao atlas anatómico de Mai et al. (2003).

Datos de latencia de decisión

Para examinar o efecto do conflito de decisión (dificultade de elección) na latencia de decisións, calculamos unha medida de dificultade para cada unha das opcións 220 calculando a diferenza na utilidade con desconto ()V) das dúas opcións. Esta medida calculouse utilizando o modelo de utilidade con desconto e as estimacións de parámetros canónicos (polo mesmo motivo que se usaron nas análises de fMRI). Realizouse entón unha regresión lineal para modelar a relación entre a latencia de decisión para cada elección ea medida de dificultade. As estimacións dos parámetrosβs) entón utilizáronse como estatística resumida e realizouse unha análise de segundo nivel por medio dunha mostra t proba comparando βs contra cero. Isto realizouse por separado para o grupo en cada condición de drogas. Para probar as diferenzas na relación entre o conflito e a latencia en condicións farmacéuticas, usamos mostras emparelladas t probas.

Resultados

Primeiro analizamos os efectos da manipulación de fármacos no comportamento considerando a proporción de opcións máis pequenas –máis en relación ás maiores– posteriores escollidas, dun total de opcións 220 feitas en cada condición. Estes datos revelaron un marcado incremento no número de opcións máis tempranas escollidas na condición de d-l en relación ao placebo (significa 136 vs 110, p = 0.013) (Táboa 1, Fig 2). Sorprendentemente, este patrón observouse en todos os suxeitos nos que se podía facer esta comparación. Non houbo diferenzas significativas entre as condicións de haloperidol e placebo nesta disposición. Nota, a tarefa consistía na mesma matriz de elección en cada condición.

figura 2 

Comparacións de comportamento e estimacións de parámetros en condicións de placebo e l-dopa. a, Os suxeitos realizaron exactamente o mesmo conxunto de opcións (220) en todas as tres condicións de tratamento, pero máis frecuentemente elixiron o menor, máis cedo que o máis grande, máis tarde. ...
Táboa 1 

Resumo das conclusións do comportamento

A continuación utilizamos a estimación de máxima verosimilitud para atopar os parámetros máis adecuados (K r) para o modelo de utilidade descontado, para cada suxeito en cada condición, para determinar se un efecto específico sobre calquera destes parámetros mediu o aumento observado na impulsividade comportamental. Ao comparar os parámetros estimados que controlan a taxa de desconto e a concavidade de utilidade a través das condicións, atopouse un efecto específico de l-dopa sobre a taxa de desconto, sen efecto sobre a concavidade da utilidade (Táboa 1, Fig 2e Táboa complementaria 1, Dispoñible en www.jneurosci.org as material suplementario). Así, baixo L-Dopa, observouse unha taxa de desconto máis alta en relación ao placebo (p = 0.01), levando a unha maior depreciación das recompensas futuras. A modo de ilustración, empregando un parámetro canónico estimado en grupo para representar unha función de desconto para cada condición de medicamento, pódese ver que baixo o placebo requiría un atraso de ~ 35 semanas para que unha recompensa 150 tivese un valor presente (subxectivo) de £ 100, con todo, baixo l-dopa a mesma depreciación ocorreu cun atraso de só semanas 15 (Fig 2). As estimacións de parámetros canónicos utilizados para os análises de imaxe foron 0.0293 para K e 0.0019 para r (todos os valores de K informados calcúlanse a partir de unidades de tempo de semanas).

Dacordo con Pine et al. (2009), as estimacións de parámetros para cada suxeito (a través de condicións) foron superiores a cero, revelando tanto un efecto significativo do desconto temporalp <0.001) e a non linealidade (concavidade) de utilidade instantánea (p <0.05). Nótese que a diferenza dos modelos tradicionais de elección intertemporal (Mazur, 1987), onde o resultado da elección é só unha función de K, o modelo utilizado aquí implica que o número de opcións máis tempranas elixidas tamén depende da r parámetro (ver materiais e métodos)Pine et al., 2009) e, polo tanto, K non é en si mesma unha medida pura da impulsividade de elección. Ademais, a precisión dos parámetros estimados depende tanto da estocasticidade como da consistencia das respostas dos suxeitos. Por exemplo, os parámetros estimados no ensaio placebo do suxeito 13 foron anómalos en relación co resto dos datos (Táboa complementaria 1, Dispoñible en www.jneurosci.org as material suplementario), indicando que este asunto podería facer opcións inconsistentes nesta sesión. Ao comparar entre as materias, teña en conta que o número de opcións máis recentes feitas tamén depende da elección que define o suxeito recibido (un de dous).

Ademais, examinamos se unha desaceleración das latencias de decisión era aparente cando as opcións se facían cada vez máis difíciles - consecuencia do aumento da proximidade nos valores das opcións - e se existían diferenzas de grupo nesta medida. Realizamos unha regresión para avaliar a relación entre a latencia de decisión e a dificultade de cada elección medido pola diferenza na utilidade con desconto ()V) entre as dúas opcións de elección, calculadas empregando os valores dos parámetros estimados. En placebo (p <0.001), l-dopa (p <0.001) e haloperidol (p <0.001) condicións, as latencias de decisión dos suxeitos aumentaron como ΔV quedou máis pequeno, é dicir, como a diferenza no valor subxectivo entre as opcións diminuíu. Non obstante, non se observou ningunha diferenza global nesta medida en todas as condicións da droga. Isto indica que, a diferenza do resultado da elección, a manipulación de dopamina non influíu na cantidade de tempo dado para pesar unha decisión, ou a capacidade de "manter os cabalos" e corrobora a suxestión de que a impulsividade non é unha construción unitaria (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Esta observación concorda cun descubrimento previo de que o estado da medicación de dopamina na PD non estaba asociado co cambio das latencias de decisión nunha tarefa de elección diferente (Frank et al., 2007).

Os efectos subxectivos analizáronse comparando os cambios nos tres factores identificados por Bond and Lader (1974), a saber, estado de alerta, satisfacción e calma, en relación co cambio nas puntuacións observadas no placebo. Atopáronse diferenzas no estado do haloperidol fronte ao placebo, onde os individuos tiñan menos alerta baixo o haloperidol (p <0.05).

Para establecer como se representou a impulsividade reforzada baixo a l-dopa a nivel neural, aplicamos tres regresores paramétricos (ortogonalizados), U, De V, asociada á presentación de cada opción, segundo o ditado polo noso modelo, aos datos de imaxe cerebral. Os regresores creáronse para cada suxeito, en cada condición, utilizando valores de parámetros canónicos estimados a partir das opcións de todos os suxeitos ao longo de todas as sesións, nunha proba da hipótese nula de que a actividade cerebral non difire entre condicións.

Nunha análise preliminar, analizamos as correlacións para estes tres regresores no estado placebo para replicar resultados anteriores (Pine et al., 2009). Os nosos resultados (Resultados complementarios, Dispoñible en www.jneurosci.org as material suplementario) foron consistentes cos mostrados anteriormente D, Ue V todos correlacionados de forma independente coa actividade no núcleo caudado (entre outras rexións). Isto soporta unha visión xerárquica e integrada da valoración de opcións onde os subcomponentes do valor están codificados e despois combinados para proporcionar un valor global utilizado para orientar a elección.

As análises de fMRI críticas centráronse na diferenza de comportamento clave na valoración de opcións baixo l-dopa en comparación coas condicións placebo. Cando se compara a actividade neural U, De V, atopáronse diferenzas significativas para ambos D V, un achado que coincida co resultado do comportamento. En concreto, observamos unha actividade mellorada nas rexións relacionadas co factor de desconto D baixo l-dopa en relación ás condicións placebo (Fig 3a Resultados complementarios, Dispoñible en www.jneurosci.org as material suplementario) e ningún efecto do haloperidol (é dicir, os coeficientes de regresión no trastorno placebo e haloperidol non difiren significativamente). Estas rexións incluíron o estriado, a insula, o cingulado subxenual e as cortizas orbitofrontales laterais. Estes resultados mostran que a diminución característica da actividade destas rexións como recompensas faise máis tardía (ou aumenta a medida que se achegan temporalmente) (McClure et al., 2004; Tanaka et al., 2004; Kable e Glimcher, 2007; Pine et al., 2009) (Ver tamén Resultados complementarios para placebo, dispoñible en www.jneurosci.org as material suplementario) é máis marcada na l-dopa en relación ás condicións de placebo, de forma que se compara co achado do comportamento, onde a l-dopa aumentou a preferencia por unha recompensa máis cedo aumentando a taxa de desconto, convertendo así as recompensas máis rápidas nas recompensas posteriores. Ademais, do mesmo xeito que non houbo diferenza significativa no estimado r parámetro a través destes ensaios, non observamos ningunha diferenza significativa en U actividade entre os ensaios de L-dopa e placebo, indicando que l-dopa non afectou a utilidade de codificación de recompensa.

figura 3 

Diferenzas na actividade neural entre condicións de l-dopa e placebo en resposta ao valor subxectivo e ao factor de desconto (mapas paramétricos estatísticos e estimacións de parámetros). a, Rexións que se correlacionaron co factor de desconto (D) (é dicir, premiar a proximidade) ...

Estudos anteriores (Kable e Glimcher, 2007; Pine et al., 2009), así como unha análise do grupo placebo só, implican rexións estriais, entre outras, na codificación de utilidades descontadas (V). Ao comparar rexións que se correlacionan con V, observouse unha diminución da actividade nas rexións frontales caudadas, insulas e laterais inferiores, en l-dopa en comparación coas condicións placebo (Fig 3b Resultados complementarios, Dispoñible en www.jneurosci.org as material suplementario). Este resultado indica que para unha recompensa dunha determinada magnitude e atraso, a actividade reducida nas rexións que codifican o valor subxectivo (utilidade descontada) foi xerada por l-dopa. Esta redución asociouse co aumento do desconto temporal e levou a un aumento na selección de opcións menores –más tarde (impulsivas) nesta condición en relación ao placebo.

Debido a que os datos de fMRI usaron o mesmo conxunto de parámetros canónicos (en todas as condicións, probando a hipótese nula de que son todos iguais), estes resultados coinciden cos resultados comportamentais nos que o aumento da taxa de desconto en l-dopa conduce a unha redución de D, levando a unha correspondente redución en V e, polo tanto, unha maior preferencia relativa para as recompensas máis tempranas. Teña en conta que se a utilidade codificada pola dopamina só descendeu, poderíase prever o resultado oposto, con maior actividade na condición de d-dopa.

Inspección dos resultados do comportamento (Táboa 1, Fig 2) revelou que un aumento da impulsividade tras a d-dopa expresouse en maior medida nalgúns suxeitos que noutros. Con esta base, realizamos unha análise de covarianzas sobre os contrastes anteriores calculando unha diferenza na cantidade de opcións máis tempranas elixidas nos ensaios de placebo e l-dopa. Canto maior é esta métrica, maior será o aumento de impulsividade (taxa de desconto) inducido por l-dopa. Regresando esta cantidade como comparativa no comparativo D en l-dopa menos condicións placebo (Fig 3a), atopamos unha correlación significativa coa actividade na amígdala (bilateralmente) (Fig 4). Porque a diferenza na puntuación de elección entre as persoas pode estar parcialmente afectada polo feito de que os suxeitos foron asignados a un dos dous conxuntos posibles de elección, e para aumentar a potencia (podendo incluír máis suxeitos), repetimos esta análise, esta vez usando o diferenza na estimación K Valores dos ensaios de placebo a l-dopa. O resultado desta análise (ver Resultados complementarios, Dispoñible en www.jneurosci.org as material suplementario) demostrou de novo unha forte correlación positiva entre a actividade da amígdala eo grao de aumento en K de ensaios con placebo a l-dopa. Estes resultados suxiren que a susceptibilidade do suxeito individual a impulsividade baixo a influencia da l-dopa é modulada polo grao de resposta da amígdala á proximidade temporal da recompensa.

figura 4 

Variabilidade intersubjectiva no aumento da impulsividade tras l-dopa. a, Mapa paramétrico estatístico que mostra áreas que expresan unha sensibilidade global ao factor de desconto (en condicións de l-dopa menos placebo) e que covariáronse co grao en que ...

Conversa

As teorías existentes sobre a dopamina céntranse no seu papel na aprendizaxe de recompensas, onde se pensa que a dopamina media un sinal de erro de predicción usado para actualizar os valores de estados e accións que permiten a predicción e control, respectivamente, durante a toma de decisións. Estes modelos usáronse para ilustrar como o procesamento anormal de dopamina podería conducir a comportamentos impulsivos e adictivos, en base á experiencia (é dicir, a través da aprendizaxe) (Redish, 2004; Frank et al., 2007; Dagher e Robbins, 2009). Aquí, sinalouse explícitamente un aspecto distinto da impulsividade, baseado na relación do momento das recompensas e da súa utilidade, independentemente do feedback e da aprendizaxe. Na elección intertemporal, os tomadores de decisións deben elixir entre recompensas de diferente magnitude e atraso. Isto lógrase descontando o valor das cantidades futuras de utilidade (de acordo co seu atraso) para comparar os seus valores actuais. Neste marco, a dopamina podería aumentar a elección impulsiva de dúas formas distintas (Pine et al., 2009), como segue: como resultado dunha taxa aumentada de diminución da utilidade marginal de ganancias (que diminuiría o valor subjetivo instantáneo de maior magnitude en relación ás recompensas de menor magnitude), ou a través dun desconto temporal mellorado das futuras recompensas. Os nosos resultados suxiren que a dopamina afecta selectivamente a taxa de desconto, sen ningún efecto significativo na función de utilidade. Ademais, estes resultados do comportamento foron soportados de xeito independente polos datos de fMRI na medida en que a diferenza clave xerada pola l-dopa era unha modulación das respostas neurais en rexións asociadas ao desconto de recompensas e, consecuentemente, ao seu valor subxectivo xeral, sen efectos evidentes para a utilidade real de recompensas. En resumo, este estudo evidencia que a dopamina controla como se incorpora o momento da recompensa na construción do seu valor final. Isto suxire un novo mecanismo a través do cal a dopamina controla a elección humana e, en consecuencia, trazos como a impulsividade.

Os nosos resultados engaden peso á suxestión de que a impulsividade non é unha construción unitaria e ademais que diferentes subtipos de impulsividade poden disociarse farmacológicamente e neurobiológicamente (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Os efectos da dopamina só se puideron observar en opcións impulsivas medidas polo resultado / preferencia da elección, pero non afectaron á deliberación: "sostendo os cabalos" (Frank et al., 2007) - isto ocorre cando as opcións son moi valoradas, xerando conflitos de decisión (Botvinick, 2007; Pochon et al., 2008) tamén relacionado coa impulsividade da reflexión ou a preparación (Evenden, 1999; Clark et al., 2006).

Ningún estudo humano demostrou aínda a propensión da dopamina a mellorar a impulsividade temporal. As manipulacións anteriores de dopamina en roedores mostraron efectos inconsistentes na elección intertemporal, con algúns que demostran que a mellora da dopamina leva a unha diminución da elección impulsiva ou que a atenuación da dopamina leva a un aumento (Richards et al., 1999; Cardinal et al., 2000; Wade et al., 2000; Isles et al., 2003; Winstanley et al., 2003; van Gaalen et al., 2006; Bizot et al., 2007; Floresco et al., 2008), mentres que outros demostran o contrario, un efecto dependente da dose ou ningún efecto (Logue et al., 1992; Charrier e Thiébot, 1996; Evenden e Ryan, 1996; Richards et al., 1999; Cardinal et al., 2000; Isles et al., 2003; Helms et al., 2006; Bizot et al., 2007; Floresco et al., 2008). Unha serie de factores poden contribuír a estas discrepancias, a saber, se a manipulación ocorre antes da aprendizaxe ou o aprendizaxe posterior, se unha suxestión está presente durante o atraso, os efectos do medicamento presináptico versus os postsinápticos, o paradigma utilizado, o fármaco utilizado / receptor dirixido, a implicación da serotonina , e en particular a dosificación de fármacos. Os estudos humanos da elección intertemporal observaron un aumento no autocontrol (de Wit et al., 2002) ou sen efecto (Acheson e de Wit, 2008; Hamidovic et al., 2008) cando se mellora a función de dopamina. A maioría destes estudos vólvense complicados polo uso de estimulantes monoaminérxicos como a anfetamina ou o metilfenidato, que a miúdo se pensa que diminúen a impulsividade. Estes estudos poden confundirse coa liberación concomitante de serotoninaKuczenski e Segal, 1997), que tamén está implicado na modulación da elección intertemporal. Especificamente, demostrouse que mellorar a función da serotonina pode reducir a impulsividade na elección intertemporal ou viceversa (Wogar et al., 1993; Richards e Seiden, 1995; Poulos et al., 1996; Ho et al., 1999; Mobini et al., 2000) e que a destrución das neuronas serotoninérxicas pode bloquear os efectos da anfetamina (Winstanley et al., 2003). Ademais, crese que, a partir de probas extensas, as doses moderadas de anfetamina reducen a neurotransmisión de dopamina a través de efectos presinápticos, o que pode explicar os efectos dependentes da dose en moitos estudos anteriores, así como a súa eficacia terapéutica (en doses moderadas) TDAH hipotopaminérgicoSeeman e Madras, 1998, 2002; Solanto, 1998, 2002; Solanto et al., 2001; de Wit et al., 2002). L-Dopa non se usou anteriormente para afectar a elección impulsiva e quizais ofreza probas máis convincentes e directas sobre o papel da dopamina. Aínda que a l-dopa pode provocar aumentos de noradrenalina e o seu modo de acción preciso non se entende ben, non se cre que a noradrenalina xogue un papel importante na regulación da elección intertemporal (van Gaalen et al., 2006). Ademais, é posible que a l-dopa puidese causar efectos subjetivos que non foron recollidos polas escalas subxectivas utilizadas aquí.

É probable que o noso fracaso en atopar unha correspondente redución da impulsividade en relación ao placebo coa administración do suposto antagonista dopaminérxico haloperidol reflicta unha serie de factores. Estes inclúen efectos farmacolóxicos inespecíficos e xeneralizados ou dosificación de haloperidol; algúns estudos indican que o haloperidol pode paradoxalmente aumentar a dopamina en pequenas doses, debido a efectos presinápticos no autoreceptor D2 (Frank e O'Reilly, 2006). Ademais, os efectos subxectivos causados ​​pola droga, incluída a redución do estado de alerta, poden facer que os datos resulten máis ruidosos. Outros estudos deben usar antagonistas de dopamina máis específicos para avaliar se unha redución da función de dopamina pode diminuír a impulsividade en humanos.

Sábese que a dopamina ten un efecto dominante nos comportamentos de recompensa primitiva como a aproximación e a consumación (Parkinson et al., 2002). Estes efectos son consistentes cun papel importante na construción de potenciais de incentivos (Berridge, 2007; Robinson e Berridge, 2008) e son máis difíciles de explicar en termos de aprendizaxe, por si só. A mediación de respostas condicionadas e condicionadas pola dopamina relaciónase co concepto de impulsividade pavloviana, onde as respostas asociadas cos valores innatos primarios forman un conxunto de accións especificamente simple e evolutivamente operativo xunto con, e ás veces en competencia, con outros mecanismos de control, como o hábito acción baseada e dirixida por obxectivos (Dayan et al., 2006; Seymour et al., 2009). É importante destacar que estes "valores e accións pavlovianos" dependen característicamente da proximidade espacial e temporal das recompensas e, como tal, proporcionan un posible mecanismo polo cal a dopamina podería controlar a taxa aparente de desconto temporal. Se este proceso supuxo a impulsividade inducida pola dopamina nesta tarefa, suxeriría que este sistema de resposta innato (Pavloviano) opera nun contexto moito máis amplo do que o que se aprecia actualmente, xa que as recompensas nesta tarefa son recompensas secundarias que se producen como mínimo de 1. semana. Esta explicación contrasta coa idea dunha mellora dopaminérxica selectiva dun sistema (baseado en áreas límbicas) que só valora as recompensas a curto prazo (McClure et al., 2004). Esta conta de sistema de duelo sería difícil de reconciliar cos estudos anteriores (Kable e Glimcher, 2007; Pine et al., 2009), que suxiren que as áreas límbicas valoran recompensas en todos os atrasos.

Esta conta suscita cuestións importantes sobre a susceptibilidade dependente da amígdala ante a impulsividade inducida pola dopamina que observamos nos nosos datos. Aquí, a actividade da amígdala en resposta a D covaried co grao en que o comportamento se fixo máis impulsivo tras l-dopa. En transferencia pavloviano-instrumental (PIT), un fenómeno dependente da conectividade entre a amígdala eo estriadoCardinal et al., 2002; Seymour e Dolan, 2008), e cuxa expresión se sabe que é modulada por dopamina (Dickinson et al., 2000; Lex e Hauber, 2008), os valores pavlovianos apetitosos aumentan respondendo pola recompensa. En particular, a susceptibilidade individual a esta influencia se correlaciona coa actividade da amígdala (Talmi et al., 2008), o que suxire que a amígdala pode modular a medida en que os valores primarios condicionados e non condicionados primarios inflúen na elección instrumental (baseada en hábitos e obxectivos). Se isto é realmente o caso, entón predice que a presentación simultánea e independente de indicacións de recompensa durante a elección intertemporal pode provocar unha impulsividade temporal mellorada a través dun mecanismo dependente da amígdala. Observamos evidencias de que as lesións basolaterales de amígdala aumentan a impulsividade escollida en roedores (Winstanley et al., 2004b), unha observación oposta ao que esperaríamos en base aos datos actuais. En contraste, a actividade da amígdala correlacionouse previamente coa magnitude do desconto temporal nun estudo de fMRI.Hoffman et al., 2008). Estes problemas proporcionan unha base para investigacións futuras que poidan probar sistemáticamente estas previsións diverxentes en humanos.

Por último, estes resultados falan dun contexto clínico máis amplo e ofrecen unha explicación de por que se observa un aumento dos comportamentos impulsivos e de risco na síndrome de desregulación de dopamina, a adicción e o TDAH, todos os cales están asociados con estados hiperpaminérxicos causados ​​por inundacións de dopamina sensibilización (Solanto, 1998, 2002; Seeman e Madras, 2002; Berridge, 2007; Robinson e Berridge, 2008; Dagher e Robbins, 2009; O'Sullivan et al., 2009). En apoio desta tese, Voon et al. (2009) descubriron que o estado de medicación dopamina en pacientes con PD con trastornos do control de impulsos estaba asociado a maiores taxas de desconto temporal. En conclusión, os resultados aquí presentados demostran a capacidade da dopamina para mellorar a impulsividade en humanos e ofrecen unha nova visión do seu papel na modulación da elección impulsiva no contexto do desconto temporal. Estes descubrimentos suxiren que os humanos poden ser susceptibles a períodos temporais de maior impulsividade cando hai factores que aumentan a actividade da dopamina, como as calidades sensoriais das recompensas, durante a toma de decisións.

Material complementario

info info

Grazas

Este traballo foi financiado por unha subvención do programa Wellcome Trust para RJD, e AP foi apoiado por un estudo do Consello de Investigación Médica. Damos as grazas a K. Friston, J. Roiser e V. Curran por axuda na planificación e na análise e para discusións perspicaces.

References

  1. Acheson A, de Wit H. O bupropión mellora a atención pero non afecta ao comportamento impulsivo en adultos novos e sans. Exp Clin Psychopharmacol. 2008; 16: 113-123. [PubMed]
  2. Ainslie G. Recompensa especiais: unha teoría do comportamento da impulsividade e control de impulsos. Psychol Bull. 1975; 82: 463-496. [PubMed]
  3. Berridge KC. O debate sobre o papel da dopamina na recompensa: o caso de destacar o incentivo. Psicofarmacoloxía. 2007; 191: 391-431. [PubMed]
  4. Bickel WK, Marsch LA. Cara a unha comprensión económica do comportamento da dependencia de drogas: procesos de desconto por atraso. Adicción. 2001; 96: 73-86. [PubMed]
  5. Bickel WK, Miller ML, Yi R, Kowal BP, Lindquist DM, JA Pitcock. Comportamento e neuroeconomía da adicción ás drogas: sistemas neuronais competidores e procesos de desconto temporal. Depende do alcohol. 2007; 90 (Suppl 1): S85 – S91. [Artigo gratuíto de PMC] [PubMed]
  6. O metilfenidato reduce o comportamento impulsivo en ratas Wistar xuvenís, pero non en ratas adultas de Wistar, SHR e WKY. Psicofarmacoloxía (Berl) 2007; 193: 215-223. [PubMed]
  7. Bond AJ, Lader MH. O uso de escalas analóxicas na cualificación de sentimentos subjetivos. Br J Med. Psicoloxía. 1974; 47: 211-218.
  8. Botvinick MM. Seguimento de conflitos e toma de decisións: reconciliar dúas perspectivas sobre a función cingulada anterior. Cognitivo Afecta Behav Neurosci. 2007; 7: 356-366. [PubMed]
  9. Cardeal RN, Robbins TW, Everitt BJ. Os efectos da d-anfetamina, clordiazepóxido, alfa-flesentixol e manipulacións comportamentais na elección do reforzo retardado sinalizado e sen sinal nas ratas. Psicofarmacoloxía. 2000; 152: 362-375. [PubMed]
  10. Cardinal RN, Parkinson JA, Hall J, Everitt BJ. Emoción e motivación: o papel da amígdala, estriado ventral e córtex prefrontal. Neurosci Biobehav Rev. 2002; 26: 321 – 352. [PubMed]
  11. Cardinal RN, CA Winstanley, Robbins TW, Everitt BJ. Sistemas corticostriados límbicos e reforzo retardado. Ann NY Acad Sci. 2004; 1021: 33-50. [PubMed]
  12. Charrier D, Thiébot MH. Efectos das drogas psicotrópicas na resposta de ratos nun paradigma operante que implica a elección entre reforzadores atrasados. Pharmacol Biochem Behav. 1996; 54: 149-157. [PubMed]
  13. Clark L, Robbins TW, Ersche KD, BJ Sahakian. Impulsividade da reflexión en usuarios actuais e antigos. Psicoloxía biolóxica. 2006; 60: 515-522. [PubMed]
  14. Dagher A, Robbins TW. Personalidade, adicción, dopamina: ideas da enfermidade de Parkinson. Neuron. 2009; 61: 502-510. [PubMed]
  15. Dalley JW, Mar AC, Economidou D, Robbins TW. Mecanismos neurocomportamentais da impulsividade: sistemas fronto-estriados e neuroquímica funcional. Pharmacol Biochem Behav. 2008; 90: 250-260. [PubMed]
  16. Dayan P, Niv Y, Seymour B, Daw ND. O mal comportamento do valor e a disciplina da vontade. Netw neuronal. 2006; 19: 1153-1160. [PubMed]
  17. Deichmann R, Gottfried JA, Hutton C, Turner R. EPI optimizado para estudos de fMRI do córtex orbitofrontal. Neuroimaxe. 2003; 19: 430-441. [PubMed]
  18. de Wit H, JG Enggasser, Richards JB. A administración aguda de d-anfetamina diminúe a impulsividade en voluntarios sans. Neuropsicofarmacoloxía. 2002; 27: 813-825. [PubMed]
  19. Dickinson A, Smith J, Mirenowicz J. Disociación do aprendizaxe pavloviano e instrumental baixo agonistas de dopamina. Behav Neurosci. 2000; 114: 468-483. [PubMed]
  20. Evenden JL. Variedades de impulsividade. Psicofarmacoloxía. 1999; 146: 348-361. [PubMed]
  21. Evenden JL, Ryan CN. A farmacoloxía do comportamento impulsivo nas ratas: os efectos das drogas na elección de resposta con atrasos variables de reforzo. Psicofarmacoloxía. 1996; 128: 161-170. [PubMed]
  22. Floresco SB, Tse MT, Ghods-Sharifi S. Regulación dopaminérxica e glutamatérgica da toma de decisións baseada no esforzo e no atraso. Neuropsicofarmacoloxía. 2008; 33: 1966-1979. [PubMed]
  23. Frank MJ, O'Reilly RC. Un relato mecanicista da función da dopamina estriada na cognición humana: estudos psicofarmacolóxicos con cabergolina e haloperidol. Comportarse neurocientífico. 2006; 120: 497-517. [PubMed]
  24. Frank MJ, Samanta J, Moustafa AA, Sherman SJ. Manteña os seus cabalos: impulsividade, estimulación cerebral profunda e medicamentos en parkinsonismo. Ciencia. 2007; 318: 1309-1312. [PubMed]
  25. Hamidovic A, Kang UJ, de Wit H. Efectos de doses agudas baixas ou moderadas de pramipexol en impulsividade e cognición en voluntarios sans. J Clin Psychopharmacol. 2008; 28: 45-51. [PubMed]
  26. Helms CM, Reeves JM, Mitchell SH. Impacto da estirpe e da D-anfetamina na impulsividade (atraso de desconto) nos ratos endémicos. Psicofarmacoloxía (Berl) 2006; 188: 144-151. [PubMed]
  27. Ho MY, Mobini S, Chiang TJ, Bradshaw CM, Szabadi E. Teoría e método na análise cuantitativa do comportamento de "elección impulsiva": implicacións para a psicofarmacoloxía. Psicofarmacoloxía. 1999; 146: 362-372. [PubMed]
  28. Hoffman WF, Schwartz DL, Huckans MS, McFarland BH, Meiri G, Stevens AA, Mitchell SH. Activación cortical durante o desconto de atraso en individuos dependentes de metanfetamina abstinente. Psicofarmacoloxía. 2008; 201: 183-193. [Artigo gratuíto de PMC] [PubMed]
  29. Illas AR, Humby T, Wilkinson LS. Medir a impulsividade en ratos usando unha nova tarefa de reforzo operante: efectos de manipulacións de comportamento e d-anfetamina. Psicofarmacoloxía (Berl) 2003; 170: 376-382. [PubMed]
  30. Kable JW, Glimcher PW. Os correlatos neurais do valor subxectivo durante a elección intertemporal. Nat Neurosci. 2007; 10: 1625-1633. [Artigo gratuíto de PMC] [PubMed]
  31. Kuczenski R, Segal DS. Efectos do metilfenidato en dopamina, serotonina e norepinefrina extracelular: comparación coa anfetamina. J Neurochem. 1997; 68: 2032-2037. [PubMed]
  32. Os receptores Lex A, Hauber W. Dopamina D1 e D2 no núcleo acomben o núcleo e o shell median a transferencia instrumental de Pavloviano. Aprende Mem. 2008; 15: 483-491. [Artigo gratuíto de PMC] [PubMed]
  33. Logue AW, Tobin H, JJ Chelonis, Wang RY, Geary N, Cocaína Schachter S. diminúe o autocontrol nas ratas: un informe preliminar. Psicofarmacoloxía. 1992; 109: 245-247. [PubMed]
  34. Mai JK, Assheuer J, Paxinos G. Atlas do cerebro humano. Ed 2 Academic; San Diego: 2003.
  35. Mazur JE. Un procedemento de axuste para estudar o reforzo retardado. En: Commons ML, Mazur JE, JA Nevin, Rachlin H, editores. Análise cuantitativa do comportamento. V. O efecto do atraso e dos eventos intermedios sobre o valor de reforzo. Lawrence Erlbaum; Hillsdale, NJ: 1987. pp. 55 – 73.
  36. McClure SM, Laibson DI, Loewenstein G, JD Cohen. Os sistemas neuronais separados valoran recompensas monetarias inmediatas e atrasadas. Ciencia. 2004; 306: 503-507. [PubMed]
  37. Mobini S, Chiang TJ, Al-Ruwaitea AS, Ho MY, Bradshaw CM, Szabadi E. Efecto do esgotamento central da 5-hidroxitriptamina na elección intertemporal: unha análise cuantitativa. Psicofarmacoloxía (Berl) 2000; 149: 313-318. [PubMed]
  38. O'Sullivan SS, Evans AH, Lees AJ. Síndrome de desregulación dopamina: unha visión xeral da súa epidemioloxía, mecanismos e manexo. Drogas do SNC. 2009; 23: 157-170. [PubMed]
  39. Parkinson JA, Dalley JW, Cardeal RN, Bamford A, Fehnert B, Lachenal G, Rudarakanchana N, Halkerston KM, Robbins TW, Everitt BJ. O esgotamento da dopamina de Nucleus accumbens prexudica a adquisición e o rendemento do comportamento aprehensivo de aproximación pavloviana: implicacións na función de dopamina mesoaccumbens. Behav Brain Res. 2002; 137: 149-163. [PubMed]
  40. Pine A, Seymour B, Roiser JP, Bossaerts P, Friston KJ, Curran HV, Dolan RJ. Codificación da utilidade marginal no tempo no cerebro humano. J Neurosci. 2009; 29: 9575-9581. [Artigo gratuíto de PMC] [PubMed]
  41. Pochon JB, Riis J, Sanfey AG, Nystrom LE, Cohen JD. Imaxe funcional do conflito de decisión. J Neurosci. 2008; 28: 3468-3473. [PubMed]
  42. Poulos CX, Parker JL, Le AD. A dexfenfluramina e 8-OHDPAT modulan a impulsividade nun paradigma de atraso de recompensa: implicacións para a correspondencia co consumo de alcohol. Behav Pharmacol. 1996; 7: 395-399. [PubMed]
  43. Redish AD. A adicción como un proceso de cálculo mal. Ciencia. 2004; 306: 1944-1947. [PubMed]
  44. Richards JB, Seiden LS. O esgotamento da serotonina aumenta o comportamento impulsivo nas ratas. Soc Neurosci Abstr. 1995; 21: 1693.
  45. Richards JB, Sabol KE, de Wit H. Efectos da metanfetamina no procedemento de cantidade de axuste, un modelo de comportamento impulsivo nas ratas. Psicofarmacoloxía. 1999; 146: 432-439. [PubMed]
  46. Robinson TE, Berridge KC. A teoría da adicción á sensibilización de incentivos: algúns problemas actuais. Philos Trans R Soc Lond B Biol Sci. 2008; 363: 3137-3146. [Artigo gratuíto de PMC] [PubMed]
  47. Sagvolden T, sargento JA. Trastorno por déficit de atención / hiperactividade: desde disfuncións cerebrais ata comportamento. Behav Brain Res. 1998; 94: 1-10. [PubMed]
  48. Seeman P, Madras BK. Medicación anti-hiperactividade: data de metilfenato e anfetamina. Mol Psiquiatría. 1998; 3: 386-396. [PubMed]
  49. Seeman P, Madras B. O metilfenidato eleva a dopamina en repouso que reduce a liberación de dopamina provocada por impulsos: unha hipótese. Behav Brain Res. 2002; 130: 79-83. [PubMed]
  50. Seymour B, Dolan R. Emoción, toma de decisións e amígdala. Neurona. 2008; 58: 662-671. [PubMed]
  51. Seymour B, Yoshida W, Dolan R. Aprendizaxe altruísta. Front Behav Neurosci. 2009; 3: 23. [Artigo gratuíto de PMC] [PubMed]
  52. Solanto MV. Mecanismos neuropsicofarmacolóxicos da acción estimulante de drogas no trastorno de déficit de atención e hiperactividade: revisión e integración. Behav Brain Res. 1998; 94: 127-152. [PubMed]
  53. Solanto MV. Disfunción de dopamina en AD / HD: integración da investigación clínica e neurocientífica básica. Behav Brain Res. 2002; 130: 65-71. [PubMed]
  54. Solanto MV, Abikoff H, Sonuga-Barke E, Schachar R, Logan GD, Wigal T, Hechtman L, Hinshaw S, Turkel E. A validez ecolóxica do atraso de aversión e inhibición da resposta como medidas de impulsividade en AD / HD: un complemento para o estudo do tratamento multimodal NIMH de AD / HD. J Abnorm Child Psychol. 2001; 29: 215-228. [PubMed]
  55. Talairach J, Tournoux P. Atlas estereotóxico co-planar do cerebro humano. Thieme Publishing Group; Stuttgart: 1988.
  56. Talmi D, Seymour B, Dayan P, Dolan RJ. Transferencia instrumental-pavloviana humana. J Neurosci. 2008; 28: 360-368. [Artigo gratuíto de PMC] [PubMed]
  57. Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, Yamawaki S. A predición de recompensas inmediatas e futuras recluta diferencialmente bucles de ganglios cortico-basais. Nat Neurosci. 2004; 7: 887-893. [PubMed]
  58. van Gaalen MM, van Koten R, Schoffelmeer AN, Vanderschuren LJ. Implicación crítica da neurotransmisión dopaminérxica na toma de decisións impulsivas. Psicoloxía biolóxica. 2006; 60: 66-73. [PubMed]
  59. Voon V, Reynolds B, Brezing C, Gallea C, Skaljic M, Ekanayake V, Fernández H, Potenza MN, Dolan RJ, Hallett M. Elección e resposta impulsiva en comportamentos de control de impulsos relacionados cos agonistas de dopamina. Psicofarmacoloxía (Berl) 2009; 207: 645-659. [Artigo gratuíto de PMC] [PubMed]
  60. Wade TR, de Wit H, Richards JB. Efectos das drogas dopaminérxicas na recompensa tardía como medida do comportamento impulsivo nas ratas. Psicofarmacoloxía. 2000; 150: 90-101. [PubMed]
  61. CA Winstanley, JW Dalley, Theobald DE, Robbins TW. O esgotamento global de 5-HT atenúa a capacidade da anfetamina de diminuír a elección impulsiva nunha tarefa de desconto de atraso nas ratas. Psicofarmacoloxía. 2003; 170: 320-331. [PubMed]
  62. CA Winstanley, JW Dalley, Theobald DE, Robbins TW. Impulsividade fraccionada: efectos contrastantes do esgotamento do 5-HT central en diferentes medidas do comportamento impulsivo. Neuropsicofarmacoloxía. 2004a; 29: 1331 – 1343. [PubMed]
  63. CA Winstanley, Theobald DE, Cardinal RN, Robbins TW. Funcións contrastantes da amígdala basolateral e da cortiza orbitofrontal en opción impulsiva. J Neurosci. 2004b; 24: 4718 – 4722. [PubMed]
  64. CA Winstanley, DM Eagle, Robbins TW. Modelos comportamentais de impulsividade en relación co TDAH: tradución entre estudos clínicos e preclínicos. Clin Psychol Rev. 2006; 26: 379 – 395. [Artigo gratuíto de PMC] [PubMed]
  65. Wogar MA, Bradshaw CM, Szabadi E. Efectos das lesións dos camiños 5-hidroxitriptaminérxicos ascendentes a elección entre reforzos retardados. Psicofarmacoloxía. 1993; 113: 239-243. [PubMed]