Dopamine, temps et impulsivité chez l'homme (2010)

J Neurosci. 2010 juin 30;30(26):8888-96. doi: 10.1523 / JNEUROSCI.6028-09.2010.

Pin A1, Shiner T, Seymour B, Dolan RJ.

Information sur l'auteur

Abstract

La neurotransmission de dopamine désordonnée est impliquée dans la médiation de l'impulsivité à travers une gamme de comportements et de troubles comprenant la dépendance, le jeu compulsif, le trouble de déficit de l'attention / hyperactivité et le syndrome de dérégulation de la dopamine. Alors que les théories existantes sur la fonction dopaminergique mettent en évidence des mécanismes basés sur un apprentissage de récompense aberrant ou une désinhibition comportementale, elles ne fournissent pas une description adéquate de l'hypersensibilité pathologique au retard temporel qui forme un phénotype comportemental crucial observé dans ces troubles. Nous fournissons ici la preuve qu'un rôle de la dopamine dans le contrôle de la relation entre le moment choisi pour les récompenses futures et leur valeur subjective peut combler cette lacune explicative. En utilisant une tâche de choix intertemporelle, nous démontrons que l'amélioration pharmacologique de l'activité de la dopamine augmente l'impulsivité en renforçant l'influence diminutive du retard croissant sur la valeur de la récompense (réduction temporelle) et sa représentation neurale correspondante dans le striatum. Cela conduit à un état de remise excessive des récompenses temporellement éloignées, par rapport aux récompenses précoces. Ainsi, nos résultats révèlent un nouveau mécanisme par lequel la dopamine influence le processus décisionnel humain, ce qui peut expliquer les anomalies comportementales associées à un système dopaminergique hyperfonctionnel.

Introduction

La perte caractéristique de maîtrise de soi et d’impulsivité associée à une fonction aberrante de la dopamine est illustrée par des troubles tels que la dépendance, le trouble déficit de l'attention / hyperactivité (TDAH) et le syndrome de dysrégulation de la dopamine (Winstanley et al., 2006; Dagher et Robbins, 2009; O'Sullivan et al., 2009). Dans ce dernier cas, la thérapie de remplacement de la dopamine dans le traitement de la maladie de Parkinson (MP) rend certains patients sujets à un comportement compulsif, qui se manifeste par un excès de jeu, de magasinage, d'alimentation et d'autres comportements à courte vue. Cependant, le large phénotype d'impulsivité qui caractérise ces comportements englobe une diversité de processus décisionnels distincts qui peuvent être dissociés neurobiologiquement et pharmacologiquement (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a, 2006; Dalley et al., 2008). Celles-ci incluent un manque d'inhibition des réponses motrices prépotentes, une surpondération des récompenses par rapport aux pertes, un ralentissement en cas de conflit décisionnel et une propension à choisir plus petit, plus tôt que plus tard, comme récompense.

En principe, certains des déficits susmentionnés peuvent être liés à des effets dopaminergiques par le biais du rôle établi de la dopamine dans l'apprentissage des récompenses (Redish, 2004; Frank et al., 2007; Dagher et Robbins, 2009). Cependant, l'impulsivité temporelle (ou de choix) - la préférence pour des récompenses plus petites, plus tôt que plus importantes, en raison d'une remise excessive des récompenses futures (Ainslie, 1975; Evenden, 1999; Ho et al., 1999; Cardinal et al., 2004) - est beaucoup plus difficile à expliquer en termes d’apprentissage, bien qu’il reste une caractéristique importante de l’impulsivité dopaminergique putative. En effet, des tests de laboratoire de choix intertemporels indiquent que les toxicomanes et un sous-groupe de patients atteints de TDAH semblent avoir des taux d'actualisation temporellement anormalement élevés, préférant fortement des récompenses plus petites et plus précoces (Sagvolden et le sergent, 1998; Bickel et Marsch, 2001; Solanto et al., 2001; Winstanley et al., 2006; Bickel et al., 2007). Cela pose la question de savoir si la dopamine a un rôle spécifique à jouer dans le calcul du lien entre la proximité temporelle d’une récompense et sa valeur subjective (taux d’actualisation temporelle), indépendamment de sa contribution établie à la récompense de l’apprentissage.

Pour déterminer si la dopamine module le codage de la valeur en fonction du temps, nous avons administré le précurseur de dopamine L-Dopa, l'antagoniste de la dopamine halopéridol et un placebo à des volontaires en bonne santé effectuant une tâche de choix intertemporel. La tâche demandait aux sujets de faire de véritables choix entre différentes sommes d’argent, offertes sur des périodes variables, impliquant principalement le choix entre des récompenses monétaires plus petites - plus tôt que plus importantes - plus tard. Ces choix sont bien caractérisés par des modèles qui intègrent à la fois les effets d’actualisation du temps et ceux de la magnitude croissante des récompenses (utilité marginale décroissante) (Pine et al., 2009). En conséquence, l'utilité actualisée ou la valeur subjective d'une récompense différée est déterminée par le produit du facteur d'actualisation (un nombre compris entre zéro et un) et l'utilité de la récompense. Si la dopamine module le choix d'un individu dans cette tâche, cela pourrait refléter un changement du taux d'actualisation ou de la concavité / convexité d'utilité (voir Matériels et méthodes) - une distinction que nous avons pu explorer ici aux niveaux comportemental et neurophysiologique, en utilisant imagerie par résonance magnétique fonctionnelle (IRMf). De plus, nous avons évalué si la dopamine avait un effet sur le taux de ralentissement engendré par le conflit décision-conflit (Frank et al., 2007; Pochon et al., 2008) pour distinguer les influences globales des influences discrètes sur l’impulsivité.

Matériels et méthodes

Nous avons utilisé l'IRMf alors que les sujets choisissaient entre deux options présentées en série, de magnitude différente (de £ 1 à £ 150) et de délai (de la semaine 1 à l'année 1) (Fig. 1). Chaque sujet a effectué la tâche à trois occasions distinctes (en rapport avec les trois conditions médicamenteuses). Ces choix étaient souvent plus petits - plus tôt que plus grands - plus tard. L'un des choix des sujets a été sélectionné au hasard à la fin de l'expérience (dans chaque session expérimentale) et payé pour de vrai (c'est-à-dire à la date future spécifiée) par virement bancaire. Nous avons utilisé les choix des sujets pour évaluer l'étendue de l'actualisation à la fois pour l'ampleur et le temps. Nous avons évalué un modèle combinant une fonction d'utilité (conversion de la grandeur en utilité) avec une fonction d'actualisation hyperbolique standard. En termes simples, la fonction de l'utilité actualisée (valeur subjective) d'une récompense différée (V) est égal à D × U De D est un facteur de réduction entre 0 et 1 et U est l'utilité non actualisée. D est typiquement une fonction hyperbolique du retard à la récompense et intègre le paramètre de taux d’actualisation (K), qui détermine la rapidité avec laquelle on dévalue les récompenses futures. U est (généralement) une fonction concave de l’ampleur d’une récompense et dépend d’un paramètre individuel (r) qui détermine la concavité / convexité de la fonction, ou le taux d’utilité marginale décroissante des gains et par conséquent la valeur instantanée du plus grand par rapport à la plus petite récompense. Le meilleur K or rplus l’individu est susceptible de choisir l’option le plus tôt et donc plus l’impulsif est l’individu (Ho et al., 1999; Pine et al., 2009). Conformément à la théorie de l'utilité, le choix est déterminé par le principe de la maximisation de l'utilité, selon lequel l'option offrant la plus grande utilité actualisée est sélectionnée.

Figure 1 

Conception des tâches. Les sujets ont reçu un ensemble de choix binaires intertemporels 220, la plupart du temps entre des récompenses plus petites, plus précoces et plus grandes, variant de £ 1- £ 150 avec des retards associés de semaines 1-52. Remarque ...

Participants

Quatorze volontaires sains droitiers ont été inclus dans l'expérience (hommes 6; femmes 8; âge moyen, 21; gamme, 18 – 30). Les sujets ont été pré-évalués pour exclure ceux ayant des antécédents de maladie neurologique ou psychiatrique. Tous les sujets ont donné leur consentement éclairé et l'étude a été approuvée par le comité d'éthique de l'University College London. Un sujet a quitté l'étude après la première session et n'a pas été inclus dans les résultats. Un autre n'a pas terminé la session finale (placebo) dans le scanner, mais les données comportementales de toutes les sessions et les données d'imagerie de deux sessions ont été incluses dans les résultats.

Procédure et description de la tâche

Chaque sujet a été testé à trois reprises. À leur arrivée à chaque occasion, les sujets recevaient une feuille d'instructions à lire expliquant comment le médicament en aveugle serait mis en œuvre. Ils ont ensuite complété une échelle visuelle analogique (Bond and Lader, 1974) qui mesuraient des états subjectifs tels que la vigilance et recevaient ensuite une enveloppe contenant deux comprimés qui étaient soit 1.5 mg d’halopéridol, soit un placebo. Une heure et demie après la prise du premier jeu de pilules, les sujets ont reçu une autre enveloppe contenant deux comprimés soit Madopar (contenant 150 mg de l-dopa), soit un placebo. Les comprimés placebo (vitamine C ou multivitamines) étaient impossibles à distinguer des médicaments. Au total, chaque sujet a reçu une dose de Madopar au cours d'une session, une dose d'halopéridol à une autre et, lors d'une session, les deux séries de comprimés étaient un placebo. L'ordre de chaque condition de médicament par rapport à la session de test était contrebalancé par les sujets et était inconnu de l'expérimentateur pour réaliser une conception en double aveugle. Les tests ont commencé 30 min après l’ingestion du deuxième ensemble de comprimés. Les timings visaient à atteindre une concentration plasmatique maximale du médicament environ à mi-parcours du test. Après le test, les sujets ont complété une autre échelle visuelle analogique (identique). Aucune session de test n'a eu lieu dans la semaine 1 l'une de l'autre.

La tâche comportementale était essentiellement celle décrite par Pine et al. (2009). Chaque essai consistait à choisir entre une récompense plus petite - plus tôt et une récompense plus grande - plus tard. Le choix a été présenté en série, en trois étapes (Fig. 1). Les deux premières étapes consistaient à présenter les détails de chaque option, c’est-à-dire l’ampleur de la récompense en livres et le délai de réception en mois et semaines. Après la présentation des options, un troisième écran invitait le sujet à choisir entre l’option 1 (l’option présentée en premier) ou l’option 2, au moyen d’une boîte à boutons, de la main droite. Un délai de 3 a suivi chacune des trois phases. Le choix ne peut être fait que lors de la présentation suivante de l écran de choix par le 3. Une fois le choix effectué, l'option choisie était surlignée en bleu. Si le temps le permettait, le sujet pourrait changer d’avis. Après la phase de choix, il y a eu un retard gigue des 1 – 4, suivi de la présentation d’une croix de fixation pour les 1.

L'expérience consistait en un total d'essais sur 200. L'option 1 était la récompense la plus petite, plus tôt dans 50% des essais. De plus, nous avons inclus un autre essai «capture» de 20, dans lequel l’une des options était à la fois supérieure en valeur et disponible plus tôt que l’autre. Ces essais de capture ont lieu environ tous les dix essais et nous ont permis de déterminer dans quelle mesure les sujets se concentraient sur la tâche, en supposant que la norme était de préférer la récompense la plus large - plus tôt dans ces choix. Chaque sujet a reçu le même choix de choix pour chaque session de test (c.-à-d. Chaque état lié à un médicament), à l'exception des deux premiers sujets, qui ont reçu un ensemble de choix différent lors de leur première session de test. Les valeurs des options ont été créées en utilisant des grandeurs générées de manière aléatoire, variant de £ 1 à £ 150 en unités de £ 1 et des retards allant de la semaine 1 à l’année 1 en unités d’une seule semaine (mais présentés sous forme de mois et de semaines) distribution aléatoire. Cette nature aléatoire des valeurs a contribué à orthogonaliser la magnitude et le retard. Pour créer des choix entre des récompenses plus petites, plus tôt et plus tard, nous avons introduit la contrainte selon laquelle l'option de plus grande ampleur devait être retardée davantage que la plus petite, et inversement pour les essais de capture. Les sujets ont été assignés à l'un des deux réseaux de choix en fonction de leurs réponses lors des essais pratiques lors de leur première session. Cela a été fait pour faire correspondre les choix présentés au niveau d'impulsivité du sujet.

Le paiement a été effectué en utilisant une loterie pour sélectionner un essai de chaque session d’essai. Pour imposer une validité écologique, nous avons utilisé un système de paiement garantissant que tous les choix seraient faits de manière réaliste, avec des conséquences réalistes. La sélection aléatoire de l’un des choix faits au cours de l’expérience, avec le paiement réel de l’option choisie pour ce choix, était au cœur de cette conception. Ceci a été réalisé par un virement bancaire effectué au moment associé à, et consistant en le montant de l'option sélectionnée. La sélection des paiements a été mise en œuvre à l'aide d'une loterie manuelle une fois tous les tests terminés. La loterie contenait des boules numérotées 220, chacune représentant un seul essai de la tâche. Le ballon sélectionné correspond à l'essai récompensé pour cette session de test. L'ampleur et le délai de l'option choisie par le sujet dans l'essai sélectionné ont été déterminés et attribués au moyen d'un virement bancaire. Ainsi, le paiement que chaque sujet a reçu était déterminé par une combinaison de la loterie et des choix qu’ils avaient faits - une manipulation qui garantissait que les sujets traitaient tous les choix comme réels. Le système de paiement a été conçu de manière à ce que chaque sujet reçoive en moyenne £ 75 par session. Aucun autre paiement n'a été accordé pour la participation à l'expérience.

Avant que les sujets ne soient pris dans le scanner, on leur a montré l'appareil de loterie et une explication sur la manière dont le virement bancaire serait mis en œuvre, afin de les rassurer sur le fait que le système de paiement et de sélection était authentique. Après une courte pratique de six essais, ils ont été introduits dans le scanner où ils ont effectué deux sessions d’essais 110, d’une durée totale de ~ 50 min.

Procédure d'imagerie

L'imagerie fonctionnelle a été réalisée à l'aide d'un scanner IRM à tête unique Siemens Allegra de 3-tesla pour acquérir des images écho-planaires pondérées T2 * à gradient d'écho, avec contraste BOLD (taux d'oxygénation du sang). Nous avons utilisé une séquence conçue pour optimiser la sensibilité fonctionnelle dans le cortex orbitofrontal (Deichmann et al., 2003). Cela consistait en une acquisition inclinée dans une orientation oblique 30 ° par rapport à la ligne AC – PC antérieure cingulaire-cingulaire postérieure, ainsi que l'application d'une impulsion de préparation d'une durée de 1 ms et d'une amplitude de −2 mT / m dans la sélection de la tranche direction. La séquence a permis d’acquérir des tranches axiales 36 d’épaisseur 3 mm et de résolution dans le plan 3 mm avec un temps de répétition (TR) de 2.34. Les sujets ont été placés dans un appuie-tête léger à l'intérieur du scanner afin de limiter les mouvements de la tête lors de l'acquisition. Les données d'imagerie fonctionnelle ont été acquises au cours de deux sessions de volume 610 distinctes. Une image structurelle pondérée T1 et des cartes de terrain ont également été acquises pour chaque sujet après les sessions de test.

Analyse comportementale

Pour obtenir une mesure globale du choix impulsif, nous avons compté le nombre d'options plus tôt choisies parmi les essais 220, pour chaque condition de médicament, pour chaque sujet. Les essais sans réponse ont été exclus de cette somme dans les trois états liés à la drogue. Par exemple, si un sujet ne répondait pas à temps pour l'essai numéro 35 dans la condition placebo, cet essai était exclu du décompte des deux autres conditions pour ce sujet. Cela garantissait que les comparaisons étaient effectuées essai par essai (le même éventail d'essais étant donné à chaque session de test) et que l'effet du médicament sur cette mesure n'était pas lié au nombre de choix effectués dans chaque condition. Une ANOVA à mesures répétées a été utilisée pour rechercher d'éventuelles différences dans cette mesure globale entre les états de drogue.

Estimation de paramètre

Nous avons implémenté la règle de décision softmax pour attribuer une probabilité (PO1 pour l’option 1) à chaque option du choix compte tenu de la valeur de l’option (VO1 pour l'option 1) où

POi=e(VOi/β)e(VO1/β)+e(VO2/β).
(1)

VOi représente la valeur d'une option (c.-à-d. une récompense différée) selon un modèle particulier d'évaluation des options (voir ci-dessous). le β le paramètre représente le degré de stochasticité du comportement du sujet (c'est-à-dire la sensibilité à la valeur de chaque option).

Nous avons utilisé un modèle d’utilité actualisé de la valorisation des options, que nous avions précédemment indiqué (Pine et al., 2009) comme fournissant un ajustement précis aux choix du sujet dans cette tâche. Ce modèle indique que l'utilité actualisée (V) d'une récompense de magnitude (M) et avec un retard (d) peuvent être exprimés comme suit:

V=D(d)U(M)=1-e(-rM)r(1+Kd),
(2)

De

D=11+Kd

et

U=1-e(-rM)r.

D peut être considéré comme le facteur de réduction - le facteur dépendant du délai (entre 0 et 1) par lequel l'utilitaire est actualisé de manière hyperbolique standard (Mazur, 1987). Le paramètre de taux d'actualisation K quantifie la tendance d'un individu à écarter l'avenir de telle sorte qu'une personne K dévalue rapidement les récompenses à mesure qu’elles s’éloignent. U est utilité non actualisée et est régie par la magnitude de chaque option et r, paramètre libre régissant la courbure de la relation. Plus la valeur de r, plus la fonction d’utilité est concave, et où r est négatif, la fonction d'utilité est convexe. Le meilleur r (au-dessus de zéro), plus le taux d'utilité marginale diminue et plus l'individu est impulsif en matière de choix. Notez que, selon les modèles traditionnels d’évaluation du choix intertemporel, qui ne tiennent pas compte de l’actualisation de la magnitude (Mazur, 1987), l’impulsivité, définie par la propension à choisir l’option plus petite ou plus tôt, est uniquement fonction de K et donc on pourrait s’attendre à ce que les deux soient parfaitement corrélés. Par conséquent, K est souvent considéré comme une mesure de ce trait. Cependant, il a également été prouvé que la réduction de l’ampleur déterminait l’issue du choix chez l’animal et chez l’homme (Ho et al., 1999; Pine et al., 2009), nous préférons associer impulsivité à comportement de choix car le taux d’actualisation temporel ne correspond pas parfaitement à cette mesure clé.

Pour calculer les paramètres de maximum de vraisemblance pour chaque modèle ainsi qu'une mesure de l'ajustement, une estimation de maximum de vraisemblance a été utilisée. Chacun des paramètres (y compris β) a été autorisé à varier librement. Pour chaque sujet, la probabilité a été calculée pour chacune des options 220 choisies parmi les choix 220 (y compris les essais de capture), à ​​l'aide de la formule softmax et mises en œuvre avec des fonctions d'optimisation dans Matlab (MathWorks). La log-vraisemblance a été calculée en utilisant la probabilité de l'option choisie au procès t (PO(t)) de Éq. 1 tel que

lnL=ΣtlnPO(t).
(3)

Une ANOVA à mesures répétées a été utilisée pour rechercher d'éventuelles différences de taux d'actualisation (K) et la concavité des services publics (r) à travers les conditions de drogue.

Pour les besoins des analyses d’imagerie et des temps de réaction, une autre estimation a été effectuée, dans laquelle tous les choix de chaque sujet dans chaque condition ont été regroupés (comme s’ils étaient faits par un sujet) et modélisés comme un sujet canonique pour estimer les valeurs de paramètres canoniques (en utilisant la procédure d’ajustement ci-dessus, estimation des paramètres). Cette opération a été réalisée pour réduire le bruit associé à la procédure d’ajustement au niveau du sujet. De plus, nous n’avons pas souhaité intégrer les différences de comportement dans nos modèles de régression lors de l’analyse des données IRMf, car nous recherchions des preuves indépendantes de nos résultats comportementaux.

Analyse d'imagerie

L’analyse des images a été réalisée avec SPM5 (www.fil.ion.ucl.ac.uk/spm). Pour chaque session, les cinq premières images ont été ignorées pour prendre en compte les effets d'équilibrage de T1. Les images restantes ont été réalignées dans le sixième volume (pour corriger les mouvements de la tête), non différenciées à l’aide de cartes de terrain, normalisées spatialement selon le modèle cérébral standard de l’Institut neurologique de Montréal (MNI) et lissées spatialement avec un noyau gaussien tridimensionnel en 8 mm largeur à mi-hauteur (FWHM) (et ré-échantillonné, ce qui donne 3 × 3 × 3 mm voxels). Les artefacts basse fréquence ont été supprimés à l'aide d'un filtre passe-haut 1 / 128 Hz et l'autocorrélation temporelle intrinsèque à la série temporelle IRMf a été corrigée par préchauffage à l'aide d'un processus AR (1).

Des cartes de contraste à sujet unique ont été générées à l'aide d'une modulation paramétrique dans le contexte du modèle linéaire général. Nous avons effectué une analyse en examinant la variance de la réponse BOLD régionale attribuable à différents régresseurs d'intérêt: U, Det V pour toutes les options sur toutes les conditions de drogue. Cela nous a permis d'identifier les régions impliquées dans l'évaluation et l'intégration de différentes composantes de la valeur (dans la condition placebo) et de rechercher les différences éventuelles entre ces activations d'une condition à l'autre.

U, Det V pour chaque option (deux par essai) ont été calculés en utilisant les estimations de paramètres canoniques (K et r) dans le contexte de notre modèle d’utilité actualisé et convolution avec la fonction de réponse hémodynamique canonique (HRF) au début de chaque option. Tous les onsets ont été modélisés comme des fonctions de stick et tous les régresseurs du même modèle ont été orthogonalisés (dans les ordres indiqués ci-dessus) avant analyse par SPM5. Pour corriger les artefacts de mouvement, les six paramètres de réalignement ont été modélisés comme des régresseurs sans intérêt dans chaque analyse. Dans une analyse supplémentaire, nous avons supprimé toute confusion potentielle liée à l'orthogonalisation des régresseurs dans notre analyse IRMf en mettant en œuvre un autre modèle de régression, mais en supprimant maintenant l'étape d'orthogonalisation. Ici, les régresseurs ont été autorisés à entrer en compétition pour la variance, de sorte que dans ce modèle plus conservateur, toutes les composantes de variance partagées ont été supprimées, ne révélant que des composantes uniques de la variance. U, Det V. Sous ce modèle, nous avons encore observé les mêmes différences de D et V à travers les conditions de drogue et aucune différence dans U, bien que l’ampleur des différences ait été réduite.

Au deuxième niveau (analyse de groupe), les régions présentant une modulation significative de chacun des régresseurs spécifiés au premier niveau ont été identifiées par analyse à effets aléatoires de la β images des cartes de contraste mono-sujet. Nous avons inclus la mesure du changement de l'impulsivité (différence du nombre de patients choisis plus tôt) en tant que covariable lors de la comparaison des différences entre les essais de la l-dopa et du placebo. Nous rapportons les résultats pour les régions où le pic de voxel t valeur correspondait à p <0.005 (non corrigé), avec une taille de cluster minimale de cinq. Les coordonnées ont été transformées du tableau MNI au tableau stéréotaxique de Talairach et Tournoux (1988) (http://imaging.mrc-cbu.cam.ac.uk/imaging/MniTalairach).

Les images structurelles T1 ont été enregistrées dans les images EPI fonctionnelles moyennes pour chaque sujet et normalisées à l'aide des paramètres dérivés des images EPI. La localisation anatomique a été réalisée en superposant la t cartes sur une image structurelle normalisée moyennée sur plusieurs sujets et faisant référence à l’atlas anatomique de Mai et al. (2003).

Données de latence de décision

Pour examiner l’effet du conflit de décision (difficulté de choix) sur la latence de décision, nous avons calculé une mesure de difficulté pour chacun des choix 220 en calculant la différence d’utilité actualisée (ΔV) des deux options. Cette mesure a été calculée à l'aide du modèle d'utilité actualisé et des estimations de paramètres canoniques (pour la même raison, elles ont été utilisées dans les analyses par IRMf). Une régression linéaire a ensuite été réalisée pour modéliser la relation entre la latence de décision pour chaque choix et la mesure de difficulté. Le paramètre estime (βs) ont ensuite été utilisés comme statistiques récapitulatives et une analyse de second niveau a été réalisée à l'aide d'un échantillon à un échantillon. t test comparant les βs contre zéro. Ceci a été réalisé séparément pour le groupe dans chaque condition de drogue. Pour tester toute différence dans la relation entre conflit et latence selon l'état de la drogue, nous avons utilisé des échantillons appariés. t Des tests.

Résultats

Nous avons d’abord analysé les effets de la manipulation du médicament sur le comportement en considérant la proportion d’options choisies plus tôt ou plus tôt par rapport aux options choisies plus tard, sur un total de choix 220, faites dans chaque cas. Ces données ont révélé une nette augmentation du nombre d’options précoces choisies dans l’état de la l-dopa par rapport à l’endroit placébo (moyenne 136 vs 110, p = 0.013) (Tableau 1, Fig. 2). De manière frappante, cette tendance a été observée chez tous les sujets où cette comparaison pouvait être faite. Il n'y avait pas de différence significative entre les conditions d'halopéridol et de placebo sur cette disposition. Notez que la tâche consistait en le même tableau de choix dans chaque condition.

Figure 2 

Comparaisons comportementales et estimations de paramètres dans les conditions relatives au placebo et à la l-dopa. a, Les sujets ont effectué exactement le même ensemble de choix (220) dans les trois conditions de traitement, mais ont plus souvent choisi le plus petit choix - plus tôt que le contraire - plus tard ...
Tableau 1 

Résumé des résultats comportementaux

Nous avons ensuite utilisé l’estimation du maximum de vraisemblance pour trouver les paramètres les mieux adaptés (K et r) pour le modèle d’utilité actualisé, pour chaque sujet dans chaque condition, déterminer si un effet spécifique sur l’un de ces paramètres influence l’augmentation observée de l’impulsivité comportementale. En comparant les paramètres estimés contrôlant le taux d'actualisation et la concavité des services publics d'une condition à l'autre, un effet spécifique de la l-dopa sur le taux d'actualisation a été trouvé, sans effet sur la concavité des services publics (Tableau 1, Fig. 2et Tableau supplémentaire 1, disponible à www.jneurosci.org as matériel supplémentaire). Ainsi, sous l-dopa, un taux d'actualisation plus élevé a été observé par rapport au placebo (p = 0.01), entraînant une dévaluation plus importante des récompenses futures. À titre d'illustration, en utilisant une estimation de paramètre canonique de groupe pour tracer une fonction de réduction pour chaque état lié à la drogue, on peut constater que sous placebo, un délai de ~ 35 semaines était nécessaire pour qu'une récompense £ 150 ait une valeur présente (subjective) de £ 100, cependant, sous l-dopa, la même dévaluation a eu lieu avec un retard de seulement 15 semaines (Fig. 2). Les estimations de paramètres canoniques utilisées pour les analyses par imagerie étaient 0.0293 pour K et pour 0.0019 r (toutes les valeurs de K rapportés sont calculés à partir des unités de temps de semaines).

En accord avec Pine et al. (2009), les estimations de paramètres pour chaque sujet (toutes conditions confondues) étaient supérieures à zéro, révélant à la fois un effet significatif de l'actualisation temporelle (p <0.001) et non-linéarité (concavité) d'utilité instantanée (p <0.05). Notez que contrairement aux modèles traditionnels de choix intertemporel (Mazur, 1987), où le résultat du choix est uniquement fonction de K, le modèle utilisé ici implique que le nombre des premières options choisies dépend aussi de la r paramètre (voir Matériels et Méthodes) (Pine et al., 2009) et donc K n'est pas en soi une mesure pure de l'impulsivité du choix. En outre, la précision des paramètres estimés dépend à la fois de la stochasticité et de la cohérence des réponses des sujets. Par exemple, les paramètres estimés dans l'essai placebo du sujet 13 étaient anormaux par rapport au reste des données (Tableau supplémentaire 1, disponible à www.jneurosci.org as matériel supplémentaire), indiquant que ce sujet aurait pu faire des choix incohérents au cours de cette session. Lors de la comparaison entre les sujets, notez que le nombre de choix plus rapides dépend également du choix du sujet reçu (un sur deux).

En outre, nous avons examiné si un ralentissement des latences de décision était apparent à mesure que les choix devenaient de plus en plus difficiles - en raison de la proximité croissante des valeurs des options - et si des différences de groupe étaient apparentes sur cette mesure. Nous avons effectué une régression pour évaluer la relation entre la latence de décision et la difficulté de chaque choix mesurée par la différence d’utilité actualisée (ΔV) entre les deux options de choix, calculées à l'aide des valeurs de paramètre estimées. Dans un placebo (p <0.001), l-dopa (p <0.001) et halopéridol (p <0.001), les latences de décision des sujets augmentaient à mesure que ΔV est devenu plus petit, c’est-à-dire que la différence de valeur subjective entre les options a diminué. Cependant, aucune différence globale n'a été observée dans cette mesure entre les états liés à la drogue. Cela indique que, contrairement au résultat du choix, la manipulation de la dopamine n’a pas d’incidence sur le temps imparti pour peser une décision ou la capacité de «tenir vos chevaux», et corrobore la suggestion selon laquelle l’impulsivité n’est pas un construit unitaire (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Cette observation est conforme à une précédente constatation selon laquelle l’état de médication de la dopamine dans la MP n’était pas associé à un changement des latences de décision dans une tâche de choix différent (Frank et al., 2007).

Les effets subjectifs ont été analysés en comparant l’évolution des trois facteurs identifiés par Bond and Lader (1974), à savoir la vigilance, le contentement et le calme, par rapport au changement des scores observés dans la condition placebo. Des différences ont été observées entre l’halopéridol et le placebo, où les sujets étaient moins alertes sous l’halopéridol (p <0.05).

Pour établir comment l'impulsivité accrue sous L-dopa était représentée au niveau neural, nous avons appliqué trois régresseurs paramétriques (orthogonalisés), U, Det V, associée à la présentation de chaque option, comme dicté par notre modèle, aux données d'imagerie cérébrale. Les régresseurs ont été créés pour chaque sujet, dans chaque condition, en utilisant des valeurs de paramètres canoniques estimées à partir des choix de tous les sujets sur toutes les sessions, dans un test de l'hypothèse nulle que l'activité cérébrale ne diffère pas entre les conditions.

Dans une analyse préliminaire, nous avons examiné les corrélations de ces trois régresseurs dans la condition placebo afin de reproduire les résultats précédents (Pine et al., 2009). Nos résultats (Résultats supplémentaires, disponible à www.jneurosci.org as matériel supplémentaire) concordaient avec ceux présentés précédemment, en ce que D, Uet V tous indépendamment liés à l'activité dans le noyau caudé (parmi d'autres régions). Cela prend en charge une vue hiérarchique et intégrée de la valorisation des options, dans laquelle les sous-composants de valeur sont codés de manière dissociable, puis combinés pour fournir une valeur globale utilisée pour guider le choix.

Les analyses critiques en IRMf se sont concentrées sur la principale différence de comportement dans l'évaluation des options sous l-dopa par rapport aux conditions sous placebo. Lors de la comparaison de l'activité neuronale pour U, Det V, des différences significatives ont été trouvées pour les deux D et V, une conclusion qui correspond au résultat comportemental. Plus précisément, nous avons observé une activité accrue dans les régions en relation avec le facteur de réduction D sous l-dopa par rapport au placebo (Fig. 3a et Résultats supplémentaires, disponible à www.jneurosci.org as matériel supplémentaire) et aucun effet de l’halopéridol (c’est-à-dire que les coefficients de régression dans les conditions placebo et halopéridol ne différaient pas significativement). Ces régions comprenaient les cortex striatum, insula, cingulate sous-sexuel et orbitofrontal latéral. Ces résultats montrent que la diminution caractéristique de l’activité de ces régions à mesure que les récompenses sont retardées (ou augmentent au fur et à mesure qu’elles se rapprochent dans le temps) (McClure et al., 2004; Tanaka et al., 2004; Kable et Glimcher, 2007; Pine et al., 2009) (voir également Résultats supplémentaires pour le placebo, disponible à www.jneurosci.org as matériel supplémentaire) est plus marquée dans la l-dopa par rapport au placebo, de manière analogue au constat comportemental, dans lequel la l-dopa a accru la préférence pour des récompenses plus précoces en augmentant le taux d’actualisation, ce qui les rend plus attractives par rapport aux récompenses ultérieures. De plus, de même qu’il n’y avait pas de différence significative dans les estimations r paramètre à travers ces essais, nous n’observons aucune différence significative U l'activité entre les essais sur la l-dopa et le placebo, indiquant que la l-dopa n'a pas d'incidence sur le codage de l'utilité de la récompense.

Figure 3 

Différences d'activité neuronale entre les conditions de la l-dopa et du placebo en réponse à la valeur subjective et au facteur de réduction (cartes paramétriques statistiques et estimations de paramètres). a, Régions en corrélation avec le facteur d’actualisation (D) (c.-à-d. proximité de récompense) ...

Études précédentes (Kable et Glimcher, 2007; Pine et al., 2009), ainsi qu’une analyse du groupe placebo seul, impliquent, entre autres, les régions striatales dans l’encodage de l’utilité actualisée (V). Lors de la comparaison de régions en corrélation avec V, une diminution de l’activité a été observée dans les régions caudée, insulaire et frontale latérale inférieure, dans la l-dopa par rapport au placebo (Fig. 3b et Résultats supplémentaires, disponible à www.jneurosci.org as matériel supplémentaire). Ce résultat indique que, pour une récompense d'une ampleur et d'un retard donnés, une activité réduite dans les régions codant pour une valeur subjective (utilité actualisée) a été engendrée par la l-dopa. Cette réduction était associée à l’actualisation temporelle accrue et a conduit à une augmentation de la sélection d’options plus petites, plus tôt (impulsives) dans cette condition par rapport au placebo.

Comme les données IRMf utilisaient le même ensemble de paramètres canoniques (dans toutes les conditions, testant l'hypothèse nulle qu'elles soient toutes identiques), ces résultats concordent avec les résultats comportementaux selon lesquels l'augmentation du taux d'actualisation sous l-dopa entraîne une réduction de D, entraînant une réduction correspondante du V et, par conséquent, une préférence relative accrue pour des récompenses plus précoces. Notez que si l'utilité actualisée était codée à la dopamine seule, on pourrait prédire le résultat opposé, avec une activité plus importante dans l'état l-dopa.

Inspection des résultats comportementaux (Tableau 1, Fig. 2) a révélé qu'une augmentation de l'impulsivité après la l-dopa était davantage exprimée chez certains sujets que chez d'autres. Sur cette base, nous avons effectué une analyse de covariable sur les contrastes précédents en calculant un score de différence du nombre d'options plus tôt choisies dans les essais comparatifs avec placebo et l-dopa. Plus cette mesure est grande, plus l’impulsivité (taux d’actualisation) induite par la l-dopa est importante. En régressant cette quantité comme covariable dans le contraste, comparant D l-dopa moins le placebo (Fig. 3a), nous avons trouvé une corrélation significative avec l'activité dans l'amygdale (bilatéralement) (Fig. 4). Étant donné que la différence de score de choix entre les sujets peut avoir été partiellement affectée par le fait que les sujets ont été assignés à l’un des deux choix possibles et pour augmenter la puissance (pouvoir inclure plus de sujets), nous avons répété cette analyse, en utilisant cette fois les paramètres suivants: différence estimée K les valeurs des essais comparatifs avec placebo à l-dopa. Le résultat de cette analyse (voir Résultats supplémentaires, disponible à www.jneurosci.org as matériel supplémentaire) a de nouveau démontré une forte corrélation positive entre l'activité de l'amygdale et le degré d'augmentation du K du placebo à la l-dopa. Ces résultats suggèrent que la susceptibilité individuelle du sujet à l'impulsivité sous l'influence de la l-dopa est modulée par le degré de réponse de l'amygdale à la proximité temporelle de la récompense.

Figure 4 

Variabilité intersubjective de l'augmentation de l'impulsivité après la l-dopa. a, Carte paramétrique statistique montrant les zones exprimant une sensibilité globale au facteur de réduction (dans les conditions de l-dopa moins un placebo) et la covariable avec le degré auquel ...

a lieu

Les théories existantes sur la dopamine se concentrent sur son rôle dans l'apprentissage par récompense, dans lequel on pense que la dopamine est le médiateur d'un signal d'erreur de prédiction utilisé pour mettre à jour les valeurs des états et des actions permettant la prédiction et le contrôle, respectivement, lors de la prise de décision. Ces modèles ont été utilisés pour illustrer comment un traitement anormal de la dopamine pourrait conduire à des comportements impulsifs et addictifs, sur la base de l'expérience (c.-à-d. Par l'apprentissage) (Redish, 2004; Frank et al., 2007; Dagher et Robbins, 2009). Ici, un aspect distinct de l'impulsivité a été explicitement exploré, basé sur la relation entre le moment choisi pour les récompenses et leur utilité, indépendamment du retour d'informations et de l'apprentissage. Dans le choix intertemporel, les décideurs doivent choisir entre des récompenses d'ampleur différente et des retards. Ceci est réalisé en actualisant la valeur des montants d’utilité futurs (en fonction de leur retard) afin de comparer leurs valeurs actuelles. Dans ce cadre, la dopamine pourrait potentiellement augmenter le choix impulsif de deux manières distinctes (Pine et al., 2009), comme suit: en raison d'un taux accru d'utilité marginale décroissante pour les gains (ce qui diminuerait la valeur instantanée subjective d'une plus grande magnitude par rapport à des récompenses de plus petite ampleur), ou par une réduction temporelle accrue des récompenses futures. Nos résultats suggèrent que la dopamine a un impact sélectif sur le taux d'actualisation, sans aucun effet significatif sur la fonction d'utilité. De plus, ces résultats comportementaux ont été indépendamment corroborés par les données IRMf en ce que la principale différence engendrée par la l-dopa était une modulation des réponses neuronales dans les régions associées à l’escompte des récompenses et, par conséquent, leur valeur subjective globale, sans effet évident pour l'utilité réelle des récompenses. En résumé, cette étude fournit des preuves que la dopamine contrôle la manière dont le moment d'une récompense est incorporé dans la construction de sa valeur ultime. Cela suggère un nouveau mécanisme par lequel la dopamine contrôle le choix humain et, par conséquent, des caractères tels que l'impulsivité.

Nos résultats ajoutent du poids à la suggestion que l'impulsivité n'est pas un construit unitaire et que différents sous-types d'impulsivité peuvent être dissociés pharmacologiquement et neurobiologiquement (Evenden, 1999; Ho et al., 1999; Winstanley et al., 2004a; Dalley et al., 2008). Les effets de la dopamine n'étaient observables que dans le choix impulsif tel que mesuré par le résultat du choix / préférence mais n’avaient pas d’incidence sur la délibération - «tenir vos chevaux» (Frank et al., 2007) —Qu’il se produit lorsque les options sont étroitement évaluées, engendrant décision-conflit (Botvinick, 2007; Pochon et al., 2008) également liés à l'impulsivité de la réflexion ou de la préparation (Evenden, 1999; Clark et al., 2006).

Aucune étude humaine n'a encore démontré la propension de la dopamine à augmenter l'impulsivité temporelle. Des manipulations antérieures de la dopamine chez les rongeurs ont montré des effets incohérents dans le choix intertemporel, certaines montrant que l'amélioration de la dopamine conduit à une diminution du choix impulsif ou que l'atténuation de la dopamine conduit à une augmentation (Richards et al., 1999; Cardinal et al., 2000; Wade et al., 2000; Isles et al., 2003; Winstanley et al., 2003; van Gaalen et al., 2006; Bizot et al., 2007; Floresco et al., 2008), alors que d’autres démontrent le contraire, un effet dépendant de la dose ou aucun effet (Logue et al., 1992; Charrier et Thiébot, 1996; Evenden et Ryan, 1996; Richards et al., 1999; Cardinal et al., 2000; Isles et al., 2003; Helms et al., 2006; Bizot et al., 2007; Floresco et al., 2008) Un certain nombre de facteurs peuvent contribuer à ces divergences, à savoir si la manipulation a lieu avant ou après l'apprentissage, si un signal est présent pendant le délai, les effets du médicament présynaptiques par rapport aux effets postsynaptiques, le paradigme utilisé, le médicament utilisé / le récepteur ciblé, l'implication de la sérotonine , et en particulier le dosage du médicament. Des études humaines sur le choix intertemporel ont observé une augmentation de la maîtrise de soi (de Wit et al., 2002) ou aucun effet (Acheson et de Wit, 2008; Hamidovic et al., 2008) lors de l'amélioration de la fonction dopaminergique. La plupart de ces études sont compliquées par l'utilisation de stimulants monoaminergiques tels que l'amphétamine ou le méthylphénidate, qui sont souvent soupçonnés de réduire l'impulsivité. Ces études pourraient être confondues avec la libération concomitante de sérotonine (Kuczenski et Segal, 1997), qui est également impliqué dans la modulation du choix intertemporel. Plus précisément, il a été démontré que l’amélioration de la fonction sérotoninergique peut réduire l’impulsivité lors du choix intertemporel ou inversement (Wogar et al., 1993; Richards et Seiden, 1995; Poulos et al., 1996; Ho et al., 1999; Mobini et al., 2000) et que la destruction des neurones sérotoninergiques peut bloquer les effets de l'amphétamine (Winstanley et al., 2003) De plus, on pense que, sur la base de nombreuses preuves, des doses modérées d’amphétamine réduisent la neurotransmission de la dopamine via des effets présynaptiques, ce qui peut expliquer ses effets liés à la dose dans de nombreuses études antérieures ainsi que son efficacité thérapeutique (à doses modérées) TDAH potentiellement hyperdopaminergique (Seeman et Madras, 1998, 2002; Solanto, 1998, 2002; Solanto et al., 2001; de Wit et al., 2002). La l-Dopa n'a pas été utilisée auparavant pour influer sur le choix impulsif et offre peut-être des preuves plus convaincantes et plus directes du rôle de la dopamine. Bien que la l-dopa puisse entraîner des augmentations de la noradrénaline et que son mode d'action précis ne soit pas bien compris, la noradrénaline ne devrait pas jouer un rôle majeur dans la régulation du choix intertemporel (van Gaalen et al., 2006) De plus, il est possible que la l-dopa ait provoqué des effets subjectifs non relevés par les échelles subjectives utilisées ici.

Notre incapacité à trouver une réduction correspondante de l'impulsivité par rapport au placebo avec l'administration de l'antagoniste dopaminergique putatif halopéridol est susceptible de refléter un certain nombre de facteurs. Ceux-ci incluent les effets pharmacologiques ou la posologie non spécifiques et répandus de l'halopéridol - certaines études indiquent que l'halopéridol peut paradoxalement stimuler la dopamine à petites doses, en raison d'effets présynaptiques sur l'autorécepteur D2Frank et O'Reilly, 2006) De plus, les effets subjectifs causés par le médicament, y compris la réduction de la vigilance, peuvent avoir rendu les données plus bruyantes. Des études complémentaires devraient utiliser des antagonistes de la dopamine plus spécifiques pour déterminer si une réduction de la fonction de la dopamine peut réduire l'impulsivité chez l'homme.

La dopamine est connue pour avoir un effet dominant sur les comportements de récompense primitifs tels que l’approche et la consommation (Parkinson et al., 2002) Ces effets sont compatibles avec un rôle général dans la construction de la saillance incitative (Berridge, 2007; Robinson et Berridge, 2008) et sont plus difficiles à prendre en compte en termes d’apprentissage, en soi. La médiation des réponses non conditionnées et conditionnées de la dopamine est liée au concept d’impulsivité pavlovienne, dans lequel les réponses associées à des valeurs primaires et innées forment un ensemble d’actions simples, définies de manière évolutive, qui fonctionnent parallèlement et parfois en concurrence avec d’autres action fondée et dirigée vers un objectif (Dayan et al., 2006; Seymour et al., 2009) Il est important de noter que ces «valeurs et actions pavloviennes» dépendent de manière caractéristique de la proximité spatiale et temporelle des récompenses et, en tant que telles, constituent un mécanisme possible par lequel la dopamine pourrait contrôler le taux apparent d’actualisation temporelle. Si un tel processus sous-tend l'impulsivité induite par la dopamine dans cette tâche, cela suggérerait alors que ce système de réponse inné (pavlovien) fonctionne dans un contexte beaucoup plus large que celui actuellement apprécié, car les avantages de cette tâche sont des avantages secondaires se produisant à un minimum de 1. la semaine. Cette explication contraste avec l’idée d’une amélioration dopaminergique sélective d’un système (basé dans les zones limbiques) qui ne valorise que les avantages à court terme (McClure et al., 2004) Un tel compte en duel serait difficile à réconcilier avec des études antérieures (Kable et Glimcher, 2007; Pine et al., 2009), qui suggèrent que les zones limbiques valorisent les récompenses à tout moment.

Un tel récit soulève d’importantes questions sur la susceptibilité à l’impulsivité induite par la dopamine, qui dépend de l’amygdale, et que nous avons observées dans nos données. Ici, l'activité de l'amygdale en réponse à D covariable avec le degré auquel le comportement est devenu plus impulsif après la l-dopa. Dans le transfert pavlovien-instrumental (PIT), un phénomène dépendant de la connectivité entre l’amygdale et le striatum (Cardinal et al., 2002; Seymour et Dolan, 2008) et dont on sait que l’expression est modulée par la dopamine (Dickinson et al., 2000; Lex et Hauber, 2008), les valeurs pavloviennes appétissantes augmentent en répondant pour les récompenses. Notamment, la sensibilité individuelle à cette influence est corrélée à l'activité de l'amygdale (Talmi et al., 2008), suggérant que l’amygdale pourrait moduler la mesure dans laquelle les valeurs de récompense conditionnées primaires et non conditionnées influencent le choix instrumental (fondé sur l’habitude et dirigé par un objectif). Si tel est effectivement le cas, il prédit que la présentation simultanée et indépendante d'indices de récompense pendant le choix intertemporel pourrait provoquer une impulsivité temporelle accrue via un mécanisme dépendant de l'amygdale. Nous notons des preuves que les lésions de l’amygdale basolatérale augmentent l’impulsivité de choix chez les rongeurs (Winstanley et al., 2004b), une observation opposée à celle à laquelle nous nous attendions à partir des données actuelles. En revanche, il a déjà été rapporté que l’activité de l’amygdale était en corrélation avec l’ampleur de l’actualisation temporelle dans une étude d’IRMf (Hoffman et al., 2008) Ces questions fournissent une base pour des recherches futures pouvant tester systématiquement ces prévisions divergentes chez l'homme.

Enfin, ces résultats concernent un contexte clinique plus large et expliquent pourquoi on observe une augmentation des comportements impulsifs et à risque dans le syndrome de dysrégulation de la dopamine, la toxicomanie et le TDAH, qui sont tous associés à des états hyperdopaminergiques causés par une inondation ou une sensibilisation (Solanto, 1998, 2002; Seeman et Madras, 2002; Berridge, 2007; Robinson et Berridge, 2008; Dagher et Robbins, 2009; O'Sullivan et al., 2009) À l'appui de cette thèse, Voon et al. (2009) ont constaté que le statut de médicament dopaminergique chez les patients atteints de MP souffrant de troubles du contrôle des impulsions était associé à une augmentation des taux d'actualisation temporelle. En conclusion, les résultats présentés ici démontrent la capacité de la dopamine à améliorer l'impulsivité chez l'homme et offrent un nouvel aperçu de son rôle dans la modulation du choix impulsif dans le contexte de l'actualisation temporelle. Ces résultats suggèrent que les humains peuvent être sensibles à des périodes temporaires d'impulsivité accrue lorsque des facteurs qui augmentent l'activité de la dopamine, tels que les qualités sensorielles des récompenses, sont présents lors de la prise de décision.

Matériel complémentaire

suppl info

Remerciements

Ce travail a été financé par une subvention du programme Wellcome Trust à RJD, et AP a été soutenue par une bourse d'études du Conseil de recherche médicale. Nous remercions K. Friston, J. Roiser et V. Curran pour leur aide dans la planification et les analyses, ainsi que pour leurs discussions éclairantes.

Bibliographie

  1. Acheson A, de Wit H. Bupropion améliore l'attention, mais n'affecte pas le comportement impulsif chez les jeunes adultes en bonne santé. Exp Clin Psychopharmacol. 2008; 16: 113 – 123. [PubMed]
  2. Ainslie G. Récompense spécieuse: une théorie comportementale de l’impulsivité et du contrôle des pulsions. Psychol Bull. 1975; 82: 463 – 496. [PubMed]
  3. Berridge KC. Le débat sur le rôle de la dopamine dans la récompense: les arguments en faveur de la saillance des incitations. Psychopharmacologie. 2007; 191: 391–431. [PubMed]
  4. Bickel WK, Marsch LA. Vers une compréhension économique comportementale de la toxicomanie: processus d’escompte des délais. Dépendance. 2001; 96: 73 – 86. [PubMed]
  5. Bickel WK, ML Miller, Yi R, Kowal BP, le sous-ministre Lindquist et le juge Pitcock Comportemental et neuroéconomique de la toxicomanie: systèmes neuronaux concurrents et processus d'actualisation temporelle. La drogue dépend de l'alcool. 2007; 90 (Suppl. 1): S85 – S91. [Article gratuit PMC] [PubMed]
  6. JC Bizot, N Chenault, Houzé B, Herpin A, David S, Pothion S, Trovero F. Le méthylphénidate réduit le comportement impulsif chez les rats juvéniles Wistar, mais pas chez les rats adultes Wistar, SHR et WKY. Psychopharmacologie (Berl) 2007; 193: 215 – 223. [PubMed]
  7. Bond AJ, Lader MH. L'utilisation d'échelles analogiques pour évaluer les sentiments subjectifs. Br J Med. Psychol. 1974; 47: 211 – 218.
  8. Botvinick MM. Surveillance des conflits et prise de décision: concilier deux perspectives sur la fonction de la cingulaire antérieure. Cogn Affect Behav Neurosci. 2007; 7: 356 – 366. [PubMed]
  9. Cardinal RN, TW Robbins, Everitt BJ. Effets de la d-amphétamine, du chlordiazépoxide, de l'alpha-flupenthixol et de manipulations comportementales sur le choix du renforcement retardé, signalé et non signalé chez le rat. Psychopharmacologie. 2000; 152: 362 – 375. [PubMed]
  10. Cardinal RN, Juge Parkinson, Hall J, Everitt BJ. Emotion et motivation: le rôle de l'amygdale, du striatum ventral et du cortex préfrontal. Neurosci Biobehav Rev. 2002; 26: 321 – 352. [PubMed]
  11. Cardinal RN, Winstanley CA, Robbins TW, Everitt BJ. Systèmes corticostriataux limbiques et renforcement retardé. Ann NY Acad Sci. 2004; 1021: 33 – 50. [PubMed]
  12. Charrier D, Thiébot MH. Effets des substances psychotropes sur la réponse du rat dans un paradigme opérant impliquant le choix entre des agents de renforcement retardés. Pharmacol Biochem Behav. 1996; 54: 149 – 157. [PubMed]
  13. Clark L, TW Robbins, Ersche KD, BJ Sahakian. Impulsivité par réflexion chez les toxicomanes actuels et anciens. Biol Psychiatry. 2006; 60: 515 – 522. [PubMed]
  14. Dagher A, Robbins TW. Personnalité, dépendance, dopamine: aperçus de la maladie de Parkinson. Neuron. 2009; 61: 502-510. [PubMed]
  15. Dalley JW, AC Mar, Economidou D, Robbins TW. Mécanismes neurocomportementaux de l'impulsivité: systèmes fronto-striataux et neurochimie fonctionnelle. Pharmacol Biochem Behav. 2008; 90: 250 – 260. [PubMed]
  16. Dayan P, Niv Y, Seymour B, Daw ND. Le mauvais comportement de la valeur et la discipline de la volonté. Neural Netw. 2006; 19: 1153 – 1160. [PubMed]
  17. Deichmann R, Juge Gottfried, C Hutton et Turner R., EPI optimisé pour les études IRMf du cortex orbitofrontal. Neuroimage. 2003; 19: 430 – 441. [PubMed]
  18. de Wit H., Enggasser JL, Richards JB. L'administration aiguë de d-amphétamine diminue l'impulsivité chez les volontaires sains. Neuropsychopharmacologie. 2002; 27: 813 – 825. [PubMed]
  19. Dickinson A, Smith J, Mirenowicz J. Dissociation de l'apprentissage pavlovien et instrumental sous agonistes de la dopamine. Behav Neurosci. 2000; 114: 468 – 483. [PubMed]
  20. Evenden JL. Variétés d'impulsivité. Psychopharmacologie. 1999; 146: 348 – 361. [PubMed]
  21. Evenden JL, Ryan CN. La pharmacologie du comportement impulsif chez le rat: les effets des médicaments sur le choix de la réponse avec des retards de renforcement variables. Psychopharmacologie. 1996; 128: 161 – 170. [PubMed]
  22. Floresco SB, Tse MT, Ghods-Sharifi S. Régulation dopaminergique et glutamatergique de la prise de décision basée sur l’effort et les délais. Neuropsychopharmacologie. 2008; 33: 1966 – 1979. [PubMed]
  23. Frank MJ, O'Reilly RC. Un compte mécaniste de la fonction dopaminergique striatale dans la cognition humaine: études psychopharmacologiques avec la cabergoline et l'halopéridol. Behav Neurosci. 2006; 120: 497-517. [PubMed]
  24. Frank MJ, Samanta J, Moustafa AA, Sherman SJ. Tenez vos chevaux: impulsivité, stimulation cérébrale profonde et médicaments dans le parkinsonisme. Science. 2007; 318: 1309 – 1312. [PubMed]
  25. Hamidovic A, Kang UJ, de Wit H. Effets de doses aiguës faibles à modérées de pramipexole sur l'impulsivité et la cognition chez des volontaires en bonne santé. J Clin Psychopharmacol. 2008; 28: 45 – 51. [PubMed]
  26. Helms CM, JM Reeves, Mitchell SH. Impact de la souche et de l'amphétamine D sur l'impulsivité (remise différée) chez des souris consanguines. Psychopharmacologie (Berl) 2006; 188: 144 – 151. [PubMed]
  27. Ho MY, Mobini S, TJ Chiang, CM Bradshaw, Szabadi E. Théorie et méthode de l'analyse quantitative du comportement du «choix impulsif»: implications pour la psychopharmacologie. Psychopharmacologie. 1999; 146: 362 – 372. [PubMed]
  28. Hoffman WF, DL Schwartz, MS Huckans, McFarland BH, Meiri G, Stevens AA, Mitchell SH. Activation corticale au cours du retard en diminuant chez les individus dépendants de la méthamphétamine abstinents. Psychopharmacologie. 2008; 201: 183 – 193. [Article gratuit PMC] [PubMed]
  29. Îles AR, Humby T, Wilkinson LS. Mesurer l'impulsivité chez des souris à l'aide d'une nouvelle tâche de renforcement retardé opérante: effets des manipulations comportementales et de la d-amphétamine. Psychopharmacologie (Berl) 2003; 170: 376 – 382. [PubMed]
  30. Kable JW, Glimcher PW. Les corrélats neuronaux de la valeur subjective lors du choix intertemporel. Nat Neurosci. 2007; 10: 1625 – 1633. [Article gratuit PMC] [PubMed]
  31. Kuczenski R, Segal DS. Effets du méthylphénidate sur la dopamine, la sérotonine et la noradrénaline extracellulaires: Comparaison avec l'amphétamine. J Neurochem. 1997; 68: 2032 – 2037. [PubMed]
  32. Lex A, Hauber W. Dopamine Les récepteurs D1 et D2 du noyau et de la coque du noyau accumbens assurent la médiation du transfert instrumental pavlovien. Apprendre Mem. 2008; 15: 483 – 491. [Article gratuit PMC] [PubMed]
  33. Logue AW, Tobin H, JJ Chelonis, Wang RY, Geary N, Schachter S. La cocaïne diminue la maîtrise de soi chez le rat: un rapport préliminaire. Psychopharmacologie. 1992; 109: 245 – 247. [PubMed]
  34. Mai JK, Assheuer J, Paxinos G. Atlas du cerveau humain. Ed 2 Academic; San Diego: 2003.
  35. Mazur JE. Une procédure d'ajustement pour étudier le ferraillage retardé. Dans: Commons ML, JE Mazur, JA Nevin, Rachlin H, rédacteurs. Analyses quantitatives du comportement. V. L’effet du retard et des événements intermédiaires sur la valeur de renforcement. Lawrence Erlbaum; Hillsdale, NJ: 1987. pp. 55 – 73.
  36. McClure SM, Laibson DI, Loewenstein G, Cohen JD. Les systèmes neuronaux distincts valorisent les récompenses monétaires immédiates et différées. Science. 2004; 306: 503 – 507. [PubMed]
  37. Mobini S, TJ Chiang, AS Al-Ruwaitea, Ho MY, CM Bradshaw, E. Szabadi. Effet de la déplétion centrale de 5-hydroxytryptamine sur le choix intertemporel: analyse quantitative. Psychopharmacologie (Berl) 2000; 149: 313 – 318. [PubMed]
  38. O'Sullivan SS, Evans AH, Lees AJ. Syndrome de dysrégulation de la dopamine: un aperçu de son épidémiologie, de ses mécanismes et de sa gestion. Médicaments du SNC. 2009; 23: 157-170. [PubMed]
  39. Parkinson JA, Dalley JW, cardinal RN, Bamford A, Fehnert B, G Lachenal, Rudarakanchana N, Halkerston KM, Robbins TW, Everitt BJ. L’appauvrissement en dopamine du noyau accumbens nuit à la fois à l’acquisition et à la performance du comportement d’approche pavlovienne appétent: implications pour la fonction dopaminergique de mésoaccumbens. Behav Brain Res. 2002; 137: 149 – 163. [PubMed]
  40. Pine A, Seymour B, JP Roiser, P Bossaerts, KJ Friston, HV Curran, RJ Dolan. Encodage d'une utilité marginale dans le temps dans le cerveau humain. J Neurosci. 2009; 29: 9575 – 9581. [Article gratuit PMC] [PubMed]
  41. Pochon JB, J Riis, Sanfey AG, Nystrom LE, Cohen JD. Imagerie fonctionnelle du conflit de décision. J Neurosci. 2008; 28: 3468 – 3473. [PubMed]
  42. Poulos CX, Parker JL, Le AD. Dexfenfluramine et 8-OHDPAT modulent l'impulsivité dans un paradigme de délai de récompense: implications pour une correspondance avec la consommation d'alcool. Comportement Pharmacol. 1996; 7: 395 – 399. [PubMed]
  43. Redish AD. La dépendance en tant que processus de calcul a mal tourné. Science. 2004; 306: 1944 – 1947. [PubMed]
  44. Richards JB, LS Seiden. L’appauvrissement en sérotonine augmente le comportement impulsif chez le rat. Soc Neurosci Abstr. 1995; 21: 1693.
  45. Richards JB, Sabol KE, de Wit H. Effets de la méthamphétamine sur la procédure d'ajustement de la quantité ajustée, modèle de comportement impulsif chez le rat. Psychopharmacologie. 1999; 146: 432 – 439. [PubMed]
  46. Robinson TE, Berridge KC. La théorie de la toxicomanie de la toxicomanie: quelques problèmes actuels. Philos Trans R Soc Lond B Biol Sci. 2008; 363: 3137 – 3146. [Article gratuit PMC] [PubMed]
  47. Sagvolden T, sergent JA. Trouble de déficit de l'attention / hyperactivité - des dysfonctionnements cérébraux au comportement. Behav Brain Res. 1998; 94: 1 – 10. [PubMed]
  48. Seeman P, Madras BK. Médicament anti-hyperactivité: méthylphéni-date et amphétamine. Psychiatrie Mol. 1998; 3: 386 – 396. [PubMed]
  49. Seeman P, Madras B. Le méthylphénidate élève la dopamine au repos, ce qui diminue la libération de dopamine déclenchée par impulsion: une hypothèse. Behav Brain Res. 2002; 130: 79 – 83. [PubMed]
  50. Seymour B, Dolan R. Émotion, prise de décision et l'amygdale. Neurone. 2008; 58: 662 – 671. [PubMed]
  51. Seymour B, W Yoshida, Dolan R. Apprentissage altruiste. Front Behav Neurosci. 2009; 3: 23. [Article gratuit PMC] [PubMed]
  52. Solanto MV. Mécanismes neuropsychopharmacologiques de l'action des médicaments stimulants dans le trouble d'hyperactivité avec déficit de l'attention: revue et intégration. Behav Brain Res. 1998; 94: 127 – 152. [PubMed]
  53. Solanto MV. Dysfonctionnement de la dopamine dans les TDA / H: intégration de la recherche clinique et de la neuroscience fondamentale. Behav Brain Res. 2002; 130: 65 – 71. [PubMed]
  54. Solanto MV, Abikoff H., E. Sonuga-Barke, R. Schachar, D. Logan, T. Wigal, L. Hechtman, S. Hinshaw et E. Turkel. La validité écologique de l’aversion pour le retard et de l’inhibition de la réponse en tant que mesures de l’impulsivité dans le traitement AD / HD l’étude de traitement multimodal NIMH de la TDA / HD. J Abnorm Child Psychol. 2001; 29: 215 – 228. [PubMed]
  55. Talairach J, Tournoux P. Atlas stéréotaxique coplanaire du cerveau humain. Thieme Publishing Group; Stuttgart: 1988.
  56. Talmi D, Seymour B, Dayan P, Dolan RJ. Transfert humain-pavlovien-instrumental. J Neurosci. 2008; 28: 360 – 368. [Article gratuit PMC] [PubMed]
  57. Tanaka SC, K Doya, G Okada, K Ueda, Y Okamoto et Yamawaki S. La prévision des récompenses immédiates et futures recrute différemment les boucles des ganglions cortico-basaux. Nat Neurosci. 2004; 7: 887 – 893. [PubMed]
  58. van Gaalen MM, van Koten R, AN Schoffelmeer, LJ Vanderschuren. Implication critique de la neurotransmission dopaminergique dans la prise de décision impulsive. Biol Psychiatry. 2006; 60: 66 – 73. [PubMed]
  59. Voon V, B Reynolds, B Brezing C, Gallea C, M Skaljic, Ekanayake V, H Fernandez, MN Potenza, RJ Dolan, Hallett M. Choix impulsif et réponse dans les comportements de contrôle des impulsions liés à l'agoniste de la dopamine. Psychopharmacologie (Berl) 2009; 207: 645 – 659. [Article gratuit PMC] [PubMed]
  60. Wade TR, de Wit H, Richards JB. Effets des médicaments dopaminergiques sur la récompense différée en tant que mesure du comportement impulsif chez le rat. Psychopharmacologie. 2000; 150: 90 – 101. [PubMed]
  61. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. L’appauvrissement global en 5-HT atténue la capacité de l’amphétamine à réduire le choix impulsif lorsqu’une tâche de remise de délai est effectuée chez le rat. Psychopharmacologie. 2003; 170: 320 – 331. [PubMed]
  62. Winstanley CA, Dalley JW, Theobald DE, Robbins TW. Impulsivité de fractionnement: effets contrastés de l'épuisement central de 5-HT sur différentes mesures du comportement impulsif. Neuropsychopharmacologie. 2004a; 29: 1331 – 1343. [PubMed]
  63. Winstanley CA, Theobald DE, cardinal RN, Robbins TW. Rôles contrastés de l’amygdale basolatérale et du cortex orbitofrontal dans le choix impulsif. J Neurosci. 2004b; 24: 4718 – 4722. [PubMed]
  64. Winstanley CA, DM Eagle, Robbins TW. Modèles comportementaux de l'impulsivité vis-à-vis du TDAH: traduction entre études cliniques et précliniques. Clin Psychol Rev. 2006; 26: 379 – 395. [Article gratuit PMC] [PubMed]
  65. Wogar MA, CM Bradshaw, Szabadi E. Effets des lésions des voies ascendantes 5-hydroxytryptaminergiques sur le choix des renforcements retardés. Psychopharmacologie. 1993; 113: 239 – 243. [PubMed]