Contributions dissociables des récepteurs préfrontal D1 et D2 à la prise de décision en fonction du risque (2011)

 J Neurosci. 2011 juin 8; 31 (23): 8625-33.

St Onge JR, H Abhari, Floresco SB.

Identifier

Département de psychologie et de centre de recherche sur le cerveau, Université de la Colombie-Britannique, Vancouver, Colombie-Britannique V6T 1Z4, Canada

Abstract

Il a été proposé que les choix entre des récompenses certaines et des récompenses incertaines de différentes amplitudes soient médiatisés à la fois par les lobes frontaux et par le système dopaminergique mésocorticolimbique (DA). Chez le rat, des manipulations systémiques de l'activité de l'AD ou l'inactivation du cortex préfrontal médian perturbent la prise de décision en matière de risques et de bénéfices. Cependant, on ne voit pas clairement en quoi la transmission PFC DA contribue à ces processus. Nous avons abordé cette question en examinant les effets des manipulations pharmacologiques des récepteurs D1 et D2 dans le PFC médian (prélimbique) selon le choix entre des récompenses petites, certaines et grandes, mais probabilistes. Les rats ont été entraînés à une tâche d’escompte probabiliste où un levier livrait un comprimé avec une probabilité de 100% et l’autre livrait quatre comprimés, mais la probabilité de recevoir une récompense diminuait d’un bloc d’essai à l’autre (100, 50, 25, 12.5%). Le blocage de D1 (SCH23390) dans le PFC médian a diminué la préférence pour l’option grande / risquée. En revanche, le blocage par D2 (éticlopride) a réduit l’actualisation probabiliste et augmenté le choix risqué. L'agoniste de D1, SKF81297, a provoqué une légère augmentation, non significative, de la préférence pour le levier grand / risqué. Cependant, la stimulation des récepteurs D2 (quinpirole) a induit une véritable altération de la prise de décision, en aplatissant la courbe d’actualisation et en biaisant le choix par rapport à l’option risquée quand elle était plus ou moins avantageuse, respectivement. Ces résultats suggèrent que les récepteurs PFC D1 et D2 apportent des contributions dissociables, mais complémentaires, aux jugements du risque / rendement. En établissant un juste équilibre entre l'activité des récepteurs D1 / D2, DA peut aider à affiner ces jugements, en favorisant soit l'exploitation des circonstances favorables actuelles, soit l'exploration de conditions plus rentables lorsque les conditions changent.

Introduction

Les aberrations du système dopaminergique mésocorticolimbique (DA) ont été liées à de profonds déficits décisionnels associés à certaines maladies psychiatriques. Il s'agit notamment des personnes atteintes de schizophrénie (Hutton et al., 2002), de la maladie de Parkinson (Pagonabarraga et al., 2007) et de dépendance aux stimulants (Rogers et al., 1999). Les modèles animaux de prise de décision ont révélé que les manipulations de la transmission de l'AD peuvent profondément modifier les choix entre des récompenses petites et faciles à obtenir et des récompenses importantes mais plus coûteuses. Le blocage systémique des récepteurs D1 ou D2 réduit la préférence d'attendre plus longtemps ou de travailler plus dur pour obtenir une plus grande récompense, tandis que l'augmentation de la transmission DA exerce des effets différentiels sur la prise de décision basée sur l'effort ou le retard, augmentant ou diminuant la préférence pour des récompenses plus importantes qui accompagnent un coût plus élevé (Cousins ​​et coll., 1994; Cardinal et coll., 2000; Denk et coll., 2005; van Gaalen et coll., 2006; Floresco et coll., 2008a; Bardgett et coll., 2009). De même, lorsque les rats choisissent entre de petites, certaines et de grandes récompenses, mais néanmoins risquées, pour une tâche d’escompte probabiliste, l’administration systémique d’antagonistes de D1 ou de D2 réduit la préférence pour les grandes options risquées. (St. Onge et Floresco, 2009). À l’inverse, les agonistes D1 ou D2 privilégient les grandes options risquées. Cependant, étant donné que de nombreuses régions du cerveau ont été impliquées dans les jugements du risque / rendement (par exemple, les lobes frontaux, le striatum ventral, l'amygdale) (Floresco et al., 2008b), les régions terminales sur lesquelles l'AD peut agir pour influencer ces processus restent floues. .

DA module plusieurs fonctions cognitives médiées par différentes régions du cortex préfrontal (PFC), telles que la flexibilité comportementale, la mémoire de travail et les processus attentionnels (Williams et Goldman-Rakic, 1995; Granon et al., 2000; Chudasama et Robbins, 2004; Floresco et al., 2006), souvent dans une courbe en forme de «U inversé», où trop ou trop peu d'activité de DA nuit à certaines fonctions exécutives. Cependant, il y a eu relativement peu d'études sur la contribution de la transmission du DA de PFC à différentes formes de prise de décision en termes de coûts / bénéfices. La réduction de l'activité des DA dans le cingulaire antérieur modifie les décisions basées sur l'effort (Schweimer et al., 2005; Schweimer et Hauber, 2006), tandis que le blocage ou la stimulation des récepteurs DFCXXX médians de PFC réduit la préférence pour des récompenses différées plus importantes (Loos et al., 1). ). Notamment, aucune étude n'a été menée sur la contribution de différents récepteurs DA du PFC à la prise de décision en fonction du risque.

Des travaux récents ont identifié le PFC médian pré-limbique comme une région critique dans la médiation de l’escompte probabiliste, alors que l’activité dans les autres sous-régions (cingulaire antérieure, orbitofrontal, insulaire) ne semble pas contribuer à ce comportement (St. Onge et Floresco, 2010). L'inactivation du PFC médian a augmenté la préférence pour des récompenses probabilistes plus grandes lorsque les chances de les obtenir diminuaient au cours d'une session, mais diminuaient le choix lorsque les probabilités de récompenses augmentaient au cours d'une session. Les résultats de cette étude nous ont amenés à conclure que le PFC médian permet d'intégrer des informations sur l'évolution des probabilités de récompense afin d'actualiser les représentations de valeur facilitant une prise de décision plus efficace. Étant donné le rôle critique que jouent les DA mésocorticaux dans d'autres formes de cognition (Floresco et Magyar, 2006), la présente étude a examiné la contribution de l'activité des récepteurs préfrontaux D1 / D2 à la prise de décision fondée sur le risque en utilisant une tâche de réduction probabiliste.

Matériels et méthodes

Animaux.

Des rats mâles Long – Evans (Charles River Laboratories) pesant de 275 à 300 g au début de l'entraînement comportemental ont été utilisés pour l'expérience. À leur arrivée, les rats ont reçu une semaine pour s'acclimater à la colonie et la nourriture a été limitée à 1–85% de leur poids d'alimentation libre pendant une semaine supplémentaire avant l'entraînement comportemental. Les rats ont eu accès ad libitum à l'eau pendant la durée de l'expérience. L'alimentation a eu lieu dans les cages domestiques des rats à la fin de la journée expérimentale, et le poids corporel a été surveillé quotidiennement pour assurer une perte de poids régulière pendant la restriction alimentaire et l'entretien ou la prise de poids pour le reste de l'expérience. Tous les tests ont été effectués conformément au Conseil canadien de protection des animaux et au Comité de protection des animaux de l'Université de la Colombie-Britannique.

Appareil.

Les tests comportementaux ont été réalisés dans des enceintes 12 (30.5 × 24 × 21 cm; Med Associates) enfermées dans des boîtiers insonorisants, équipés chacun d'un ventilateur assurant la ventilation et masquant les bruits parasites. Chaque chambre était équipée de deux leviers rétractables, situés de part et d'autre d'un récipient pour aliments central où les renforts alimentaires (45 mg; Bio-Serv) étaient distribués via un distributeur de pellets. Les chambres ont été éclairées par une seule lampe 100 mA située dans le haut, au centre du mur, en face des leviers. Quatre photobeams infrarouges ont été montés sur les côtés de chaque chambre. L'activité locomotrice a été indexée par le nombre de ruptures de photobeam qui se sont produites pendant une session. Toutes les données expérimentales ont été enregistrées par un ordinateur personnel IBM connecté aux chambres via une interface.

Entraînement au levier.

Nos protocoles de formation initiaux étaient identiques à ceux de St. Onge et Floresco (2009), tels qu'adaptés de Cardinal et al. (2000). La veille de leur première exposition dans les chambres, les rats recevaient des pastilles de récompense de sucre ∼25 dans leur cage d'origine. Le premier jour de formation, les pastilles 2 – 3 ont été introduites dans le gobelet et les pastilles broyées ont été placées sur un levier avant que l'animal ne soit placé dans la chambre. Les rats ont d'abord été entraînés selon un programme 1 à rapport fixe sur un critère d'appuis 60 en 30 min, tout d'abord pour un levier, puis répétés pour l'autre levier (contrebalancé gauche / droite entre les sujets). Les rats ont ensuite été formés à une version simplifiée de la tâche complète. Ces sessions d’essai 90 ont débuté avec les leviers rétractés et la chambre opérant dans l’obscurité. Tous les 40, un essai était initié avec l’illumination de la lumière de la maison et l’insertion d’un des deux leviers dans la chambre. Si le rat ne répondait pas sur le levier dans 10, le levier était rétracté, la chambre s'assombrissait et le procès était considéré comme une omission. Si le rat répond dans les limites de 10, le levier se rétracte et une seule pastille est délivrée avec une probabilité de 50%. Cette procédure a été utilisée pour familiariser les rats avec la nature probabiliste de la tâche complète. Dans chaque paire d'essais, le levier gauche ou droit a été présenté une fois et l'ordre dans la paire d'essais était aléatoire. Les rats ont été formés à l'utilisation de ∼5 – 6 d selon un critère d'évaluation de 80 ou d'essais plus réussis (c'est-à-dire des omissions ≤10).

Tâche de réduction probabiliste.

La tâche principale utilisée dans ces études a été décrite précédemment (Floresco et Whelan, 2009; Ghods-Sharifi et al., 2009; St. Onge et Floresco, 2009, 2010; St. Onge et al., 2010) et a été modifié à l’origine de celui décrit par Cardinal et Howes (2005) (Fig. 1). En bref, les rats ont reçu des séances quotidiennes comprenant des essais sur 72, séparés en blocs 4 des essais sur 18. La session entière a duré au minimum 48, et les animaux ont été entraînés 6 – 7 par semaine. Une session a commencé dans l'obscurité avec les deux leviers rétractés (état intertrial). Un essai a commencé chaque 40 avec l’éclairage de la lumière de la maison et, plus tard, avec l’insertion d’un ou des deux leviers dans la chambre (le format d’un seul essai est montré à la Fig. 1). Un levier a été désigné levier grand / risqué, l'autre levier petit / certain, qui est resté cohérent tout au long de la formation (équilibré gauche / droite). Si le rat ne répondait pas en appuyant sur un levier dans la présentation du levier, la chambre était réinitialisée à l’état intermédiaire jusqu’au prochain essai (omission). Lorsqu'un levier a été choisi, les deux leviers se sont rétractés. Le choix du levier faible / certain a toujours livré une pastille avec% de probabilité 100; choix des pastilles 4 livrées avec grand levier / risque, mais avec une probabilité particulière. Lorsque la nourriture a été livrée, la lumière de la maison est restée allumée pendant un autre 4 après la réponse, après quoi la chambre est revenue à l’état intermédiaire. Plusieurs pellets ont été livrés séparés de 0.5. Les blocs 4 comprenaient des essais à choix forcés 8 dans lesquels un seul levier était présenté (essais 4 pour chaque levier, randomisés par paires), permettant aux animaux de se renseigner sur la probabilité relative de recevoir une récompense plus ou moins grande dans chaque bloc. Cela a été suivi d'essais à choix libre 10, dans lesquels les deux leviers ont été présentés et l'animal a choisi le levier petit / sûr ou grand / risqué. La probabilité d'obtenir des pastilles 4 après avoir appuyé sur le levier grand / risqué variait d'un bloc à l'autre: il s'agissait initialement de 100%, puis de 50%, 25% et 12.5%, respectivement, pour chaque bloc successif. La probabilité de recevoir la récompense importante à chaque essai a été tirée d'une distribution de probabilité définie. En utilisant ces probabilités, la sélection du levier grand / risqué serait avantageuse dans les deux premiers blocs et désavantageuse dans le dernier bloc, alors que les rats pourraient obtenir un nombre équivalent de granulés alimentaires après avoir répondu sur chaque levier pendant le bloc 25%. Par conséquent, dans les trois derniers blocs d’essais de cette tâche, la sélection de l’option de récompense la plus grande comporte un «risque» inhérent de ne pas obtenir de récompense lors d’un essai donné. Des latences pour initier un choix et une activité locomotrice globale (ruptures de faisceaux de cellules) ont également été enregistrées. Les rats ont été formés à la tâche jusqu'à ce que, en groupe, ils (1) aient choisi le levier gros / risqué lors du premier bloc d'essais (probabilité 100) sur au moins 80% d'essais réussis et (2) a démontré des niveaux de base stables de choix, évalué en utilisant une procédure similaire à celle décrite par Winstanley et al. (2005) et St. Onge et Floresco (2009). En résumé, les données de trois sessions consécutives ont été analysées avec une ANOVA à mesures répétées avec deux facteurs intra-sujets (jour et bloc d'essai).

Figure 1.

Conception des tâches. Éventualités coûts / avantages associées à la réponse sur l'un des leviers (A) et le format d'un seul essai à libre choix (B) sur la tâche d'actualisation probabiliste.

Récompense tâche de discrimination de magnitude.

Comme nous l’avons fait précédemment (Ghods-Sharifi et al., 2009; Stopper et Floresco, 2011), nous avons déterminé a priori que, si un traitement particulier diminuait spécifiquement la préférence pour le levier important / risqué de la tâche d’actualisation probabiliste, des groupes distincts d’animaux seraient formés et testés sur une tâche de discrimination de l’ampleur de la récompense afin de déterminer si cet effet était dû à une altération de la distinction entre les amplitudes de la récompense associées aux deux leviers. Dans ces expériences, les rats ont été entraînés à appuyer sur les leviers rétractables comme dans la tâche de réduction probabiliste, après quoi ils ont été formés à la tâche de discrimination. Ici, les rats ont choisi entre un levier qui a livré une pastille et un autre qui a livré quatre pastilles. Les récompenses petites et grandes ont été distribuées immédiatement après une réponse unique avec une probabilité de 100%. Une session consistait en quatre blocs d'essais, chaque bloc étant constitué d'un choix forcé 2 suivi d'essais à choix libre 10.

Chirurgie.

Les rats ont été soumis à une intervention chirurgicale une fois que le groupe a présenté des schémas de choix stables pour les jours consécutifs 3. Une fois le critère de stabilité atteint, les rats recevaient de la nourriture à volonté et, plus tard, 2 avaient subi une chirurgie stéréotaxique. Les rats ont été anesthésiés avec du 100 en mg / kg de chlorhydrate de kétamine et du 7 en mg / kg de xylazine, puis ont été implantés avec une canule de guidage en acier inoxydable de calibre 23 bilatérale dans la région pré-limique du PFC médial (crâne plat; antéro-postérieur, + 3.4 mm; médial-latéral, ± 0.7 mm de bregma et dorsoventral, -2.8 mm de dura). Des obdurateurs de jauge trente, affleurant l'extrémité de la canule guide, sont restés en place jusqu'à ce que les infusions soient faites. Les rats ont reçu au moins 7 d pour se remettre de la chirurgie avant les tests. Au cours de cette période de récupération, les animaux ont été manipulés pendant au moins 5 min chaque jour et les aliments ont été limités à 85% de leur poids en alimentation gratuite. Les poids corporels ont fait l'objet d'une surveillance continue quotidienne afin de garantir une perte de poids constante pendant cette période de récupération.

Protocole de microinfusion.

Après avoir récupéré de l’opération, les rats ont ensuite été formés à la tâche d’escompte probabiliste ou de discrimination de l’ampleur de la récompense pour au moins 5 d et jusqu’à ce qu’ils présentent, en tant que groupe, des comportements stables. Pour 3 d avant le premier jour du test de microinfusion, les obdurateurs ont été retirés et une procédure de perfusion simulée a été administrée. Des injecteurs en acier inoxydable ont été placés dans les canules de guidage pour 2 min, mais aucune perfusion n’a eu lieu. Cette procédure habituait les rats à la routine des perfusions afin de réduire le stress les jours de test suivants. Le jour après avoir affiché une réduction stable, le groupe a reçu son premier jour de test de microinfusion.

Une conception intra-sujets a été utilisée pour toutes les expériences. Les médicaments suivants ont été utilisés: antagoniste de D1, chlorhydrate de R - (+) - SCH23390 (1.0 μg, 0.1 μg; Sigma-Aldrich), antagoniste de D2, chlorhydrate d’éticlopride (1.0 μg, 0.1 μg; 1 μg; Sigma-Aldrich), le DXN SKF81297 (0.4, 0.1, Tocris Bioscience) et le quinpirole agoniste D2 (10, 1, Sigma-Aldrich). Tous les médicaments ont été dissous dans du sérum physiologique 0.9% physiologique, traités par ultrasons jusqu'à dissolution et protégés de la lumière. Les doses sélectionnées ont toutes été bien documentées, à la fois par notre groupe et par d’autres, comme ayant un comportement actif lorsqu’elles sont administrées par voie intracérébrale (Seamans et coll., 1998; Ragozzino, 2002; Chudasama et Robbins, 2004; Floresco et Magyar, 2006; Floresco et al., 2006; Haluk et Floresco, 2009; Loos et al., 2010).

Les perfusions d'antagonistes, d'agonistes et de solution saline D1 et D2 ont été administrées bilatéralement dans le PFC médian via une pompe à microseringue reliée à une tubulure en PE et à une canule de jauge 30 dépassant X mm environ l'extrémité du guide, à une vitesse de 0.8 μl / 0.5. s. Les canules d'injection ont été laissées en place pendant un 75 min supplémentaire pour permettre la diffusion. Chaque rat est resté dans sa cage d'origine pendant une autre période 1 min avant les tests comportementaux.

Quatre groupes séparés de rats ont été utilisés pour tester les effets de chacun des quatre composés (antagoniste D1, antagoniste D2, agoniste D1, agoniste D2). L'ordre des traitements (solution saline, faible dose, dose élevée) a été contrebalancé chez les rats d'un groupe de traitement particulier. Après le premier jour de test de perfusion, les rats ont reçu un jour de formation de base (pas de perfusion). Si, pour un rat individuel, le choix du levier grand / risqué ce jour s'écartait de> 15% de sa valeur initiale de préinfusion, le rat recevait une journée supplémentaire d'entraînement avant le deuxième test de perfusion. Le jour suivant, les rats ont reçu une deuxième perfusion contrebalancée, suivie d'un autre jour de référence, et enfin la dernière perfusion.

Histologie.

Une fois tous les tests de comportement terminés, les rats ont été sacrifiés dans une chambre à dioxyde de carbone. Les cerveaux ont été prélevés et fixés dans une solution de 4% formaline. Les cerveaux ont été congelés et coupés en tranches de 50 μm avant d’être montés et colorés au violet de crésyl. Les placements ont été vérifiés par rapport à l’atlas neuroanatomique de Paxinos et Watson (1998). Les emplacements des perfusions acceptables dans le PFC médian sont présentés dans les panneaux de droite de la figure 2.

Figure 2.

Histologie. Schéma des coupes coronales du cerveau de rat montrant la gamme d'emplacements acceptables de perfusions dans l'étendue rostrale-caudale du PFC médial pour tous les rats.

L'analyse des données.

La principale mesure dépendante de l'intérêt était le pourcentage de choix orientés vers le levier important / risqué pour chaque bloc d'essais à choix libre, en tenant compte des omissions d'essais. Pour chaque bloc, cela a été calculé en divisant le nombre de choix du levier grand / risqué par le nombre total d'essais réussis. Les données de choix pour chaque groupe de médicaments ont été analysées à l'aide d'ANOVA intra-sujet bidirectionnelles, avec le traitement (solution saline, faible dose, dose élevée) et le bloc d'essai (100, 50, 25, 12.5%) comme facteurs intra-sujet. L'effet principal du bloc pour les données de choix était significatif dans toutes les expériences d'actualisation (p <0.05), indiquant que les rats ont écarté le choix du levier grand / risqué à mesure que la probabilité de la grande récompense changeait dans les quatre blocs. Cet effet ne sera pas mentionné plus loin. Les latences de réponse, l'activité locomotrice (pauses photobeam) et le nombre d'omissions d'essais ont été analysés avec des ANOVA à un facteur.

Section précédenteSection suivante

Résultats

Quatre groupes d'animaux ont été initialement formés dans des expériences séparées et attribués à l'un des quatre groupes de médicaments. Les deux premiers groupes de 16, désignés chacun pour les expériences d'antagonistes D1 et D2, ont nécessité une formation moyenne de 28 d avant d'atteindre des performances de choix stables et de se soumettre à des tests de micro-infusion équilibrés. Les deux autres groupes de rats 14 et 14 pour les agonistes D1 et D2 ont nécessité une formation moyenne de 34 d avant d’atteindre une performance de choix stable. Les données de latence de réponse, d'omission locomotrice et d'essai obtenues les jours d'essai pour les quatre groupes sont présentées dans le tableau 1.

Tableau 1.

Données de locomotion, d'omission d'essai et de latence de réponse obtenues à la suite de perfusions de solution saline ou de médicament dans le PFC interne

Antagonisme des récepteurs D1 et D2 et actualisation probabiliste

Blocus D1

Au départ, 16 rats ont été entraînés pour cette expérience. Un animal est décédé pendant la chirurgie et les données de trois autres ont été éliminées en raison de placements inexacts, ce qui a abouti à un n = 12. L'analyse des données de choix a révélé que les perfusions intra-PFC de l'antagoniste D1 SCH23390 ont eu un effet principal significatif du traitement (F (2,22) = 3.26, p = 0.05) mais pas d'interaction traitement × bloc (F (6,66) = 0.92, ns). La dose élevée de SCH23390 (1 μg) a significativement diminué la préférence pour le levier grand / risqué dans les trois derniers blocs (p <0.05; Fig.3A), tandis que la faible dose (0.1 μg) n'a produit aucun changement fiable dans le comportement de choix. Le blocage D1 n'a eu aucun effet sur les latences de réponse (F (2,22) = 0.18, ns), les omissions d'essais (F (2,22) = 0.54, ns) ou le nombre de locomoteurs (F (2,22) = 1.66, ns ).

Figure 3.

Effets des manipulations du récepteur DA dans le PFC médial sur l'actualisation probabiliste. Les données sont représentées en termes de pourcentage de choix du levier grand / risqué lors des essais à choix libre par bloc de probabilité (axe des x). Les symboles représentent la moyenne + SEM. Les étoiles grises indiquent un effet principal significatif (solution saline vs dose élevée, p <0.05). Les étoiles noires indiquent une différence significative (p <0.05) entre les conditions de traitement pendant un effet principal de bloc de probabilité particulier. A, les perfusions de la dose de 1.0 μg de l'antagoniste D1 SCH23390 ont accéléré l'actualisation probabiliste, réduisant le choix risqué. B. En revanche, les perfusions de la dose de 1.0 μg de l'antagoniste D2 éticlopride ont retardé l'actualisation et augmenté le choix à risque. C, l'agoniste D1 SKF81297 a induit une légère augmentation non significative du choix à risque. D, les perfusions de la dose de 10 μg de l'agoniste D2 quinpirole ont aboli la réduction, diminuant le choix à risque pendant le bloc initial et augmentant le choix pendant le bloc final.

Blocus D2

Au départ, 16 rats ont été entraînés pour cette expérience. Un animal est décédé pendant la chirurgie et les données de trois autres ont été éliminées en raison de placements imprécis, ce qui a abouti à un n = 12. L'analyse des données de choix a également révélé un effet principal significatif du traitement (F (2,22) = 3.76, p <0.05) mais pas d'interaction traitement × bloc (F (6,66) = 0.84, ns). Cependant, contrairement aux effets du blocage des récepteurs D1, la dose élevée d'éticlopride (1 μg) a significativement augmenté la préférence pour le levier grand / risqué dans tous les blocs (p <0.05; Fig. 3B), avec la faible dose (0.1 μg ) produisant une augmentation légère mais non significative du choix. L'éticlopride n'a eu aucun effet sur les latences de réponse (F (2,22) = 0.63, ns), les omissions d'essais (F (2,22) = 1.45, ns) ou le nombre de locomotives (F (2,22) = 0.99, ns) . Ainsi, le blocage des récepteurs D1 ou D2 dans le PFC médial avait des effets qualitativement opposés sur l'actualisation probabiliste. La réduction de l'activité du récepteur D1 a augmenté l'actualisation des récompenses plus importantes et incertaines, tandis que l'antagonisme du récepteur D2 a réduit l'actualisation, reflétée par des diminutions apparentes et une augmentation des choix risqués, respectivement.

Stimulation des récepteurs D1 et D2 et actualisation probabiliste

Stimulation D1

Initialement, les rats 14 ont été formés pour cette expérience. Un animal est mort pendant la chirurgie et les données d'un rat ont été exclues car ses données de choix de base étaient XS 2 inférieures à la moyenne du reste du groupe, ce qui a abouti à un n final: 12. Après l'administration de l'agoniste D1 SKF81297 dans le PFC médian, les rats ont eu tendance à montrer un effet opposé à celui induit par l'antagoniste D1, affichant une préférence modérée pour le levier grand / risqué, cet effet étant numériquement plus important après traitement avec le dose inférieure de 0.1 en µg. Malgré cette tendance, l’analyse des données de choix n’a révélé aucun effet significatif du traitement (F (2,22) = 2.05, ns) ou du traitement × bloc-interaction (F (6,66) = 0.10, ns; Fig. 3C), bien qu’il la comparaison entre les conditions de traitement à faible dose et saline a montré une tendance à la signification statistique (p = 0.086). L'agoniste de D1 n'a ​​également eu aucun effet sur les latences de réponse (F (2,22) = 0.67, ns), les omissions d'essai (F (2,22) = 0.06, ns) ou les décomptes locomoteurs (F (2,22) = 0.36, ns).

Stimulation D2

Là encore, 14 rats ont été entraînés pour cette expérience. Les données d'un rat ont été exclues parce que ses données de choix de base ne montraient aucune actualisation importante après les 34 jours d'entraînement, tandis que les données relatives à un autre rat ont été éliminées en raison d'un placement incorrect, ce qui a abouti à un n = 12 final dans ce groupe. Le traitement avec l'agoniste D2 quinpirole a induit un effet sur le choix qui était unique par rapport à celui induit par l'antagoniste du récepteur DA ou l'agoniste D1. L'analyse des données de choix n'a révélé aucun effet principal significatif du traitement (F (2,22) = 0.05, ns), mais il y avait une interaction traitement × bloc significative (F (6,66) = 2.33, p <0.05, p de Dunnett <0.05). Des analyses simples des principaux effets ont en outre montré que, alors que la faible dose (1 μg) de quinpirole n'avait aucun effet sur le choix, la dose élevée (10 μg) produisait un «aplatissement» prononcé de la courbe d'actualisation. Plus précisément, cette dose diminuait significativement (p <0.05) le choix du levier grand / risqué dans le bloc initial à 100%, mais augmentait significativement le choix risqué lors du dernier bloc (12.5%) par rapport aux perfusions salines (Fig. 3D). De plus, après des perfusions de solution saline ou de la dose de 1.0 μg de quinpirole, les rats ont montré une réduction significative de l'option grande / risquée car les chances d'obtenir la récompense la plus élevée diminuaient au cours d'une session (p <0.005). En revanche, la proportion de choix de cette option n'a pas changé de manière significative dans les quatre blocs après traitement avec 10 μg de quinpirole (p> 0.25). Le quinpirole n'a eu aucun effet sur les omissions des essais (F (2,22) = 0.84, ns) ou le nombre de locomotives (F (2,22) = 1.72, ns), bien que la dose élevée ait significativement augmenté les latences de choix dans les quatre blocs (F ( 2,22) = 3.54, p <0.05 et Dunnett, p <0.05; tableau 1).

Analyse gagnant-séjour / perdant

Les perfusions d'agonistes ou d'antagonistes sélectifs des récepteurs D1 ou D2 dans le PFC médial ont chacune induit des effets distincts sur la prise de décision. Pour mieux comprendre comment ces traitements ont affecté les modèles de choix et les modifications résultantes de l'actualisation, nous avons effectué une analyse supplémentaire des données de choix. Plus précisément, nous avons effectué une analyse choix par choix pour déterminer si les changements de comportement étaient dus à des altérations de la probabilité de choisir le levier risqué après avoir obtenu la plus grande récompense (performance gagnant-séjour) ou à des altérations de la sensibilité à la rétroaction négative (perte-décalage) performance) (Bari et al., 2009; Stopper et Floresco, 2011). Les choix des animaux au cours de la tâche ont été analysés en fonction du résultat de chaque essai à choix libre précédent (récompense ou non-récompense) et exprimés sous forme de ratio. La proportion d'essais gagnant-séjour a été calculée à partir du nombre de fois où le rat a choisi le levier grand / risqué après avoir choisi l'option risquée lors de l'essai précédent et obtenu la grande récompense (une victoire), divisé par le nombre total de choix libre. essais dans lesquels le rat a obtenu la plus grande récompense. À l'inverse, les performances de perte de vitesse ont été calculées à partir du nombre de fois où les rats ont déplacé leur choix vers le petit / certain levier après avoir choisi l'option risquée lors de l'essai précédent et n'ont pas été récompensés (une perte), divisé par le nombre total d'essais à choix libre. entraînant une perte.

En raison de la nature probabiliste de la tâche, au cours des quatre expériences, il y avait au moins des cas 4 – 5 dans lesquels un animal ne sélectionnait pas le levier «grand / risqué» (et ne pouvait donc pas «rester» ou «se déplacer» après une victoire). perte ou perte) ou n’a pas obtenu la plus grosse récompense du tout pendant un certain bloc de probabilité (en particulier les deux derniers blocs). Ainsi, dans l'un ou l'autre de ces cas, le dénominateur de l'équation utilisée pour calculer ces rapports serait zéro pour au moins un des blocs, ce qui nous empêchait de procéder à une analyse bloc par bloc de ces données. Pour remédier à cela, une analyse a été menée pour tous les essais des quatre blocs, comme nous l’avons déjà fait (Stopper et Floresco, 2011). Les changements dans les performances gagnant-séjour ont été utilisés comme un indice général de l'impact de l'obtention de la récompense importante et risquée sur le comportement de choix ultérieur, tandis que les changements dans la performance à la perte de rapport ont servi d'indice de sensibilité de rétroaction négative sur toute la durée du test. session.

Étant donné que chacun des quatre composés induisait des effets distincts sur le comportement de choix, nous nous sommes particulièrement intéressés à comparer directement les effets de chaque composé par rapport au traitement salin. Pour cette analyse, nous avons utilisé les données obtenues suite au traitement avec les doses les plus efficaces de chaque médicament et les injections de véhicule correspondantes (pour SKF81297, nous avons utilisé les données obtenues après traitement avec la dose la plus faible, 0.1 μg). L'analyse des essais gagnant-séjour et perdant-décalage a révélé une interaction à quatre voies significative de type d'essai (gagnant-séjour vs perdant-décalage) × traitement (solution saline vs médicament) × récepteur (D1 vs D2) × type de médicament (antagoniste vs agoniste ) (F (1,44) = 11.92, p <0.05; Fig.4, Tableau 2). Comme cela a été observé avec l'analyse du comportement de choix global, cette interaction à quatre facteurs était motivée par le fait que chaque médicament induisait un effet distinct sur les tendances gagnant-séjour / perdant-quart. En ce qui concerne les performances gagnant-séjour, dans des conditions de contrôle, les rats ont affiché une forte tendance (entre 80 et 90%) à sélectionner le levier à risque après avoir sélectionné ce levier lors de l'essai précédent et reçu la récompense, comme nous l'avons observé précédemment (Stopper et Floresco , 2011). À l'inverse, les animaux avaient tendance à passer au levier petit / certain après une «perte» après avoir choisi le levier grand / risqué sur ∼25 à 30% de ces essais dans des conditions de contrôle.

Figure 4.

Effets des manipulations du récepteur DA de PFC sur les tendances gagnant-séjour (barres grises) et à perte de rapport (barres blanches). Par souci de clarté et à des fins comparatives, les données sont présentées ici en termes de score de différence entre les ratios obtenus entre les traitements médicamenteux et les traitements salins (les valeurs positives indiquent un rapport accru, les valeurs négatives une diminution après le traitement médicamenteux par rapport aux perfusions de contrôle). Les données brutes utilisées dans l'analyse globale à partir de laquelle ces valeurs ont été obtenues sont présentées dans le tableau 2. Les rapports gagnant / séjour indexent la proportion d'essais pour lesquels les rats ont choisi le levier grand / risqué après avoir reçu la récompense la plus élevée de l'essai précédent. Les rapports de perte de décalage indexent la proportion d'essais pour lesquels les rats ont changé de choix au levier petit / certain après le choix non récompensé du levier gros / risqué. Les étoiles indiquent une différence significative par rapport à la solution saline au niveau 0.05. ns, non significatif.

Tableau 2.

Ratios victoire / perte de décalage chez les rats effectuant la tâche de réduction probabiliste après la perfusion de solution saline et la dose la plus élevée ou la plus efficace d'antagoniste ou d'agonistes D1 et D2

Une analyse simple des effets principaux de l'interaction à quatre facteurs a révélé que l'antagoniste D1 SCH23390 n'affectait pas les performances gagnant-séjour mais augmentait considérablement les tendances à perdre-décalage (Dunnett, p <0.05), suggérant que la diminution du choix risqué induite par ces traitements peut être attribuable en partie à une sensibilité accrue à la rétroaction négative (c.-à-d. omission de récompense). En revanche, le blocage du D2 avec l'éticlopride (1 μg) a significativement augmenté la probabilité de choisir l'option risquée suite à une «victoire» (p <0.05), tout en provoquant une diminution non significative des tendances perdantes-shift. Ainsi, l'augmentation du choix risqué induite par le blocus D2 semble être principalement attribuable à un impact accru de l'obtention d'une grande récompense sur le choix ultérieur.

L'agoniste D1 SKF81297 (0.1 μg) a significativement augmenté les performances gagnant-séjour par rapport à la solution saline (p <0.05), mais a également eu l'effet inverse de SCH23390, réduisant la tendance à se déplacer après une perte du levier grand / risqué (p <0.05) . En revanche, le quinpirole (10 μg) a eu l'effet inverse de l'agoniste D1 sur les tendances gagnant-séjour, diminuant significativement la probabilité de choisir le levier grand / risqué après un «gain» (p <0.05), suggérant une sensibilité réduite à la réception de récompenses plus importantes, mais incertaines. Ce traitement n'a eu aucun effet significatif sur les ratios perte-séjour. Ces résultats indiquent que la modulation des récepteurs D1 vs D2 induit des changements différentiels dans les performances de choix qui semblent être caractérisés par des changements distincts dans l'impact de l'obtention de la plus grande récompense ou de la sensibilité à la rétroaction négative.

Récompense de magnitude de récompense

Le blocage des récepteurs D1 ou la stimulation des récepteurs D2 a réduit la préférence pour la récompense plus grande et incertaine au cours de certains blocs d'essai de la tâche d'actualisation. Pour évaluer si ces effets étaient imputables à une perturbation générale de la discrimination entre récompenses de différentes amplitudes, nous avons mené une autre expérience dans laquelle deux groupes de rats distincts avaient été formés à une tâche plus simple. Les rats ont choisi entre deux leviers délivrant un ou quatre granulés, tous deux avec une probabilité de 100%. Quinze rats ont été entraînés à 11 d à cette tâche avant de recevoir une micro-perfusion équilibrée de la dose élevée de SCH23390 (1 μg) ou de quinpirole (10 μg) et d’une solution saline. Les données relatives à un animal ont été supprimées en raison d'un placement inexact, laissant un n final de 6 dans le groupe SCH23390 et 8 dans le groupe quinpirole.

Blocus D1

Après des perfusions de solution saline, les rats ont affiché un biais très fort vers la plus grande récompense, sélectionnant cette option sur près de 100% des essais (Fig. 5A). Après des perfusions de SCH23390 (1 μg), il n'y a pas eu de changement de préférence pour l'option à quatre pastilles (F (1,5) = 1.72, ns). Contrairement au choix, nous avons constaté une légère augmentation des latences de réponse après le blocage de D1 (solution saline = 0.81 ± 0.1 s, SCH23390 = 0.98 ± 0.1 s; F (1,5) = 7.18, p <0.05). L'activité locomotrice (F (1,5) = 4.86, ns) et les omissions d'essais (F (1,5) = 1.0, ns) n'ont pas été affectées par SCH23390. Ainsi, même si les perfusions de cette dose de SCH23390 ont réduit le choix de l'option de récompense la plus élevée pendant la tâche d'actualisation probabiliste, cet effet ne semble pas être attribuable à une réduction générale de la valeur subjective des récompenses plus importantes.

Figure 5.

Effets de la modulation du récepteur DA dans le PFC médian sur la discrimination en ampleur de la récompense. Les rats ont été entraînés à choisir entre deux leviers offrant une récompense de quatre ou une pastille immédiatement après une seule pression avec une probabilité de 100%. Un blocage par D1 (SCH23390, 1 μg) n'a pas perturbé de manière significative la préférence accordée à la plus grande récompense de quatre granulés lors d'essais à libre choix par rapport au traitement au sérum physiologique. La stimulation des récepteurs B, D2 (quinpirole, 10, μg) n’a pas non plus modifié la préférence pour la grande récompense.

Stimulation du récepteur D2

Un profil de choix similaire a été observé pour les rats recevant la dose élevée (10 μg) de quinpirole dans le PFC médial. Encore une fois, les rats ont choisi l'option à quatre pastilles dans presque tous les essais à choix libre après des perfusions de solution saline. Cette préférence n'a pas été modifiée par la stimulation des récepteurs D2 (F (1,6) = 0.53, ns; Fig. 5B). La quinpirole n'a également eu aucun effet significatif sur les latences, la locomotion ou les omissions (toutes les valeurs de F <1.76, ns). Notez que des traitements similaires ont réduit le choix de la plus grande récompense sur la tâche d'actualisation probabiliste au cours du premier bloc de probabilité de 100% (Fig. 3B). Une explication possible de cette différence est que, contrairement aux rats entraînés à la discrimination de l'ampleur de la récompense, ceux formés à la tâche de réduction avaient appris que l'utilité relative de l'option grande / risquée diminue au cours d'une session. Ainsi, leur représentation de la valeur relative de l'option de grande récompense devrait être plus labile que celle des rats entraînés à la tâche plus simple et, par conséquent, plus susceptibles d'être perturbés. Collectivement, les résultats de cette expérience montrent que même si le blocage des récepteurs D1 et la stimulation des récepteurs D2 modifient considérablement les choix entre les récompenses probabilistes petites, certaines et grandes, ces effets ne semblent pas être attribuables à des altérations plus fondamentales de la capacité de discrimination. entre des récompenses plus grandes et plus petites.

a lieu

Nous rapportons ici que les récepteurs D1 et D2 dans le PFC médian exercent une influence critique sur les choix entre récompenses probabilistes et certaines. De plus, la diminution ou l’augmentation de l’activité de chacun de ces récepteurs a produit des changements de choix différents, et parfois opposés, suggérant qu’ils exercent chacun un contrôle modulateur distinct, mais complémentaire, sur ces processus décisionnels.

Effets du blocage des récepteurs D1 / D2

À notre connaissance, il s'agit de la première démonstration que le blocage du récepteur D1 ou D2 dans le PFC médian induit des effets opposés sur le comportement. Des études antérieures de ce type ont révélé que D1, mais non D2, perturbait des fonctions telles que l'attention ou la mémoire de travail (Williams et Goldman-Rakic, 1995; Seamans et autres, 1998; Granon et autres, 2000). les récepteurs agissent de manière coopérative pour faciliter un comportement de décalage de positionnement ou de polarisation loin des punisseurs conditionnés (Ragozzino, 2002; Floresco et Magyar, 2006). Nos conclusions selon lesquelles SCH23390 et l’éticlopride ont induit des effets opposés sur le choix suggèrent que la prise de décision normale dépend d’un équilibre critique de l’activité des récepteurs D1 et D2 des lobes frontaux, et que la modification de cet équilibre induit des changements dissociables dans le choix des avantages certains / incertains.

Le blocage de PFC D1 a diminué la préférence pour l’option grande / risquée d’une manière dépendante de la dose, le plus en évidence au cours des trois derniers blocs de probabilité. SCH23390 a augmenté l’actualisation probabiliste, ressemblant aux effets de ce composé lorsqu’il est administré par voie systémique (St. Onge et Floresco, 2009). Il est intéressant de noter que la réduction de la transmission des DA chez les sujets humains via l’épuisement de la tyrosine conduit également à une prise de décision plus conservatrice et de moins bonne qualité pour la Cambridge Gambling Task (McLean et al., 2004). Nos résultats suggèrent que ces effets pourraient être en partie médiés par une réduction de l'activation préfrontale de D1. L'analyse choix par choix a également révélé que cette préférence réduite pour l'option risquée était liée à une tendance accrue à choisir l'option petite / certaine à la suite d'un choix risqué non récompensé, ce qui suggère que les effets sur la prise de décision pourraient être le résultat d'une augmentation du risque. sensibilité à la rétroaction négative. Dans le même esprit, le blocage des récepteurs D1 dans le cingulat antérieur ou antérieur réduit la préférence pour des récompenses plus importantes quand ils sont retardés (Loos et al., 2010) ou associés à un coût d’effort plus important (Schweimer et Hauber, 2006). Ensemble, ces résultats suggèrent que la signalisation PFC D1 exerce une influence profonde sur les évaluations coûts-avantages, facilitant la capacité de surmonter les coûts pouvant être associés à des bénéfices plus importants dans le but de maximiser les gains à long terme.

À l’opposé, le blocage du récepteur PFC D2 a accru la préférence pour l’option grande / risquée, ce qui a ralenti le décalage du biais lié au choix alors que les probabilités de récompense diminuaient au cours d’une session. Cet effet ressemble notamment à celui induit par l'inactivation des PFC dans des conditions de tâche similaires (St. Onge et Floresco, 2010). Cependant, nous ne pensons pas que cela reflète une augmentation générale du comportement «à risque» en soi. Nos conclusions précédentes nous ont plutôt amenés à conclure que le PFC médian joue un rôle essentiel dans la surveillance des modifications des probabilités de récompense pour ajuster le comportement en conséquence. Les résultats actuels développent ce sujet, révélant que les récepteurs D2 apportent une contribution essentielle à la régulation des PFC de cet aspect de la prise de décision. Cette augmentation apparente du choix risqué a été motivée davantage par une tendance accrue à choisir l'option risquée après avoir obtenu une récompense importante lors de l'essai précédent. Ainsi, plutôt que d’intégrer des informations sur la probabilité d’obtenir la récompense la plus large lors d’essais multiples, le blocage de D2 a eu pour effet que la réception de la récompense la plus large a un impact plus important et plus immédiat sur la direction du choix ultérieur. Ceci est conforme à une étude récente sur l'homme, dans laquelle l'antagonisme D2 a augmenté le choix d'options associées à des probabilités de récompense plus élevées et les changements correspondants de l'activité des PFC ventromédiaux (Jocham et al., 2011). Ensemble, ces résultats montrent que les récepteurs PFC D1 et D2 constituent des contributions distinctes, mais complémentaires, à la prise de décision. L'activité des récepteurs D1 favorise le choix de récompenses plus grandes, mais incertaines ou plus coûteuses, tandis que les récepteurs D2 atténuent l'impact immédiat des récompenses probabilistes plus grandes sur le biais du choix, facilitant la possibilité d'ajuster le comportement à long terme lorsque la probabilité d'obtenir ces récompenses changements.

Effets de la stimulation des récepteurs D1 / D2

Les perfusions intra-PFC de SKF1, un agoniste des récepteurs D81297, dans les plages de doses dont il a été prouvé qu'elles exercent des effets différentiels sur d'autres formes de cognition (attention, mémoire de travail), n'ont pas modifié de manière significative le choix à risque, bien que ces traitements aient légèrement augmenté la préférence pour le traitement de grande taille. levier risqué, surtout avec la faible dose. L'interprétation de cet effet nul doit être abordée avec prudence, car ces effets dose / réponse non monotones suggèrent que SKF81297 peut avoir une plage de doses efficace plus étroite que pour les autres fonctions cognitives. De plus, la dose de 0.1 en μg a considérablement modifié les schémas de choix, augmentant les performances gagnant-séjour et diminuant les tendances en perte de temps, les rats étant plus susceptibles de choisir le levier grand / risqué après les récompenses et les omissions de récompenses. Néanmoins, le fait que l’augmentation des doses de SKF81297 n’ait pas sensiblement modifié le choix indique que la stimulation supranormale des récepteurs PFC D1 n’interfère pas de manière significative avec la prise de décision en matière de risques et de bénéfices. En revanche, des traitements similaires diminuent le choix de récompenses différées plus importantes (Loos et al., 2010), renforçant ainsi le fait que différents types de prise de décision coût / bénéfice peuvent être dissociés pharmacologiquement.

La quinpirole, agoniste de D2, a induit un véritable «empêchement» dans la prise de décision, en aplatissant nettement la courbe d'actualisation, les rats ne affichant aucune actualisation discernable en cas de modification des probabilités de récompense. Le choix de l'option à quatre pastilles a été réduit dans le bloc 100% (quand cela était le plus avantageux), mais augmenté dans le bloc 12.5% (lorsqu'il est le moins avantageux). Suite à la stimulation par D2, la proportion globale de choix importants / à risque n'a pas changé par rapport à la solution saline (73%), mais les animaux étaient complètement insensibles aux changements de ces probabilités. Ainsi, une activation excessive du récepteur D2 interférait gravement avec la possibilité d’ajuster le choix, ce qui incitait apparemment les rats à utiliser une stratégie plus simple d’alternance entre blocs tout en maintenant un biais en faveur du levier grand / risqué. Cette constatation, associée aux effets de l’éticlopride, suggère que les niveaux relatifs de la tonalité du récepteur D2 (plutôt que D1) dans le PFC médian ont un impact critique sur cet aspect de la prise de décision et que l'augmentation ou la diminution de cette activité peut affecter les performances.

Le modèle de choix désavantageux produit par la quinpirole présente une ressemblance frappante avec celui induit par la réduction de la motivation à se nourrir par le biais d’une alimentation libre à long terme (St. Onge et Floresco, 2009). Ces découvertes complémentaires incitent à spéculer sur le fait que ces phénomènes peuvent être liés. En effet, des modifications de l'efflux médian des DA de PFC ont été proposées pour refléter un signal généralisé de récompense alimentaire ou d'incitation (Ahn et Phillips, 1999; Winstanley et al., 2006). Ainsi, des changements dans la quantité de récompense obtenue au fil du temps peuvent être signalés au PFC par des fluctuations correspondantes des niveaux de DA mésocortical qui, via des actions sur les récepteurs D2, peuvent être utilisées pour détecter les modifications de la quantité de récompense obtenue dans le temps et faciliter les altérations de la biais de choix. Il s'ensuit que l'inondation des récepteurs D2 peut perturber ce signal dynamique, ce qui pourrait finalement produire davantage de modèles de choix statiques.

Contributions dissociables des récepteurs PFC D1 et D2 à la prise de décision en fonction du risque

La question reste de savoir pourquoi le blocage des récepteurs D1 ou D2 devrait exercer des effets opposés sur les choix risqués, étant donné que le DA endogène active les deux récepteurs. La théorie contemporaine sur la manière dont ces récepteurs affectent de manière différentielle l'activité du réseau neuronal de PFC pourrait donner un aperçu de cette question (Durstewitz et al., 2000; Seamans et Yang, 2004). Il a été proposé que les récepteurs D1 diminuent l’influence des entrées faibles, stabilisant ainsi l’activité du réseau, de sorte qu’une seule représentation domine la sortie des PFC. Inversement, l'activité D2 atténue les influences inhibitrices, permettant aux ensembles de neurones PFC de traiter de multiples stimuli / représentations, plaçant ces réseaux dans un état plus labile pouvant permettre des modifications de représentations..

Au cours des différentes phases de la tâche d’actualisation probabiliste utilisée ici, les animaux à certains points doivent soit conserver (dans un bloc de probabilité), soit modifier (d’un bloc à l’autre) leur représentation de la valeur relative de l’option grande / risquée. Ainsi, les effets opposés de l'antagonisme D1 / D2 décrits ici peuvent refléter les contributions différentielles de ces récepteurs au cours de phases distinctes de la tâche. L'activité D1 peut stabiliser la représentation de la valeur relative à long terme de l'option risquée dans un bloc particulier, en maintenant le biais du choix même lorsqu'un choix risqué entraîne une omission de récompense (garder l'œil sur le prix). Le blocage de ces récepteurs rendrait les animaux plus sensibles aux omissions de récompenses (c.-à-d., Accroîtrait les tendances à la perte de temps), et réduirait le choix risqué. Inversement, comme l'option grand / risqué rapporte moins de bénéfices d'un bloc à l'autre, les récepteurs D2 (éventuellement sur une population neuronale différente) peuvent faciliter les modifications des représentations de la valeur. En tant que tel, la réduction de leur activité perturberait la mise à jour de ces représentations et les modifications correspondantes du biais de choix. Ce modèle peut également expliquer en partie les effets de l’augmentation de l’activité des récepteurs D1 et D2, ce qui devrait conduire à un choix plus persistant de l’option grande / risquée ou à la création d’un état «hyperflexible», respectivement. Par conséquent, nos conclusions suggèrent que le ton du DA de PFC apporte une contribution critique et complexe au jugement du risque / rendement. En établissant un juste équilibre entre l'activité des récepteurs D1 et D2, la DA mésocorticale peut aider à affiner les décisions coûts / avantages entre différentes options d'ampleur et d'incertitude, en encourageant soit l'exploitation des conditions favorables actuelles, soit l'exploration de conditions plus rentables lorsque les conditions changent.

Notes

Ce travail a été financé par une subvention des Instituts de recherche en santé du Canada (MOP 89861) à la SBFSBF, est un chercheur principal de la Fondation Michael Smith pour la recherche en santé et JRSO est récipiendaire de bourses du Conseil de recherches en sciences naturelles et en génie du Canada et du Fondation Smith pour la recherche en santé.

La correspondance doit être adressée au Dr Stan B. Floresco, Département de psychologie et centre de recherche sur le cerveau, Université de la Colombie-Britannique, 2136 West Mall, Vancouver, Colombie-Britannique. V6T 1Z4, [email protected]

Copyright © 2011 les auteurs 0270-6474 / 11 / 318625-09 $ 15.00 / 0

Bibliographie

1. ↵

1. Ahn S,

2. Phillips AG

(1999) Corrélats dopaminergiques de la satiété sensorielle dans le cortex préfrontal médial et le noyau accumbens du rat. J Neurosci 19: RC29, (1 – 6).

Résumé / Texte intégral GRATUIT

2. ↵

1. Bardgett ME,

2. Depenbrock M,

3. Downs N,

4. Points M,

5. Vert L

(2009) La dopamine module la prise de décision basée sur l'effort chez le rat. Comportement Neurosci 123: 242 – 251.

CrossRefMedline

3. ↵

1. Bari A,

2. Eagle DM,

3. Mar AC,

4. Robinson ES,

5. Robbins TW

(2009) Effets dissociables du blocage de l'absorption de la noradrénaline, de la dopamine et de la sérotonine sur la performance de la tâche d'arrêt chez le rat. Psychopharmacologie 205: 273 – 283.

CrossRefMedline

4. ↵

1. Cardinal RN,

2. Howes NJ

(2005) Effets des lésions du noyau accumbens sur le choix entre de petites récompenses et de grandes récompenses incertaines chez le rat. BMC Neurosci 6: 37.

CrossRefMedline

5. ↵

1. Cardinal RN,

2. Robbins TW,

3. Everitt BJ

(2000) Effets du d-amphétamine, du chlordiazépoxide, de l’alpha-flupenthixol et de manipulations comportementales sur le choix du renforcement retardé, signalé et non signalé chez le rat. Psychopharmacologie 152: 362 – 375.

CrossRefMedline

6. ↵

1. Chudasama Y,

2. Robbins TW

(2004) Modulation dopaminergique de l'attention visuelle et de la mémoire de travail dans le cortex préfrontal de rongeurs. Neuropsychopharmacologie 29: 1628 – 1636.

CrossRefMedline

7. ↵

1. Cousins ​​MS,

2. Wei W,

3. Salamone JD

(1994) Caractérisation pharmacologique de la performance d’une procédure de choix de la pression / choix de l’alimentation concomitante: effets des antagonistes de la dopamine, des médicaments cholinomimétiques, sédatifs et stimulants. Psychopharmacologie 116: 529 – 537.

CrossRefMedline

8. ↵

1. Denk F,

2. Walton ME,

3. Jennings KA,

4. Sharp T,

5. Rushworth MF,

6. Bannerman DM

(2005) Implication différentielle des systèmes de la sérotonine et de la dopamine dans les décisions coûts-avantages concernant le retard ou l’effort. Psychopharmacologie 179: 587 – 596.

CrossRefMedline

9. ↵

1. Durstewitz D,

2. Marins JK,

3. Sejnowski TJ

(2000) Modèles neurocomputatifs de la mémoire de travail. Nat Neurosci 3 (Suppl): 1184 – 1191.

CrossRefMedline

10. ↵

1. Floresco SB,

2. Magyar O

(2006) Modulation de la dopamine mésocorticale des fonctions exécutives: au-delà de la mémoire de travail. Psychopharmacologie 188: 567 – 585.

CrossRefMedline

11. ↵

1. Floresco SB,

2. Whelan JM

(2009) Perturbations dans différentes formes de prise de décision coût / bénéfice induites par une exposition répétée aux amphétamines. Psychopharmacologie 205: 189 – 201.

CrossRefMedline

12. ↵

1. Floresco SB,

2. Magyar O,

3. Ghods-Sharifi S,

4. Vexelman C,

5. Tse MT

(2006) De multiples sous-types de récepteurs de la dopamine dans le cortex préfrontal médial du rat régulent le décalage de prise. Neuropsychopharmacologie 31: 297 – 309.

CrossRefMedline

13. ↵

1. Floresco SB,

2. Tse MT,

3. Ghods-Sharifi S

(2008a) Réglementation dopaminergique et glutamatergique de la prise de décision en fonction des efforts et des délais. Neuropsychopharmacologie 33: 1966 – 1979.

CrossRefMedline

14. ↵

1. Floresco SB,

2. St Onge JR,

3. Ghods-Sharifi S,

4. Winstanley CA

(2008b) Les circuits cortico-limbiques-striataux sous-tendent différentes formes de prise de décision coûts-avantages. Comportement cognitif Neurosci 8: 375 – 389.

CrossRefMedline

15. ↵

1. Ghods-Sharifi S,

2. St Onge JR,

3. Floresco SB

(2009) Contribution fondamentale de l'amygdale basolatérale à différentes formes de prise de décision. J Neurosci 29: 5251 – 5259.

Résumé / Texte intégral GRATUIT

16. ↵

1. Granon S,

2. Passetti F,

3. Thomas KL,

4. Dalley JW,

5. Everitt BJ,

6. Robbins TW

(2000) Amélioration et dégradation de la capacité d’attention après la perfusion d’agent récepteurs dopaminergiques D1 dans le cortex préfrontal de rat. J Neurosci 20: 1208 – 1215.

Résumé / Texte intégral GRATUIT

17. ↵

1. Haluk DM,

2. Floresco SB

(2009) Modulation de la dopamine striatale ventrale de différentes formes de flexibilité comportementale. Neuropsychopharmacologie 34: 2041 – 2052.

CrossRefMedline

18. ↵

1. Hutton SB,

2. Murphy FC,

3. Joyce EM,

4. Rogers RD,

5. Cuthbert I,

6. Barnes TR,

7. McKenna PJ,

8. Sahakian BJ,

9. Robbins TW

(2002) Déficits décisionnels chez les patients atteints de premier épisode et de schizophrénie chronique. Schizophr Res 55: 249 – 257.

CrossRefMedline

19. ↵

1. Jocham G,

2. Klein TA,

3. Ullsperger M

(2011) Les signaux d'apprentissage par renforcement induits par la dopamine dans le cortex préfrontal striatum et ventromedial sous-tendent des choix fondés sur des valeurs. J Neurosci 31: 1606 – 1613.

Résumé / Texte intégral GRATUIT

20. ↵

1. Loos M,

2. Pattij T,

3. Janssen MC,

4. Counotte DS,

5. Schoffelmeer AN,

6. Smit AB,

7. Spijker S,

8. van Gaalen MM

(2010) L’expression du gène D1 / D5 du récepteur de la dopamine dans le cortex préfrontal médial prédit un choix impulsif chez le rat. Cereb Cortex 20: 1064 – 1070.

Résumé / Texte intégral GRATUIT

21. ↵

1. McLean A,

2. Rubinsztein JS,

3. Robbins TW,

4. Sahakian BJ

(2004) Effets de l'épuisement de la tyrosine chez des volontaires sains normaux: implications pour la dépression unipolaire. Psychopharmacologie 171: 286 – 297.

CrossRefMedline

22. ↵

1. Pagonabarraga J,

2. García-Sánchez C,

3. Llebaria G,

4. Pascual-Sedano B,

5. Gironell A,

6. Kulisevsky J

(2007) Étude contrôlée de la prise de décision et des troubles cognitifs dans la maladie de Parkinson. Mov Disord 22: 1430–1435.

CrossRefMedline

23. ↵

1. Paxinos G,

2. Watson C

(1998) Le cerveau du rat en coordonnées stéréotaxiques (Academic, San Diego), Ed 4.

24. ↵

1. Ragozzino ME

(2002) Effets du blocage du récepteur de la dopamine D (1) dans les zones prélébico-infralimbiques sur la flexibilité comportementale. Apprendre Mem 9: 18 – 28.

Résumé / Texte intégral GRATUIT

25. ↵

1. Rogers RD,

2. Everitt BJ,

3. Baldacchino A,

4. Blackshaw AJ,

5. Swainson R,

6. Wynne K,

7. Baker NB,

8. Hunter J,

9. Carthy T,

10. Booker E,

11. London M,

12. Deakin JF,

13. Sahakian BJ,

14. Robbins TW

(1999) Déficits dissociables dans la cognition décisionnelle des consommateurs chroniques d'amphétamine, des consommateurs d'opiacés, des patients présentant une atteinte focale du cortex préfrontal et des volontaires normaux épuisés en tryptophane: preuves de mécanismes monoaminergiques. Neuropsychopharmacologie 20: 322 – 339.

CrossRefMedline

26. ↵

1. Schweimer J,

2. Hauber W

(2006) Les récepteurs D1 de la dopamine dans le cortex cingulaire antérieur régulent la prise de décision basée sur l'effort. Apprendre Mem 13: 777 – 782.

Résumé / Texte intégral GRATUIT

27. ↵

1. Schweimer J,

2. Saft S,

3. Hauber W

(2005) Implication de la neurotransmission de la catécholamine dans le cingulaire antérieur du rat dans la prise de décision liée à l'effort. Comportement Neurosci 119: 1687 – 1692.

CrossRefMedline

28. ↵

1. Marins JK,

2. Yang CR

(2004) Principales caractéristiques et mécanismes de la modulation de la dopamine dans le cortex préfrontal. Prog Neurobiol 74: 1 – 58.

CrossRefMedline

29. ↵

1. Marins JK,

2. Floresco SB,

3. Phillips AG

(1998) Modulation des récepteurs D1 des circuits corticaux pré-frontal hippocampique intégrant la mémoire spatiale avec des fonctions exécutives chez le rat. J Neurosci 18: 1613 – 1621.

Résumé / Texte intégral GRATUIT

30. ↵

1. St Onge JR,

2. Floresco SB

(2009) Modulation dopaminergique de la prise de décision basée sur le risque. Neuropsychopharmacologie 34: 681 – 697.

CrossRefMedline

31. ↵

1. St Onge JR,

2. Chiu YC,

3. Floresco SB

(2010) Effets différentiels des manipulations dopaminergiques sur les choix risqués. Psychopharmacologie 211: 209 – 221.

CrossRefMedline

32. ↵

1. St Onge JR,

2. Floresco SB

(2010) Contribution du cortex préfrontal à la prise de décision basée sur le risque. Cereb Cortex 20: 1816 – 1828.

Résumé / Texte intégral GRATUIT

33. ↵

1. Bouchon CM,

2. Floresco SB

(2011) Contributions du noyau accumbens et de ses sous-régions à différents aspects de la prise de décision fondée sur les risques. Comportement cognitif Neurosci 11: 97 – 112.

CrossRefMedline

34. ↵

1. van Gaalen MM,

2. van Koten R,

3. Schoffelmeer AN,

4. Vanderschuren LJ

(2006) Implication critique de la neurotransmission dopaminergique dans la prise de décision impulsive. Biol Psychiatry 60: 66 – 73.

CrossRefMedline

35. ↵

1. Williams GV,

2. PS Goldman-Rakic

(1995) Modulation des champs de mémoire par les récepteurs D1 de la dopamine dans le cortex préfrontal. Nature 376: 572 – 575.

CrossRefMedline

36. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Robbins TW

(2005) Interactions entre la sérotonine et la dopamine dans le contrôle du choix impulsif chez le rat: implications thérapeutiques pour les troubles du contrôle impulsif. Neuropsychopharmacologie 30: 669 – 682.

Medline

37. ↵

1. Winstanley CA,

2. Theobald DE,

3. Dalley JW,

4. Cardinal RN,

5. Robbins TW

(2006) Double dissociation entre la modulation sérotoninergique et dopaminergique du cortex préfrontal et orbitofrontal médian de choix impulsif. Cereb Cortex 16: 106 – 114.

Résumé / Texte intégral GRATUIT