Qu'est-ce que la dopamine signifie? (2018)

. Manuscrit de l'auteur; disponible dans PMC 2019 Feb 1.

Publié sous forme finale modifiée en tant que:

Nat Neurosci. 2018 Jun; 21 (6): 787 – 793.

Publié en ligne 2018 May 14. doi: 10.1038 / s41593-018-0152-y

PMCID: PMC6358212

NIHMSID: NIHMS987662

Abstract

La dopamine est un modulateur essentiel de l’apprentissage et de la motivation. Cela pose un problème: comment les cellules cibles peuvent-elles savoir si une augmentation de la dopamine est un signal d’apprentissage ou de déplacement? On présume souvent que la motivation implique des changements lents («toniques») de la dopamine, alors que des fluctuations rapides («phasiques») de la dopamine transmettent des erreurs de prédiction de récompense pour l'apprentissage. Pourtant, des études récentes ont montré que la dopamine conférait une valeur motivationnelle et favorisait le mouvement, même à des échelles de temps inférieures à la seconde. Je décris ici un compte rendu alternatif de la manière dont la dopamine régule le comportement en cours. La libération de dopamine liée à la motivation est rapidement et localement modelée par les récepteurs situés aux extrémités de la dopamine, indépendamment du déclenchement des cellules de la dopamine. Les neurones cibles basculent brusquement entre les modes apprentissage et performance, les interneurones cholinergiques striataux fournissant un mécanisme de commutation candidat. L’impact de la dopamine sur le comportement varie d’une sous-région à l’autre, mais dans chaque cas, la dopamine fournit une estimation dynamique permettant de déterminer s’il vaut la peine de dépenser une ressource interne limitée, telle que l’énergie, l’attention ou le temps.

La dopamine est-elle un signal d'apprentissage, de motivation ou les deux?

Notre compréhension de la dopamine a changé dans le passé et change encore. Une distinction essentielle est entre les effets de la dopamine sur actuel comportement (performance) et les effets de la dopamine sur avenir comportement (apprentissage). Les deux sont réels et importants, mais à différents moments, l’un a été favorable et l’autre non.

Lorsque (dans les '70s), il devenait possible de réaliser des lésions sélectives et complètes des voies de la dopamine, la conséquence comportementale évidente était une réduction sévère du mouvement.¹. Cela correspond aux effets akinétiques de la perte de dopamine chez l'homme, produite par la maladie de Parkinson avancée, des médicaments toxiques ou une encéphalite². Pourtant, ni les cas humains ni les rats ne présentent une incapacité fondamentale à bouger. Les rats atteints de dopamine nagent dans l'eau froide³, et les patients akinétiques peuvent se lever et courir si une alarme incendie retentit (kinésie «paradoxale»). Il n’existe pas non plus de déficit fondamental dans l’appréciation des récompenses: des rats atteints d’une lésion à la dopamine consomment de la nourriture placée dans leur bouche et montrent des signes de satisfaction.⁴. Au contraire, ils ne choisiront pas de faire des efforts pour obtenir activement des récompenses. Ces résultats, parmi tant d’autres, ont établi un lien fondamental entre la dopamine et la motivation.⁵. Même le ralentissement des mouvements observé dans les cas moins graves de la maladie de Parkinson peut être considéré comme un déficit de motivation, reflétant des décisions implicites selon lesquelles il ne vaut pas la peine de dépenser l'énergie nécessaire pour des mouvements plus rapides.⁶.

Puis (dans les '80s), il y a eu des enregistrements pionniers de neurones dopaminergiques chez des singes se comportant bien (dans les zones du cerveau moyen qui se projettent sur le cerveau antérieur: zone tégmentale ventrale, VTA / substance noire parente, SNc). Parmi les schémas de tir observés, il y avait de brèves bouffées d'activité aux stimuli qui ont déclenché des mouvements immédiats. Ce tir de dopamine «phasique» a d'abord été interprété comme un soutien à «l'activation comportementale»⁷ et "excitation de motivation"⁸ - en d'autres termes, comme revigorant le comportement actuel de l'animal.

Un changement radical s’est produit dans les «90», avec la réinterprétation des sursauts dopaminergiques phasiques comme codant. erreurs de prédiction de récompense (RPE⁹). Ceci était basé sur une observation clé: les cellules de dopamine répondent aux stimuli inattendus associés à une récompense future, mais cessent souvent de répondre si ces stimuli sont attendus¹⁰. L'idée du RPE trouve ses origines dans les théories de l'apprentissage antérieures, et en particulier dans le domaine de l'apprentissage par renforcement en informatique de l'époque¹¹. Le point d'un signal RPE est de mettre à jour valeurs(estimations des récompenses futures). Ces valeurs sont utilisées plus tard pour aider à faire des choix qui maximisent la récompense. Étant donné que les tirs de cellules dopaminergiques ressemblaient à des RPE et que ces derniers sont utilisés pour l'apprentissage, il est devenu naturel de souligner le rôle de la dopamine dans l'apprentissage. Des manipulations optogénétiques ultérieures ont confirmé l'identité dopaminergique des cellules codant pour le RPE^12,13 et a montré qu'ils modulent en effet l'apprentissage^14,15.

L'idée que la dopamine fournit un signal d'apprentissage cadre parfaitement avec la littérature selon laquelle la dopamine module la plasticité synaptique dans le striatum, la principale cible de la dopamine dans le cerveau antérieur. Par exemple, la triple coïncidence de la stimulation par le glutamate d'une colonne vertébrale dendrite striatale, de la dépolarisation postsynaptique et de la libération de dopamine entraîne la croissance de la colonne vertébrale¹⁶. La modulation dopaminergique des mécanismes d'apprentissage à long terme aide à expliquer les effets persistants sur le comportement de drogues entraînant une dépendance, qui partagent la propriété d'accroître la libération de dopamine dans le striatum¹⁷. Même les akinésies profondes avec perte de dopamine peuvent être en partie expliquées par de tels mécanismes d'apprentissage¹⁸. L'absence de dopamine peut être traitée comme un RPE constamment négatif, qui actualise progressivement les valeurs des actions vers zéro. Des antagonistes de la dopamine peuvent produire des effets similaires similaires et progressifs sur le comportement.^19,20.

Pourtant, l'idée que la dopamine est impliquée de manière critique dans la motivation continue n'a jamais disparu - au contraire, elle est largement considérée comme acquise par les neuroscientifiques du comportement. Ceci est approprié étant donné les preuves solides que les fonctions de la dopamine dans la motivation / le mouvement / la revigoration sont dissociables de l'apprentissage^15,20-23. Le défi que représente la réconciliation de ce rôle de motivation avec la théorie selon laquelle DA fournit un signal d'apprentissage en EP est moins bien compris.

La motivation «regarde en avant»: elle utilise des prédictions de récompense future (valeurs) pour dynamiser de manière appropriée le comportement actuel. En revanche, l’apprentissage «regarde en arrière» les états et les actions des dernières années et met à jour leurs valeurs. Ce sont des phases complémentaires d'un cycle: les valeurs mises à jour peuvent être utilisées dans la prise de décision ultérieure si ces états sont à nouveau rencontrés, puis à nouveau mis à jour, etc. Mais à quelle phase du cycle la dopamine est-elle impliquée - utiliser des valeurs pour prendre des décisions (performance) ou mettre à jour des valeurs (apprentissage)?

Dans certaines circonstances, il est facile d’imaginer que la dopamine joue les deux rôles simultanément.²⁴Les indices inattendus prédictifs de récompense sont les événements archétypiques permettant d’évoquer le déclenchement et la libération de cellules dopaminergiques. De tels indices stimulent généralement le comportement et évoquent l’apprentissage (Fig. 1). Dans cette situation particulière, les erreurs de prédiction de récompense et de prédiction de récompense augmentent simultanément - mais ce n'est pas toujours le cas. À titre d'exemple, les gens et les autres animaux sont souvent motivés à travailler pour obtenir des récompenses, même lorsque rien de surprenant ne se produit. Ils peuvent travailler de plus en plus dur à mesure qu'ils se rapprochent de plus en plus de la récompense (la valeur augmente à mesure que les récompenses se rapprochent). Le fait est que l'apprentissage et la motivation sont distincts sur les plans conceptuel, informatique et comportemental - et pourtant la dopamine semble faire les deux.

Ouvrir dans une fenêtre séparée

Dopamine: mettre à jour le passé, revigorer le présent.

Bien, Les cercles avec des flèches représentent les États et les actions potentielles de ces États. Les largeurs de flèche indiquent les valeurs acquises lors de chaque action. Au fur et à mesure que les États / actions disparaissent dans le passé, ils sont progressivement moins éligibles au renforcement. Milieu, une explosion de dopamine se produit. Il en résulte un renforcement des actions disponibles à partir de l'état actuel (en rouge) et une plasticité des représentations de valeur pour les actions effectuées récemment (en violet). Bas et LeggingsDu fait de la plasticité, la prochaine fois que ces états sont rencontrés, leurs valeurs associées ont augmenté (largeur des flèches). Grâce à l'expérience répétée, l'apprentissage par renforcement peut «créer un sillon» dans l'espace des états, rendant certaines trajectoires de plus en plus probables. En plus de ce rôle d'apprentissage, le rôle stimulant et performant de la dopamine semble accélérer le flux le long de trajectoires apprises précédemment.

Ci-dessous, j’évalue de manière critique les idées actuelles sur la manière dont la dopamine est capable de réaliser à la fois des fonctions d’apprentissage et de motivation. Je propose un modèle actualisé, basé sur trois faits essentiels: 1) la libération de dopamine à partir de terminaux ne résulte pas simplement du déclenchement de cellules dopaminergiques, mais peut également être contrôlée localement; 2) dopamine affecte à la fois la plasticité synaptique et l’excitabilité des cellules cibles, avec des conséquences distinctes sur l’apprentissage et les performances; 3) les effets de la dopamine sur la plasticité peuvent être activés ou désactivés par des éléments de circuit proches. Ensemble, ces caractéristiques peuvent permettre aux circuits cérébraux de basculer entre deux messages de dopamine distincts, pour l'apprentissage et la motivation, respectivement.

Existe-t-il des signaux de dopamine «phasiques» et «toniques» distincts, avec des significations différentes?

Il est souvent avancé que les rôles d'apprentissage et de motivation de la dopamine se produisent à différentes échelles de temps.²⁵. Les cellules dopaminergiques tirent en continu ("toniquement") à quelques pics par seconde, avec de temps à autre des éclats ou des pauses brèves ("phasiques"). Les rafales, en particulier si elles sont synchronisées artificiellement sur les cellules de dopamine, entraînent une augmentation rapide correspondante de la dopamine dans le cerveau antérieur²⁶ qui sont très transitoires (durée inférieure à la seconde²⁷). La contribution séparée de la décharge de cellules toniques à la dopamine aux concentrations de dopamine dans le cerveau antérieur est moins claire. Certaines preuves suggèrent que cette contribution est très faible²⁸. Il peut être suffisant de produire une stimulation quasi continue des récepteurs D2 de plus haute affinité, ce qui permet au système de noter de brèves pauses dans le déclenchement de cellules dopaminergiques.²⁹ et utilisez ces pauses comme des erreurs de prédiction négatives.

La microdialyse a été largement utilisée pour mesurer directement les niveaux de dopamine dans le cerveau antérieur, avec une résolution temporelle faible (moyenne moyenne sur plusieurs minutes). De telles mesures lentes de la dopamine peuvent être difficiles à associer précisément au comportement. Néanmoins, la microdialyse de la dopamine dans le noyau accumbens (NAc; striatum ventral / médial) montre des corrélations positives avec l'activité locomotrice³⁰ et autres indices de motivation⁵. Cela a été largement interprété comme signifiant qu'il y a des changements lents («toniques») de la concentration de dopamine et que ces changements lents transmettent un signal de motivation. Plus précisément, des modèles informatiques ont proposé que les taux de dopamine tonique suivent le taux de récompense moyen à long terme³¹ - une variable de motivation utile pour l'attribution de temps et les décisions de recherche de nourriture. Il convient de souligner que très peu d'articles définissent clairement les niveaux de dopamine «toniques» - ils supposent généralement que la concentration de dopamine change lentement sur l'échelle de temps de plusieurs minutes de la microdialyse.

Pourtant, cette vue «dopamine phasique = RPE / apprentissage, dopamine tonique = motivation» se heurte à de nombreux problèmes. Premièrement, il n’existe aucune preuve directe que le déclenchement des cellules toniques à la dopamine varie normalement sur des échelles de temps lentes. Les cadences de tir toniques ne changent pas avec la motivation^32,33. Il a été avancé que les niveaux de dopamine toniques changent en raison d’une proportion changeante de cellules dopaminergiques actives.^34,35. Toutefois, dans de nombreuses études sur des animaux non-médicamentés et non-lésés, il n’a jamais été rapporté que les cellules de dopamine basculent entre les états silencieux et actifs.

De plus, le fait que la microdialyse mesure lentement les taux de dopamine ne signifie pas que les taux de dopamine changent réellement lentement. Nous avons récemment¹⁵ a examiné la dopamine NAc de rat dans une tâche de récompense probabiliste, en utilisant à la fois une microdialyse et une voltampérométrie cyclique à balayage rapide. Nous avons confirmé que la dopamine mésolimbique, mesurée par microdialyse, est corrélée au taux de récompense (récompenses / minute). Cependant, même avec une résolution temporelle de la microdialyse améliorée (1min), la dopamine fluctuait aussi vite que nous l'avions échantillonné: nous n'avons constaté aucune preuve d'un signal de dopamine intrinsèquement lent.

En utilisant la résolution temporelle encore plus fine de la voltamétrie, nous avons observé une relation étroite entre les fluctuations dopaminergiques inférieures à la seconde et la motivation. Tandis que les rats effectuaient la séquence d'actions nécessaires pour obtenir des récompenses, la dopamine montait de plus en plus haut, atteignant un pic au moment même où ils obtenaient la récompense (et baissant rapidement lorsqu'ils la consommaient). Nous avons montré que la dopamine était fortement corrélée à la valeur instantanée de l’état, définie comme la récompense future attendue, actualisée en fonction du temps requis pour la recevoir. Cette dynamique rapide de la dopamine peut également expliquer les résultats de la microdialyse sans invoquer des signaux de dopamine distincts à différentes échelles de temps. Au fur et à mesure que les animaux expérimentent davantage de récompenses, ils attendent davantage de futures récompenses à chaque étape de la séquence d'essai. Plutôt qu'un signal de taux de récompense moyen à évolution lente, la corrélation entre le taux de dopamine et le taux de récompense est mieux expliquée par la moyenne, sur la durée de collecte prolongée de l'échantillon de microdialyse, de ces valeurs d'état en évolution rapide.

Cette interprétation des valeurs de la libération de dopamine mésolimbique est cohérente avec les résultats de voltampérométrie d’autres groupes de recherche, qui ont constaté à plusieurs reprises que la libération de dopamine augmentait avec la proximité croissante de la récompense.^36-38(Fig. 2). Ce signal de motivation n'est pas intrinsèquement «lent», mais peut être observé sur une plage continue d'échelles de temps. Bien que les rampes de dopamine puissent durer plusieurs secondes lorsqu'un comportement d'approche dure également plusieurs secondes³⁸, cela reflète l'évolution temporelle du comportement plutôt que la dynamique intrinsèque de la dopamine. La relation entre la libération de dopamine mésolimbique et la fluctuation de valeur est visible aussi rapidement que la technique d'enregistrement le permet, c'est-à-dire sur un laps de temps de ~ 100ms avec des électrodes de voltamétrie aiguë¹⁵.

Les fluctuations rapides de la dopamine indiquent des attentes en matière de récompense en évolution dynamique.

ac) La libération de dopamine mésolimbique augmente rapidement à mesure que les rats se rapprochent des avantages escomptés. d) La valeur, définie comme une estimation de la récompense future actualisée temporellement, augmente à mesure que la récompense se rapproche. Les signaux indiquant que la récompense est plus grande, plus proche ou plus certaine que prévu précédemment provoquent des sauts de valeur. Ces sauts d’un instant à l’autre sont des RPE à différence temporelle. e) La soustraction des «lignes de base» peut confondre les valeurs et les signaux RPE. À gauche, la dopamine alignée sur le repère prédictif de récompense (au temps zéro), avec une soustraction de base classique, semble montrer que la dopamine monte à des niveaux plus élevés lorsque la récompense est moins attendue (brun), ressemblant à un signal RPE. À droite, une autre présentation des mêmes données, assimilant les niveaux de dopamine après la queue, montrerait plutôt que la précision des niveaux de dopamine dépend de l'attente de récompense (valeur). Des analyses supplémentaires ont permis de déterminer que la présentation de droite était plus proche de la vérité (voir les détails dans la réf. 15). Panneau reproduit, avec permission, de la référence ³⁸, Macmillan Publishers Limited… .; panneau b reproduit, avec autorisation, de la réf. 37Elsevier; panneaux ce reproduits, avec permission, de réf ¹⁵, Macmillan Publishers Limited

Les fluctuations rapides de la dopamine ne reflètent pas simplement la motivation, elles conduisent également immédiatement à un comportement motivé. Des réponses phasiques plus importantes des cellules de dopamine pour déclencher des signaux prédisent des temps de réaction plus courts dans le même essai³⁹. La stimulation optogénétique des cellules VTA de la dopamine rend les rats plus susceptibles de commencer à travailler dans notre tâche de récompense probabiliste¹⁵, tout comme s’ils attendaient plus de récompenses. La stimulation optogénétique des neurones dopaminergiques de la SNc, ou de leurs axones dans le striatum dorsal, augmente la probabilité de mouvement^40,41. De manière critique, ces effets comportementaux sont apparents quelques centaines de millisecondes après le début de la stimulation optogénétique. La capacité des signaux prédictifs de récompense à stimuler la motivation semble être médiée par une modulation dopaminergique très rapide de l'excitabilité des neurones épineux de NAc⁴². Étant donné que la dopamine évolue rapidement et que ces modifications affectent rapidement la motivation, les fonctions de motivation de la dopamine sont mieux décrites comme étant rapides («phasiques») et non lentes («toniques»).

En outre, invoquer des échelles de temps rapides et lentes séparées ne résout pas en soi le problème de décodage auquel sont confrontés les neurones dotés de récepteurs dopaminergiques. Si la dopamine signale l'apprentissage, la modulation de la plasticité synaptique semblerait une réponse cellulaire appropriée. Mais les effets immédiats sur le comportement motivé impliquent des effets immédiats sur les pics - par exemple à travers des changements rapides de l'excitabilité. La dopamine peut avoir ces deux effets post-synaptiques (et plus), alors une concentration de dopamine donnée a-t-elle une signification spécifique? Ou cette signification doit-elle être construite - par exemple en comparant les niveaux de dopamine dans le temps, ou en utilisant d'autres signaux coïncidents pour déterminer quelle machinerie cellulaire engager? Cette possibilité est examinée plus en détail ci-dessous.

La libération de dopamine transmet-elle les mêmes informations que le déclenchement de cellules dopaminergiques?

La relation entre les fluctuations rapides de la dopamine et la valeur motivationnelle semble étrange, étant donné que le déclenchement de cellules dopaminergiques ressemble au contraire à un EPR. En outre, certaines études ont signalé des signaux d'EPR dans la libération de dopamine mésolimbique⁴³. Il est important de noter un défi dans l'interprétation de certaines formes de données neuronales. Les signaux de valeur et les RPE sont corrélés les uns aux autres - il n'est pas surprenant que le RPE soit généralement défini comme le changement de valeur d'un instant à l'autre (RPE «différence temporelle»). En raison de cette corrélation, il est essentiel d'utiliser des conceptions et des analyses expérimentales qui distinguent la valeur des comptes RPE. Le problème est aggravé lors de l'utilisation d'une mesure neuronale qui repose sur des changements de signal relatifs plutôt qu'absolus. Les analyses de voltamétrie comparent généralement la dopamine à un moment d'intérêt à une époque «de référence» plus tôt dans chaque essai (pour supprimer les composants de signal qui ne dépendent pas de la dopamine, y compris la charge d'électrode à chaque balayage et dérive de tension sur une échelle de temps de quelques minutes). Mais en soustrayant une ligne de base, un signal de valeur peut ressembler à un signal RPE. C'est ce que nous avons observé dans nos propres données de voltampérométrie (Fig. 2e). Les changements dans les attentes en matière de récompense ont été reflétés dans les changements dans la concentration de dopamine au début de chaque essai, et ces changements ne sont pas pris en compte si l'on suppose simplement une base de référence constante dans tous les essais.¹⁵. Les conclusions sur la libération de dopamine et le codage RPE doivent donc être considérées avec prudence. Ce danger d'interprétation des données s'applique non seulement à la voltampérométrie, mais à toute analyse qui repose sur des changements relatifs - y compris potentiellement une IRMf et une photométrie⁴⁴.

Néanmoins, nous avons encore besoin de réconcilier la libération de dopamine liée à la valeur dans le noyau NAc avec l’absence constante de dopage lié à la valeur par les neurones dopaminergiques.¹³, même dans la zone d'ATV latérale qui fournit de la dopamine au cœur de NAc⁴⁵. Un facteur potentiel réside dans le fait que les cellules dopaminergiques sont généralement enregistrées chez des animaux serre-tête exécutant des tâches de conditionnement classiques, tandis que la libération de dopamine est généralement mesurée chez des animaux non attachés se déplaçant activement dans leur environnement. Nous avons proposé que la dopamine mésolimbique puisse indiquer spécifiquement la valeur de «travail»¹⁵ - qu'il reflète une exigence de consacrer du temps et des efforts pour obtenir la récompense. Conformément à cela, la dopamine augmente avec les signaux indiquant le mouvement, mais pas avec les signaux indiquant l'immobilité, même lorsqu'ils indiquent une récompense future similaire⁴⁶. Si - comme dans de nombreuses tâches de conditionnement classiques - il n'y a aucun avantage à un «travail» actif, alors les changements dopaminergiques indiquant la valeur du travail peuvent être moins apparents.

Encore plus important peut être le fait que la libération de dopamine peut être localement contrôlée aux terminaux eux-mêmes et montrer ainsi des patrons spatio-temporels indépendants des pointes du corps cellulaire. Par exemple, l’amygdale basolatérale (BLA) peut influer sur la libération de dopamine de NAc même lorsque la VTA est inactivée.⁴⁷. Inversement, inactiver la BLA réduit la libération de dopamine en NAc et le comportement motivé correspondant, sans affecter apparemment le déclenchement de la VTA⁴⁸. Les terminaux dopaminergiques possèdent des récepteurs pour une gamme de neurotransmetteurs, notamment le glutamate, les opioïdes et l’acétylcholine. Les récepteurs de l'acétylcholine nicotinique permettent aux interneurones cholinergiques (CIN) striataux de contrôler rapidement la libération de dopamine^49,50. Bien qu’il soit noté depuis longtemps que le contrôle local de la libération de dopamine est potentiellement important^7,51, il n'a pas été inclus dans les comptes informatiques de la fonction dopaminergique. Je propose que la dynamique de la libération de dopamine liée au codage de la valeur résulte en grande partie de locales contrôle, alors même que le déclenchement de cellules dopaminergiques fournit d’importants signaux de type RPE pour l’apprentissage.

Comment la dopamine peut-elle signifier à la fois apprentissage et motivation sans confusion?

En principe, un signal de valeur suffit également à acheminer le RPE, car les RPE à différences temporelles sont simplement des changements de valeur rapides (Fig. 2B). Par exemple, des voies intracellulaires distinctes dans des neurones cibles pourraient être différemment sensibles à la concentration absolue de dopamine (représentant la valeur) par rapport aux changements relatifs rapides de concentration (représentant l'EPR). Ce schéma semble plausible, étant donné la modulation complexe de la physiologie des neurones épineux par la dopamine⁵² et leur sensibilité aux modèles temporels de concentration en calcium⁵³. Pourtant, cela semble aussi quelque peu redondant. Si un signal de type RPE existe déjà dans le spiking de cellules dopaminergiques, il devrait être possible de l'utiliser, plutôt que de dériver le RPE d'un signal de valeur.

Pour utiliser correctement les signaux RPE et de valeur distincts, les circuits récepteurs de dopamine peuvent activement changer leur interprétation de la dopamine. Il existe des preuves fascinantes que l’acétylcholine pourrait également jouer ce rôle. En même temps que les cellules dopaminergiques déclenchent des pointes inattendues, les CIN sont brefs (~ 150ms) pauses dans le tir, qui ne se déplacent pas avec les RPE⁵⁴. Ces pauses CIN peuvent être pilotées par les neurones VTA GABAergiques⁵⁵ ainsi que des cellules liées «par surprise» dans le thalamus intralaminaire, et ont été proposées pour agir en tant que signal d'associabilité favorisant l'apprentissage⁵⁶. Morris et Bergman ont suggéré⁵⁴ les pauses cholinergiques définissent des fenêtres temporelles pour la plasticité striatale, pendant lesquelles la dopamine peut être utilisée comme signal d'apprentissage. La plasticité dépendante de la dopamine est supprimée en permanence par des mécanismes tels que les récepteurs muscariniques m4 sur les neurones striataux à voie directe⁵⁷. Les modèles de signalisation intracellulaire suggèrent que pendant les pauses CIN, l'absence de liaison de m4 peut agir en synergie avec des sursauts dopaminergiques phasiques pour stimuler l'activation de la PKA⁵⁸, favorisant ainsi le changement synaptique.

Les cellules cholinergiques striatales sont donc bien placées pour changer de façon dynamique la signification d’un message dopaminergique multiplexé. Pendant les pauses CIN, le soulagement d'un bloc muscarinique par rapport à la plasticité synaptique permettrait à la dopamine d'être utilisée pour l'apprentissage. À d'autres moments, la libération des terminaux dopaminergiques serait sculptée localement pour affecter les performances comportementales en cours. Actuellement, cette suggestion est à la fois spéculative et incomplète. Il a été proposé que les CIN intègrent les informations de nombreux neurones épineux environnants afin d’extraire des signaux utiles au niveau du réseau tels que l’entropie.^59,60. Mais il n’est pas du tout évident que la dynamique de l’activité de la CIN puisse être utilisée pour générer des signaux de valeur de dopamine⁶¹et aussi pour déclencher des signaux d'apprentissage de la dopamine.

Est-ce que dopamine signifie la même chose dans tout le cerveau antérieur?

Lorsque l’idée du RPE s’est installée, on a imaginé que la dopamine était un signal global, transmettant un message d’erreur à travers les cibles corticales frontale et striatale. Schultz a souligné que les cellules de dopamine de singe à travers la VTA et la SNc ont des réponses très similaires⁶². Des études sur des cellules dopaminergiques identifiées ont également révélé des réponses assez homogènes analogues à l'EPR chez les rongeurs, du moins pour les neurones VTA latéraux dans des contextes de conditionnement classiques.¹³. Pourtant, les cellules dopaminergiques sont diverses sur le plan moléculaire et physiologique^63-65 et il y a maintenant beaucoup de rapports indiquant qu'ils montrent des schémas de tir différents chez les animaux qui se comportent. Ceux-ci incluent des augmentations phasiques du tir aux événements aversifs⁶⁶ et déclencheurs⁶⁷ qui correspondent mal au compte RPE standard. De nombreuses cellules dopaminergiques manifestent une réponse initiale à court temps de latence à des événements sensoriels, ce qui reflète davantage une surprise ou une «alerte» que le codage spécifique de l'EPR.^68,69. Cet aspect d'alerte est plus important dans SNc⁶⁹, où les cellules dopaminergiques se projettent davantage vers le striatum dorsal / latéral «sensorimoteur» (DLS)^45,63). On a également signalé que les sous-populations de cellules dopaminergiques de la SNc augmentaient⁴¹ ou diminuer⁷⁰ tirer en conjonction avec des mouvements spontanés, même sans signaux extérieurs.

Plusieurs groupes ont utilisé la photométrie des fibres et l'indicateur de calcium GCaMP pour examiner l'activité globale des sous-populations de neurones dopaminergiques.^71,72. Les cellules dopaminergiques qui se projettent sur le striatum dorsal / médian (DMS) ont présenté une activité transitoire déprimée entraînant de brefs chocs inattendus, tandis que celles se projetant vers le DLS ont présenté une activité accrue.⁷¹- plus cohérent avec une réponse d'alerte. Des réponses dopaminergiques distinctes dans différentes sous-régions du cerveau antérieur ont également été observées en utilisant GCaMP pour examiner l'activité des axones et des terminaisons de la dopamine^40,72,73. Utilisation de l'imagerie à deux photons chez des souris à la tête retenue, Howe et Dombeck⁴⁰ activité dopaminergique phasique liée à des mouvements spontanés. Cela a été principalement observé dans les axones individuels de la dopamine de la SNc qui se sont terminés dans le striatum dorsal, alors que les axones de la VTA dans la NAc réagissaient davantage pour récompenser la délivrance. D'autres ont également découvert une activité dopaminergique liée à la récompense dans NAc, le DMS étant plutôt lié à des actions controlatérales.⁷² et la queue postérieure du striatum sensible aux stimuli novateurs et aversifs⁷⁴.

Les mesures directes de la libération de dopamine révèlent également une hétérogénéité entre les sous-régions^30,75. Avec la microdialyse, nous avons trouvé que la dopamine était corrélée à la valeur spécifiquement dans le cortex frontal et le cortex frontal ventral-médial, et non dans les autres parties médiales du striatum (coquille de NAc, DMS) ou du cortex frontal. Ceci est intriguant, car il semble bien cartographier deux «points chauds» de codage de valeur régulièrement observés dans les études d’IRMf humaines.^76,77. En particulier, le signal NAc BOLD, qui est étroitement lié à la signalisation par la dopamine⁷⁸, augmente avec l'anticipation de la récompense (valeur) - plus qu'avec RPE⁷⁶.

Que ces schémas spatiaux de libération de dopamine résultent de la mise à feu de sous-populations de cellules de dopamine distinctes, du contrôle local de la libération de dopamine, ou des deux, ils défient l’idée d’un message global sur la dopamine. On pourrait en conclure qu'il existe de nombreuses fonctions dopaminergiques différentes, avec (par exemple) la dopamine dans le striatum dorsal signalant le «mouvement» et la dopamine dans le striatum ventral indiquant la «récompense»⁴⁰. Cependant, je privilégie une autre approche conceptuelle. Différentes sous-régions striatales reçoivent des entrées de différentes régions corticales et traiteront donc différents types d'informations. Pourtant, chaque sous-région striatale partage une architecture de microcircuit commune, comprenant des neurones épineux porteurs de récepteurs D1 et de D2 distincts.⁷⁹, CIN, etc. Bien qu'il soit courant de se référer à diverses sous-régions striatales (par exemple, DLS, DMS, noyau NAc) comme s'il s'agissait de zones distinctes, il n'y a pas de frontière anatomique nette entre elles (la coquille NAc est un peu plus distinct sur le plan neurochimique). Au lieu de cela, il n’ya que de faibles gradients dans la densité du récepteur, les proportions d’interneurones, etc., qui ressemblent davantage à des modifications des paramètres d’un algorithme de calcul partagé. Étant donné cette architecture commune, pouvons-nous décrire une fonction dopaminergique commune, abstraite des informations spécifiques traitées par chaque sous-région?

La dopamine striatale et l'allocation de ressources limitées.

Je propose qu’une variété d’effets disparates de la dopamine sur le comportement en cours puisse être comprise comme une modulation de décisions d'allocation de ressources. Plus précisément, la dopamine fournit une estimation de la valeur de l’utilisation d’une ressource interne limitée, la ressource particulière étant différente d’une sous-région à l’autre. Pour le striatum «moteur» (~ DLS), la ressource est le mouvement, ce qui est limité car le déplacement coûte de l'énergie et que de nombreuses actions sont incompatibles.⁸⁰. L'augmentation de la dopamine augmente la probabilité qu'un animal décide qu'il vaut la peine de dépenser de l'énergie pour se déplacer ou pour aller plus vite.^6,40,81. Notez qu'un signal dopaminergique codant «le mouvement vaut la peine» produira des corrélations entre la dopamine et le mouvement, même sans «mouvement» codant la dopamine. per se.

Pour le striatum «cognitif» (~ DMS), les ressources sont des processus cognitifs, y compris l’attention (capacité limitée par définition⁸²) et mémoire de travail⁸³. Sans dopamine, les signaux externes saillants qui provoquent normalement des mouvements d'orientation sont négligés, comme s'ils étaient jugés moins dignes d'attention³. De plus, marshaler délibérément les processus de contrôle cognitif demande beaucoup d’effort⁸⁴). Dopamine - en particulier dans le DMS⁸⁵ - joue un rôle clé pour décider s'il vaut la peine de faire cet effort^86,87. Cela peut inclure l’utilisation éventuelle de stratégies décisionnelles délibératives («basées sur un modèle») plus exigeantes sur le plan cognitif.⁸⁸.

Pour le striatum «motivationnel» (~ NAc), le temps de l'animal peut constituer une ressource clé essentielle. La dopamine mésolimbique n’est pas nécessaire lorsque les animaux effectuent une action simple et fixe pour obtenir rapidement des récompenses.⁸⁹. Mais de nombreuses formes de récompense ne peuvent être obtenues que par un travail prolongé: séquences d'actions non récompensées, comme dans la recherche de nourriture. Choisir de travailler signifie que l'on doit renoncer à d'autres moyens de gagner du temps. Une concentration élevée de dopamine mésolimbique indique qu'il est utile de faire un travail laborieux et prolongé dans le temps, mais comme la dopamine est réduite, les animaux ne sont pas gênés et peuvent au contraire se préparer à dormir.⁹⁰.

Au sein de chaque circuit de l'anse cortico-striatale, la contribution de la dopamine à un comportement permanent est donc à la fois économique (liée à l'affectation de ressources) et motivante (qu'elle soit digne d'intérêt dépenser des ressources⁸¹). Ces circuits ne sont pas totalement indépendants, mais possèdent plutôt une organisation hiérarchique en spirale: des parties plus ventrales du striatum influencent les cellules dopaminergiques qui font saillie vers des parties plus dorsales.^5,91. De cette manière, les décisions de s'engager dans le travail peuvent également aider à revigorer les mouvements spécifiques et plus brefs requis. Mais dans l'ensemble, la dopamine fournit des signaux «d'activation» - augmentant la probabilité qu'une décision soit prise - plutôt que des signaux «directionnels» spécifiant how les ressources devraient être dépensées⁵.

Quel est le rôle informatique de la dopamine dans la prise de décision?

Une façon de penser à ce rôle d’activation consiste à définir des «seuils» de prise de décision. Dans certains modèles mathématiques, les processus de décision augmentent jusqu'à atteindre un seuil, lorsque le système s'engage dans une action.⁹². Une dopamine plus élevée équivaudrait à une distance inférieure au seuil, de sorte que les décisions soient prises plus rapidement. Cette idée est simpliste, mais fait des prédictions quantitatives qui ont été confirmées. L'abaissement des seuils de mouvement provoquerait un changement spécifique dans la forme de la distribution du temps de réaction, à l'image de ce qui est observé lorsque de l'amphétamine est infusée dans le striatum sensorimoteur.²⁰.

Plutôt que des seuils fixes, les données comportementales et neurales peuvent être mieux adaptées si les seuils diminuent avec le temps, comme si les décisions devenaient de plus en plus urgentes. La sortie des ganglions de la base a été proposée pour fournir un signal d’urgence évoluant de manière dynamique, qui dynamise les mécanismes de sélection dans le cortex.⁹³. L'urgence était également plus grande lorsque les récompenses futures étaient plus proches dans le temps, faisant de ce concept un concept similaire au codage des valeurs, rôle activateur de la dopamine.

Un tel rôle activateur est-il suffisant pour décrire les effets modulateurs de la dopamine striatale sur la performance? Cela est lié à la question de savoir si les circuits des noyaux gris centraux sélectionnent directement parmi les actions acquises⁸⁰ ou simplement revigorer les choix faits ailleurs^93,94. Il y a au moins deux façons dont la dopamine peut sembler avoir un effet plus «directionnel». Le premier est le moment où la dopamine agit dans une sous-région cérébrale qui traite des informations intrinsèquement directionnelles. Les circuits des ganglions de la base ont un rôle important, partiellement latéralisé, dans l’orientation vers les récompenses potentielles et dans leur approche. Le primate caudé (~ DMS) est impliqué dans les mouvements des yeux vers les champs spatiaux controlatéraux⁹⁵. Un signal dopaminergique vers lequel orienter quelque chose dans l’espace controlatéral peut expliquer la corrélation observée entre l’activité dopaminergique dans le DMS et les mouvements controlatéraux.⁷², ainsi que le comportement en rotation produit par les manipulations de la dopamine⁹⁶. Une deuxième influence «directionnelle» de la dopamine est apparente lorsque les lésions (bilatérales) à la dopamine orientent les rats vers des choix demandant peu d'effort / peu de récompense, plutôt que des alternatives demandant beaucoup d'effort / très gratifiant.⁹⁷. Cela peut refléter le fait que certaines décisions sont plus sérielles que parallèles, les rats (et les humains) évaluant les options une à la fois.⁹⁸. Dans ces contextes décisionnels, la dopamine peut toujours jouer un rôle fondamentalement activateur en transmettant la valeur de l'option actuellement envisagée, qui peut ensuite être acceptée ou non.²⁴.

Les animaux actifs prennent des décisions à plusieurs niveaux, souvent à des taux élevés. Au-delà de la réflexion sur les décisions individuelles, il peut être utile de considérer une trajectoire globale à travers une séquence d'états (Fig. 1). En facilitant les transitions d'un état à l'autre, la dopamine peut accélérer l'écoulement le long des trajectoires apprises⁹⁹. Cela peut être lié à l'influence importante de la dopamine sur le moment du comportement^44,100. Une des principales frontières pour les travaux futurs consiste à mieux comprendre comment de tels effets de la dopamine sur le comportement en cours surviennent de façon mécaniste, en modifiant le traitement de l’information au sein de cellules uniques, de microcircuits et de boucles à grande échelle des noyaux gris-corticaux. En outre, j'ai mis l'accent sur les rôles informatiques communs de la dopamine dans une gamme de cibles striatales, mais les cibles corticales largement négligées, et il reste à voir si les fonctions de la dopamine dans les deux structures peuvent être décrites dans le même cadre.

En résumé, une description adéquate de la dopamine expliquerait comment la dopamine peut signaler à la fois l’apprentissage et la motivation sur une même échelle de temps rapide, sans confusion. Cela expliquerait pourquoi la libération de dopamine chez des cibles clés suscite des espoirs de récompense, même si le déclenchement de cellules dopaminergiques ne le permet pas. Et cela fournirait un compte rendu informatique unifié des actions de la dopamine dans le striatum et ailleurs, ce qui explique les effets comportementaux disparates sur le mouvement, la cognition et le timing. Certaines idées spécifiques présentées ici sont spéculatives, mais ont pour but de revigorer les discussions, les modélisations et les expériences nouvelles les plus incisives.

Remerciements

Je remercie les nombreux collègues qui ont fourni des commentaires perspicaces sur des versions antérieures de textes, notamment Kent Berridge, Peter Dayan, Brian Knutson, Jeff Beeler, Peter Redgrave, John Lisman, Jesse Goldberg et les arbitres anonymes. Je regrette que les contraintes d'espace aient empêché la discussion de nombreuses études antérieures importantes. L’Institut national des troubles neurologiques et des accidents vasculaires cérébraux, l’Institut national de la santé mentale et l’Institut national de lutte contre l’abus des drogues ont apporté un soutien essentiel.

Références:

1. Ungerstedt U Adipsia et aphagie après la dégénérescence induite par 6-hydroxydopamine du système dopaminergique nigro-striatal. Acta Physiol Scand Suppl 367, 95 – 122 (1971). [PubMed] [Google Scholar]

2. Sacs O Réveils. Réveils (1973).

3. Marshall JF, Levitan D et Stricker EM Restauration induite par l'activation des fonctions sensorimotrices chez le rat porteur de lésions cérébrales appauvrissant la dopamine. J Comp Physiol Psychol 90, 536 – 46 (1976). [PubMed] [Google Scholar]

4. Berridge KC, Venier IL et Robinson TE Analyse de réactivité gustative de l'aphagie induite par 6-hydroxydopamine: implications pour les hypothèses de la fonction dopamine relatives à l'excitation et à l'anhédonie. Behav Neurosci 103, 36 – 45 (1989). [PubMed] [Google Scholar]

5. Salamone J et Correa M Les fonctions de motivation mystérieuses de la dopamine mésolimbique. Neuron 76, 470–485 (2012).doi:10.1016/j.neuron.2012.10.021 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

6. Mazzoni P, Hristova A et Krakauer JW Pourquoi ne pas aller plus vite? Maladie de Parkinson, vigueur du mouvement et motivation implicite. J Neurosci 27, 7105 – 16 (2007) .doi: 10.1523 / JNEUROSCI.0264-07.2007 [PubMed] [CrossRef] [Google Scholar]

7. Schultz W Réponses des neurones de la dopamine du cerveau moyen aux stimuli comportementaux du singe. Journal de neurophysiologie 56, 1439 – 1461 (1986). [PubMed] [Google Scholar]

8. Schultz W et Romo R Neurones dopaminergiques du cerveau moyen de singe: contingences de réponses à des stimuli provoquant des réactions comportementales immédiates. J Neurophysiol 63, 607 – 24 (1990). [PubMed] [Google Scholar]

9. Montague PR, Dayan P et Sejnowski TJ Un cadre pour les systèmes dopaminergiques mésencéphaliques basé sur l'apprentissage prédictif de Hebbian. J Neurosci 16, 1936 – 47 (1996). [PubMed] [Google Scholar]

10. Schultz W, Apicella P et Ljungberg T Réponses des neurones dopaminergiques de singe pour récompenser et stimuler les stimuli conditionnés au cours des étapes successives d'apprentissage d'une tâche de réponse différée. J Neurosci 13, 900 – 13 (1993). [PubMed] [Google Scholar]

11. Sutton RS et Barto AG Apprentissage par renforcement: une introduction. Apprentissage par renforcement: une introduction (MIT Press: Cambridge, Massachusetts, 1998). [Google Scholar]

12. Cohen JY, S Haesler, Vong L, Lowell BB et Uchida N Signaux spécifiques à un type de neurone pour récompense et punition dans la région tegmentale ventrale. Nature 482, 85–8 (2012).doi:10.1038/nature10754 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

13. Eshel N, Tian J, Bukwich M et Uchida N Les neurones dopaminergiques partagent une fonction de réponse commune pour l'erreur de prédiction de récompense. Nat Neurosci 19, 479–86 (2016).doi:10.1038/nn.4239 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

14. Steinberg EE, Keiflin R, Boivin JR, Witten IB, Deisseroth K et Janak PH Un lien de causalité entre les erreurs de prédiction, les neurones dopaminergiques et l'apprentissage. Nat Neurosci (2013) .doi: 10.1038 / nn.3413 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

15. Hamid AA, Pettibone JR, Mabrouk OS, Hetrick VL, Schmidt R., Vander Weele CM, Kennedy RT, Aragona BJ et Berke JD. La dopamine mésolimbique signale la valeur du travail. Nat Neurosci 19, 117–26 (2016).doi:10.1038/nn.4173 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

16. Yagishita S., Hayashi-Takagi A., GC Ellis-Davies, H. Urakubo, S. Ishii et H. Kasaï. Une fenêtre temporelle critique pour les actions de la dopamine sur la plasticité structurale des épines dendritiques. Sciences 345, 1616–20 (2014).doi:10.1126/science.1255514 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

17. Berke JD et Hyman SE Addiction, dopamine et mécanismes moléculaires de la mémoire. Neuron 25, 515 – 32 (2000). [PubMed] [Google Scholar]

18. Beeler JA, Frank MJ, J McDaid, Alexander E, S Turkson, MS Bernandez, McGehee DS et Zhuang X Un rôle pour l'apprentissage à médiation dopaminergique dans la physiopathologie et le traitement de la maladie de Parkinson. Cell Rep 2, 1747–61 (2012).doi:10.1016/j.celrep.2012.11.014 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

19. Sage RA Dopamine, apprentissage et motivation. Nat Rev Neurosci 5, 483 – 94 (2004) .doi: 10.1038 / nrn1406 [PubMed] [CrossRef] [Google Scholar]

20. Leventhal DK, C Stoetzner, Abraham R, J Pettibone, DeMarco K et Berke JD Effets dissociables de la dopamine sur l'apprentissage et les performances au sein du striatum sensorimoteur. Ganglions de la base 4, 43–54 (2014).doi:10.1016/j.baga.2013.11.001 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

21. Wyvell CL et Berridge KC L’amphétamine intra-accumbens augmente l’importance conditionnelle de la récompense de saccharose: amélioration de la récompense «manquante» sans amélioration de la sympathie ou du renforcement de la réponse. J Neurosci 20, 8122 – 30. (2000). [PubMed] [Google Scholar]

22. Cagniard B, Juge Beeler, Britt JP, McGehee DS, Marinelli M et Zhuang X La dopamine réduit les performances en l'absence de nouvel apprentissage. Neuron 51, 541 – 7 (2006) .doi: 10.1016 / j.neuron.2006.07.026 [PubMed] [CrossRef] [Google Scholar]

23. Shiner T, Seymour B, K Wunderlich, Colline C, KP Bhatia, Dayan P et Dolan RJ Dopamine et performance dans une tâche d'apprentissage par renforcement: données probantes sur la maladie de Parkinson. Cerveau 135, 1871 – 1883 (2012). [Article gratuit PMC] [PubMed] [Google Scholar]

24. McClure SM, Daw ND et PR de Montague Un substrat de calcul pour la visibilité incitative. Tendances Neurosci 26, 423 – 8 (2003). [PubMed] [Google Scholar]

25. Schultz W Plusieurs fonctions de la dopamine à différents moments. Annu Rev Neurosci 30, 259 – 88 (2007) .doi: 10.1146 / annurev.neuro.28.061604.135722 [PubMed] [CrossRef] [Google Scholar]

26. Gonon F, Burie JB, Jaber M, Benoit-Marand M, Dumartin B et Bloch B Géométrie et cinétique de la transmission dopaminergique chez le striatum de rat et chez les souris dépourvues du transporteur de la dopamine. Prog Brain Res 125, 291 – 302 (2000). [PubMed] [Google Scholar]

27. Aragona BJ, Cleaveland NA, Stuber GD, Day JJ, Carelli RM et Wightman RM L'amélioration préférentielle de la transmission de la dopamine dans la coque du noyau accumbens par la cocaïne est attribuable à une augmentation directe du nombre de manifestations de libération de dopamine en phase. J Neurosci 28, 8821–31 (2008).doi:10.1523/JNEUROSCI.2225-08.2008 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

28. Owesson-White CA, MF Roitman, Sombers LA, Belle AM, Keithley RB, Peele JL, Carelli RM et Wightman RM. Sources contribuant à la concentration extracellulaire moyenne de dopamine dans le noyau accumbens. J Neurochem 121, 252–62 (2012).doi:10.1111/j.1471-4159.2012.07677.x [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

29. Yapo C, Nair AG, Clément L, Castro LR, Hellgren Kotaleski et Vincent P Détection de la dopamine phasique par les neurones à épines moyennes striatales D1 et D2. J Physiol (2017) .doi: 10.1113 / JP274475 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

30. CR libre et Yamamoto BK Métabolisme régional de la dopamine dans le cerveau: un marqueur de la vitesse, de la direction et de la posture d'animaux en mouvement. Sciences 229, 62 – 65 (1985). [PubMed] [Google Scholar]

31. Niv Y, Daw ND, Joel D et Dayan P Dopamine tonique: coûts d'opportunité et contrôle de la vigueur de la réponse. Psychopharmacologie (Berl) 191, 507–20 (2007).doi:10.1007/s00213-006-0502-4 [PubMed] [CrossRef] [Google Scholar]

32. Strecker RE, Steinfels GF et Jacobs BL Activité unitaire dopaminergique chez les chats à mobilité réduite: absence de relation avec l'alimentation, la satiété et les injections de glucose. Brain Res 260, 317 – 21 (1983). [PubMed] [Google Scholar]

33. Cohen JY, Amoroso MW et Uchida N Les neurones sérotoninergiques signalent une récompense et une punition sur plusieurs échelles de temps. ELIFE 4, (2015) .doi: 10.7554 / eLife.06346 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

34. Floresco SB, West AR, B Ash, Moore H et Grace AA La modulation afférente du tir de neurones dopaminergiques régule de manière différentielle la transmission tonique et phasique de la dopamine. Nat Neurosci 6, 968 – 73 (2003) .doi: 10.1038 / nn1103 [PubMed] [CrossRef] [Google Scholar]

35. Grace AA Dysrégulation du système dopaminergique dans la physiopathologie de la schizophrénie et de la dépression. Nature Reviews Neuroscience 17, 524 (2016) .doi: 10.1038 / nrn.2016.57 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

36. Phillips PE, Stuber GD, Heien ML, Wightman RM et Carelli RM Une libération de dopamine inférieure à la seconde favorise la recherche de cocaïne. Nature 422, 614 – 8 (2003) .doi: 10.1038 / nature01476 [PubMed] [CrossRef] [Google Scholar]

37. Wassum KM, Ostlund SB et Maidment NT La signalisation dopaminergique phasique mésolimbique précède et prédit la réalisation d'une tâche de séquence d'actions auto-initiée. Biol Psychiatry 71, 846–54 (2012).doi:10.1016/j.biopsych.2011.12.019 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

38. Howe MW, PL Tierney, SG Sandberg, Phillips PE et Graybiel AM La signalisation prolongée par la dopamine dans le striatum indique la proximité et la valeur des récompenses distantes. Nature 500, 575–9 (2013).doi:10.1038/nature12475 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

39. Satoh T, Nakai S, Sato T et Kimura M Codage corrélé de la motivation et du résultat de la décision par les neurones dopaminergiques. J Neurosci 23, 9913 – 23 (2003). [PubMed] [Google Scholar]

40. Howe MW et Dombeck DA Signalisation rapide dans des axones dopaminergiques distincts pendant la locomotion et la récompense. Nature 535, 505–10 (2016).doi:10.1038/nature18942 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

41. Silva JAD, Tecuapetla F, Paixão V et Costa RM L'activité des neurones dopaminergiques avant l'initiation de l'action déclenche et stimule les mouvements futurs. Nature 554, 244 (2018) .doi: 10.1038 / nature25457 [PubMed] [CrossRef] [Google Scholar]

42. du Hoffmann J et Nicola SM La dopamine stimule la recherche de récompenses en favorisant l'excitation évoquée dans le noyau accumbens. J Neurosci 34, 14349–64 (2014).doi:10.1523/JNEUROSCI.3492-14.2014 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

43. Hart AS, Rutledge RB, Glimcher PW et Phillips PE La libération de dopamine phasique dans le noyau du rat accumbens code de manière symétrique pour un terme d'erreur de prédiction de récompense. J Neurosci 34, 698–704 (2014).doi:10.1523/JNEUROSCI.2489-13.2014 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

44. Soares S, Atallah BV et Paton JJ Les neurones dopaminergiques du cerveau moyen contrôlent le jugement du temps. Sciences 354, 1273 – 1277 (2016) .doi: 10.1126 / science.aah5234 [PubMed] [CrossRef] [Google Scholar]

45. Ikemoto S Circuit de récompense de la dopamine: deux systèmes de projection du mésencéphale ventral au complexe noyau accumbens-olfactif. Brain Res Rev 56, 27–78 (2007).doi:10.1016/j.brainresrev.2007.05.004 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

46. Syed EC, Grima LL, Magill PJ, Bogacz R, Brown P et Walton ME L’action d’initiation façonne l’encodage dopaminergique mésolimbique des futures récompenses. Nat Neurosci (2015) .doi: 10.1038 / nn.4187 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

47. Floresco SB, Yang CR, Phillips AG et Blaha CD La stimulation de l'amygdale basolatérale évoque un efflux de dopamine dépendant du récepteur du glutamate dans le noyau accumbens du rat anesthésié. Eur J Neurosci 10, 1241 – 51 (1998). [PubMed] [Google Scholar]

48. Jones JL, Day JJ, Aragona BJ, Wheeler RA, Wightman RM et Carelli RM L’amygdale basolatérale module la libération terminale de dopamine dans le noyau accumbens et répond. Biol Psychiatry 67, 737–44 (2010).doi:S0006–3223(09)01327–4 [pii] 10.1016/j.biopsych.2009.11.006 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

49. Cachope R, Y Mateo, BN Mathur, Irving J, Wang HL, Morales M, DM Lovinger et Cheer JF L'activation sélective des interneurones cholinergiques améliore la libération de dopamine phasique accumbal: donner le ton au traitement de la récompense. Cell Rep 2, 33–41 (2012).doi:10.1016/j.celrep.2012.05.011 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

50. Threlfell S, Lalic T, NJ Platt, Jennings KA, Deisseroth K et Cragg SJ La libération de dopamine striatale est déclenchée par l'activité synchronisée des interneurones cholinergiques. Neuron 75, 58 – 64 (2012) .doi: 10.1016 / j.neuron.2012.04.038 [PubMed] [CrossRef] [Google Scholar]

51. Grace AA Libération de dopamine phasique versus tonique et modulation de la réactivité du système dopaminergique: une hypothèse pour l'étiologie de la schizophrénie. Neuroscience 41, 1 – 24 (1991). [PubMed] [Google Scholar]

52. Moyer JT, Wolf JA et Finkel LH Effets de la modulation dopaminergique sur les propriétés intégratives du neurone épineux moyen striatal ventral. J Neurophysiol 98, 3731 – 48 (2007). [PubMed] [Google Scholar]

53. Jędrzejewska-Szmek J, Damodaran S, Dorman DB et Blackwell KT La dynamique du calcium permet de prédire la direction de la plasticité synaptique dans les neurones à projection épineuse striatale. Eur J Neurosci 45, 1044–1056 (2017).doi:10.1111/ejn.13287 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

54. Morris G, Arkadir D, Nevet A, Vaadia E et Bergman H Messages coïncidents mais distincts de la dopamine dans le cerveau moyen et de neurones toniquement tonaux striataux. Neuron 43, 133 – 43 (2004). [PubMed] [Google Scholar]

55. Brown MT, Tan KR, EC O'Connor, Nikonenko I, Muller D et Lüscher C Zone tegmentale ventrale Les projections GABA mettent en pause les interneurones cholinergiques accumbaux pour améliorer l'apprentissage associatif. Nature (2012) .doi: 10.1038 / nature11657 [PubMed] [CrossRef] [Google Scholar]

56. Yamanaka K, Hori Y, T Minamimoto, Yamada H, Matsumoto N, Enomoto K, Aosaki T, Graybiel AM et Kimura M Rôles des noyaux parafasciculaires centromédiens du thalamus et des interneurones cholinergiques du striatum dorsal dans l'apprentissage associatif d'événements environnementaux. J Neural Transm (Vienne) (2017).doi:10.1007/s00702-017-1713-z [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

57. Shen W, Plotkin JL, Francard V, Ko WK, Xie Z, Li Q, Fieblinger T, Wess J, Neubig RR, Lindsley CW, Conn PJ, Greengard P, Bezard E, Cenci MA et DJ Surmeier. La Signalisation Du Récepteur Muscarinique M4 Améliore Les Déficits De Plasticité Striatale Dans Les Modèles De Dyskinésie Induite Par La L-DOPA. Neuron 88, 762–73 (2015).doi:10.1016/j.neuron.2015.10.039 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

58. Nair AG, O Gutierrez-Arenas, O Eriksson, Vincent P et Hellgren Kotaleski Détection De Signaux De Récompense Positifs Ou Négatifs À Travers Des GPCR Couplés à Une Adenylyl Cyclase Dans Les Neurones à Voie Direct Et Indirect Striatal. J Neurosci 35, 14017–30 (2015).doi:10.1523/JNEUROSCI.0730-15.2015 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

59. Stocco A Entropie à base d'acétylcholine dans la sélection de la réponse: un modèle montrant comment les interneurones striataux modulent l'exploration, l'exploitation et la variabilité de la réponse dans la prise de décision. Frontières en neurosciences 6, (2012). [Article gratuit PMC] [PubMed] [Google Scholar]

60. Franklin NT et Frank MJ Un circuit de rétroaction cholinergique pour réguler l'incertitude de la population striatale et optimiser l'apprentissage par renforcement. eLife 4, (2015) .doi: 10.7554 / eLife.12029 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

61. Nougaret S et Ravel S Modulation des neurones toniquement actifs du striatum de singe par des événements portant des informations de force et de récompense différentes. J Neurosci 35, 15214 – 26 (2015) .doi: 10.1523 / JNEUROSCI.0039-15.2015 [PubMed] [CrossRef] [Google Scholar]

62. Schultz W Signal de récompense prédictif des neurones dopaminergiques. J Neurophysiol 80, 1 – 27 (1998). [PubMed] [Google Scholar]

63. Lammel S, Hetzel A, Häckel O, Jones I, Liss B et Roeper J Propriétés uniques des neurones mésopréfrontaliers dans un double système dopaminergique mésocorticolimbique. Neuron 57, 760 – 73 (2008) .doi: 10.1016 / j.neuron.2008.01.022 [PubMed] [CrossRef] [Google Scholar]

64. Poulin JF, J Zou, J Drouin-Ouellet, Kim KY, Cicchetti F et Awatramani RB Définition de la diversité des neurones dopaminergiques dans le cerveau moyen par profilage de l'expression d'un gène dans une cellule. Cell Rep 9, 930–43 (2014).doi:10.1016/j.celrep.2014.10.008 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

65. Morales M et Margolis EB Zone tegmentale ventrale: hétérogénéité cellulaire, connectivité et comportement. Nat Rev Neurosci 18, 73 – 85 (2017) .doi: 10.1038 / nrn.2016.165 [PubMed] [CrossRef] [Google Scholar]

66. Matsumoto M et Hikosaka O Deux types de neurones dopaminergiques transmettent distinctement des signaux de motivation positifs et négatifs. Nature 459, 837 – 41 (2009) .doi: nature08028 [pii] 10.1038 / nature08028 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

67. Pasquereau B et Turner RS Les neurones dopaminergiques codent des erreurs pour prédire l'occurrence d'un déclencheur de mouvement. Journal de neurophysiologie 113, 1110–1123 (2014).doi:10.1152/jn.00401.2014 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

68. Redgrave P, TJ Prescott et Gurney K La réponse dopamine à latence courte est-elle trop courte pour signaler une erreur de récompense?? Tendances Neurosci 22, 146 – 51 (1999). [PubMed] [Google Scholar]

69. Bromberg-Martin ES, Matsumoto M et Hikosaka O La dopamine dans le contrôle de la motivation: enrichissante, aversive et alerte. Neuron 68, 815–34 (2010).doi:10.1016/j.neuron.2010.11.022 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

70. PD Dodson, Dreyer JK, Jennings KA, Syed EC, Wade-Martins R, Cragg SJ, Bolam JP et Magill PJ La représentation du mouvement spontané par les neurones dopaminergiques est sélective en fonction du type de cellule et perturbe le parkinsonisme. Proc Natl Acad Sci USA 113, E2180–8 (2016).doi:10.1073/pnas.1515941113 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

71. Lerner TN, Shilyansky C, Davidson TJ, Evans KE, Beier KT, Zalocusky KA, Crow AK, Malenka RC, Luo L, Tomer R et Deisseroth K Des analyses intacts du cerveau révèlent des informations distinctes portées par les sous-circuits de dopamine de la SNc. Cellule 162, 635–47 (2015).doi:10.1016/j.cell.2015.07.014 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

72. Parker NF, Cameron CM, Taliaferro JP, Lee J, Choi JY, Davidson TJ, Daw ND et Witten IB Le codage de récompense et de choix aux extrémités des neurones à dopamine du cerveau moyen dépend de la cible striatale. Nat Neurosci (2016) .doi: 10.1038 / nn.4287 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

73. Kim CK, Yang SJ, Pichamoorthy N, jeune NP, Kauvar I, Jennings JH, Lerner TN, Berndt A, Lee SY, Ramakrishnan C, Davidson TJ, Inoue M, Bito H et Deisseroth K Mesure rapide simultanée de la dynamique des circuits sur plusieurs sites du cerveau des mammifères. Nature Methods 13, 325–328 (2016).doi:10.1038/nmeth.3770 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

74. Menegas W, Babayan BM, Uchida N et Watabe-Uchida M Initialisation opposée à de nouveaux signaux de signalisation de la dopamine dans le striatum ventral et postérieur chez la souris. ELIFE 6, (2017) .doi: 10.7554 / eLife.21886 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

75. Brown HD, JE McCutcheon, Cone JJ, Ragozzino ME et Roitman MF La récompense alimentaire primaire et les stimuli prédictifs de récompense évoquent différents modèles de signalisation phasique de la dopamine dans le striatum. Le European Journal of Neuroscience 34, 1997–2006 (2011).doi:10.1111/j.1460-9568.2011.07914.x [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

76. Knutson B et Greer SM Affect anticipé: corrélats neuronaux et conséquences pour le choix. Philos Trans R Soc Lond Biol Sci 363, 3771–86 (2008).doi:10.1098/rstb.2008.0155 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

77. Bartra O, McGuire JT et Kable JW Le système d'évaluation: une méta-analyse basée sur les coordonnées d'expériences IRMf BOLD examinant des corrélats neuronaux de valeur subjective. Neuroimage 76, 412–27 (2013).doi:10.1016/j.neuroimage.2013.02.063 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

78. Ferenczi EA, Zalocusky KA, Liston C, Grosenick L, Gardien MR, Amatya D, Katovich K, Mehta H, Patenaude B, Ramakrishnan C, Kalanithi P, Etkin A, Knutson B, Glover GH et Deisseroth K Régulation corticale préfrontal de la dynamique du circuit cérébral et du comportement lié aux récompenses. Sciences 351, aac9698 (2016) .doi: 10.1126 / science.aac9698 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

79. Bertran-Gonzalez J, Bosch C, M Maroteaux, M Matamales, Hervé D, Valjent E et Girault, JCA Modèles opposés d'activation de la signalisation dans les neurones striataux exprimant des récepteurs D1 et D2 de la dopamine en réponse à la cocaïne et à l'halopéridol. J Neurosci 28, 5671 – 85 (2008) .doi: 10.1523 / JNEUROSCI.1039-08.2008 [PubMed] [CrossRef] [Google Scholar]

80. Redgrave P, TJ Prescott et Gurney K Les noyaux gris centraux: une solution vertébrée au problème de sélection? Neuroscience 89, 1009 – 23 (1999). [PubMed] [Google Scholar]

81. Beeler JA, Frazier CR et Zhuang X Donner envie à un budget: dépenses en dopamine et en énergie, réconcilier récompense et ressources. Neurosci avant intégral 6, 49 (2012) .doi: 10.3389 / fnint.2012.00049 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

82. Anderson BA, Kuwabara H, DF Wong, Gean EG, Rahmim A, Brašić JR, George N, Frolov B, Courtney SM et Yantis S. Le rôle de la dopamine dans l'orientation attentionnelle fondée sur la valeur. Curr Biol 26, 550–5 (2016).doi:10.1016/j.cub.2015.12.062 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

83. Chatham CH, Frank MJ et Badre D Sortie corticostriatale lors de la sélection à partir de la mémoire de travail. Neuron 81, 930–42 (2014).doi:10.1016/j.neuron.2014.01.002 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

84. Shenhav A, Botvinick MM et Cohen JD La valeur attendue du contrôle: une théorie intégrative de la fonction du cortex cingulaire antérieur. Neuron 79, 217–40 (2013).doi:10.1016/j.neuron.2013.07.007 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

85. Aarts E, Roelofs A, Franke B, M Rijpkema, Fernández G, RC Helmich et Cools R La dopamine striatale sert d'intermédiaire entre le contrôle motivationnel et le contrôle cognitif chez l'homme: données probantes issues de l'imagerie génétique. Neuropsychopharmacology 35, 1943–51 (2010).doi:10.1038/npp.2010.68 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

86. Westbrook A et Braver TS La dopamine joue un rôle double dans la motivation des efforts cognitifs. Neuron 89, 695–710 (2016).doi:10.1016/j.neuron.2015.12.029 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

87. Manohar SG, Chong TT, applications MA, Batla A, Stamelou M, relations publiques Jarman, Bhatia KP et Husain M La récompense paie le coût de la réduction du bruit dans le contrôle moteur et cognitif. Curr Biol 25, 1707–16 (2015).doi:10.1016/j.cub.2015.05.038 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

88. Wunderlich K, Smittenaar P et Dolan RJ La dopamine améliore le comportement fondé sur un modèle plutôt qu'un modèle sans choix. Neuron 75, 418–24 (2012).doi:10.1016/j.neuron.2012.03.042 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

89. Nicola SM L’hypothèse d’approche flexible: unification de l’effort et hypothèses de réponse au signal pour le rôle du noyau accumbens dopamine dans l’activation du comportement en quête de récompense. J Neurosci 30, 16585–600 (2010).doi:10.1523/JNEUROSCI.3958-10.2010 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

90. Eban-Rothschild A, Rothschild G, Giardino WJ, Jones JR et de Lecea L Les neurones dopaminergiques VTA régulent les comportements veille-sommeil éthologiquement pertinents. Nat Neurosci (2016) .doi: 10.1038 / nn.4377 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

91. Haber SN, Fudge JL et McFarland NR Les voies de Striatonigrostriatal chez les primates forment une spirale ascendante de la coquille au striatum dorsolatéral. J Neurosci 20, 2369 – 82 (2000). [PubMed] [Google Scholar]

92. Reddi BAJ et Carpenter RHS L'influence de l'urgence sur l'heure de la décision. Neuroscience de la nature 3, 827 (2000). [PubMed] [Google Scholar]

93. Thura D et Cisek P Les ganglions de la base ne choisissent pas d'atteindre les cibles mais contrôlent l'urgence de l'engagement. Neuron (2017) .doi: 10.1016 / j.neuron.2017.07.039 [PubMed] [CrossRef] [Google Scholar]

94. Turner RS et Desmurget M Contributions des ganglions de la base au contrôle moteur: un tuteur vigoureux. Acteur Neurobiol 20, 704–16 (2010).doi:10.1016/j.conb.2010.08.022 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

95. Hikosaka O, Nakamura K et Nakahara H Les ganglions de la base orientent les yeux vers la récompense. J Neurophysiol 95, 567 – 84 (2006) .doi: 10.1152 / jn.00458.2005 [PubMed] [CrossRef] [Google Scholar]

96. Kelly PH et Moore KE Neurones dopaminergiques mésolimbiques dans le modèle rotationnel de la fonction nigrostriatale. Nature 263, 695 – 6 (1976). [PubMed] [Google Scholar]

97. Cousins MS, Atherton A, Turner L et Salamone JD L'épuisement de la dopamine dans le noyau accumbens modifie l'allocation de la réponse relative dans une tâche coût / bénéfice du labyrinthe en T. Behav Brain Res 74, 189 – 97. (1996). [PubMed] [Google Scholar]

98. AD rougeâtre Essai et erreur par procuration. Nat Rev Neurosci 17, 147–59 (2016).doi:10.1038/nrn.2015.30 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

99. Rabinovich MI, Huerta R, Varona P et Afraimovich VS Dynamique cognitive transitoire, métastabilité et prise de décision. PLoS Comput Biol 4, e1000072 (2008) .doi: 10.1371 / journal.pcbi.1000072 [Article gratuit PMC] [PubMed] [CrossRef] [Google Scholar]

100. Merchant H, Harrington DL et Meck WH Base neurale de la perception et de l'estimation du temps. Annu Rev Neurosci 36, 313 – 36 (2013) .doi: 10.1146 / annurev-neuro-062012-170349 [PubMed] [CrossRef] [Google Scholar]