Biol Psychiatry. Manuscrit de l'auteur; disponible dans PMC 2014 May 1.
Publié sous forme finale modifiée en tant que:
Biol Psychiatry. 2013 May 1; 73 (9): 819 – 826.
Publié en ligne 2012 Oct 5. est ce que je: 10.1016 / j.biopsych.2012.09.001
PMCID: PMC3548035
NIHMSID: NIHMS407698
Abstract
La question de savoir si (ou dans quelle mesure) l'obésité reflète la dépendance aux aliments à haute teneur énergétique se ramène souvent à la question de savoir si la surconsommation de ces aliments provoque les mêmes neuro-adaptations à long terme que celles identifiées aux stades avancés de la dépendance. La question de savoir si des mécanismes cérébraux communs influencent l'acquisition et le développement d'habitudes alimentaires et de consommation de drogues est tout aussi intéressante, voire plus grande. Les premières preuves sur cette question sont enracinées dans les premières études sur la récompense de la stimulation cérébrale. La stimulation électrique hypothalamique latérale peut se renforcer dans certaines conditions et peut motiver l'alimentation dans d'autres. Il est paradoxal que la stimulation de la même région cérébrale renforce et induise. pourquoi un animal devrait-il provoquer un état de pulsion tel que la faim? C'est ce que l'on appelle le «paradoxe pulsion-récompense». Un aperçu des substrats du paradoxe pulsion-récompense suggère une réponse à la question controversée de savoir si le système dopaminergique - un système «en aval» des fibres stimulées de l'hypothalamus latéral - est de manière plus critique à «vouloir» ou à «aimer» diverses récompenses, notamment de la nourriture et des drogues provoquant une dépendance. Le fait que les mêmes circuits cérébraux soient impliqués dans la motivation et le renforcement à la fois par les aliments et les drogues provoquant une dépendance prolonge l’argument en faveur d’un mécanisme commun sous-jacent à la suralimentation compulsive et à la consommation compulsive de drogues.
Au cours des dernières années, les discussions sur la toxicomanie ont eu tendance à se concentrer sur ses phases terminales, une exposition répétée à une drogue ayant altéré le cerveau de manière mesurable par les biologistes cellulaires, les électrophysiologistes et les neuroimagers. Les années précédentes, l’attention était portée sur les effets des drogues entraînant une dépendance sur l’habitude; Comment des drogues addictives ont-elles détourné les mécanismes cérébraux de motivation et de récompense? La question de savoir si l'obésité résultats de la dépendance alimentaire nous ramène à la question précédente de savoir quels mécanismes cérébraux sont responsables du développement de la recherche compulsive d'aliments et de drogues entraînant une dépendance, ce qui nous ramène au problème de l'analyse des contributions aux comportements de motivation recherchant la récompense et renforcement (1).
En grande partie, les preuves suggérant un fondement commun de l'obésité et de la dépendance sont des preuves impliquant la dopamine cérébrale dans les effets de la dépendance à l'alimentation de la nourriture (2) et des drogues addictives (3). Alors que le système dopaminergique est activé par la nourriture (4) et par la plupart des drogues addictives (5), il reste à déterminer si le rôle de la dopamine est principalement de jouer un rôle dans le renforcement des effets des aliments et des drogues ou dans la motivation de les obtenir (voir6-8) En termes familiers, la dopamine est-elle plus essentielle pour «aimer» une récompense ou «vouloir» de la récompense (9)? Un ensemble de preuves pertinentes qui n’a pas été largement pris en compte ces dernières années est la preuve d’un phénomène appelé «paradoxe pulsion-récompense». Je décris ici le paradoxe et le relie à la preuve que la dopamine a des rôles communs dans la recherche compulsive d’aliments et la toxicomanie. chercher et à la question de savoir lequel des rôles - motivation ou renforcement - dépend du système dopaminergique.
Stimulation électrique hypothalamique latérale
Chez les 1950, l’hypothalamus latéral a été qualifié de centre du plaisir par certains (10) et un centre de la faim par d’autres (11). La stimulation électrique de cette région était enrichissante; En quelques minutes à peine, une telle stimulation pourrait créer un effet de levier compulsif à des vitesses atteignant plusieurs milliers de réponses par heure (12). L’expérience de cette stimulation a également permis d’établir une motivation conditionnée pour s’approcher du levier, et cette motivation pourrait être suffisante pour surmonter le choc douloureux des pieds (12). Ainsi, cette stimulation a servi de renforcement inconditionnel, «enracinant» les habitudes de réponse ainsi que les associations de stimulus qui ont établi le levier de réponse en tant que stimulus d’incitation conditionné suscitant approche et manipulation. Dès les premières études, il a été déduit que les rats aimaient la stimulation et que cela leur donnait envie de plus (10) Des études sur la stimulation chez des patients humains ont confirmé que cette stimulation était agréable (13).
La stimulation de cette région pourrait également motiver le comportement. Les premiers travaux de Hess avaient révélé que la stimulation électrique du cerveau pouvait induire une alimentation compulsive, appelée «boulimie» (14). Suite à la découverte de la récompense de stimulation cérébrale (15), il a rapidement été découvert qu'une stimulation de l'hypothalamus latéral pouvait induire une telle alimentation ainsi qu'une récompense (16). En effet, la stimulation sur les sites de récompense peut induire une variété de comportements biologiquement primitifs typiques de l'espèce, tels que manger, boire, des attaques prédatrices et la copulation (17). À bien des égards, les effets de la stimulation sont similaires à ceux des états d’entraînement naturels (18), et on sait que les effets de la stimulation et de la privation de nourriture se résument ((19). C’était là le paradoxe de la récompense en voiture (20) pourquoi un rat devrait-il appuyer sur un levier pour induire un état comme la faim?
Fibre de passage du faisceau cérébral antérieur
Historiquement, la première question soulevée par le paradoxe lecteur-récompense était de savoir si des substrats hypothalamiques latéraux identiques ou différents sont impliqués dans les deux effets de la stimulation. Ce n’était pas une possibilité facile à exclure car la stimulation électrique active différents systèmes de neurotransmetteurs plutôt indifféremment. La zone efficace de stimulation est peut-être d’un millimètre de diamètre (21, 22) et dans cette zone, la stimulation a tendance à activer les fibres qui entourent la pointe de l'électrode. Cependant, les fibres de taille et de myélinisation différentes ont des caractéristiques d'excitabilité différentes et les paramètres de stimulation utilisés pour les deux comportements étaient quelque peu différents (23, 24). Alors que c’était initialement le noyau de l’hypothalamus latéral qui était supposé être la principale source de faim et de récompense, les fibres de passage ont des seuils d’activation beaucoup plus bas que ceux des corps cellulaires et le noyau de l’hypothalamus latéral est traversé Système de fibres 50 comprenant le faisceau médial du cerveau antérieur (25, 26). L'origine, la cible immédiate et le neurotransmetteur de la voie (ou des voies) directement activée (s) pour la récompense de la stimulation cérébrale et l'alimentation induite par la stimulation restent non identifiés, mais les fibres de passage sont clairement impliquées et plusieurs de leurs caractéristiques ont été déterminées. Les substrats de l’entraînement et les effets gratifiants de la stimulation hypothalamique latérale ont des caractéristiques très similaires.
Premièrement, la cartographie anatomique a révélé que le substrat hypothalamique latéral pour la récompense de la stimulation cérébrale et pour l’alimentation induite par la stimulation avait des limites médio-latérale et dorso-ventrale très similaires et était homogène à l’intérieur de ces limites (27, 28). De plus, alors que seule la partie hypothalamique latérale du faisceau cérébral antérieur médial était initialement identifiée avec alimentation et récompense, la stimulation de projections plus caudales du faisceau, dans la région tegmentale ventrale, peut également être enrichissante (29-31) et induire l'alimentation (32-34). Dans la région tegmentale ventrale, les limites des sites de stimulation efficaces correspondent étroitement aux limites des groupes de cellules dopaminergiques qui forment les systèmes dopaminergiques mésocorticolimbique et nigrostriatal (30). La stimulation du pédoncule cérébelleux (une branche encore plus caudale du faisceau cérébral antérieur) peut également soutenir l’auto-stimulation et l’alimentation (35, 36). Ainsi, si des substrats séparés médient les deux comportements, ces substrats ont des trajectoires anatomiques remarquablement similaires et peut-être des sous-composants similaires.
Bien qu’elles ne permettent pas la différenciation du contenu des neurotransmetteurs, les méthodes psychophysiques - évaluant les effets comportementaux de variations systématiques de l’entrée de stimulation - permettent un degré significatif de différenciation entre les caractéristiques axonales. Les méthodes ne sont pas largement discutées dans les littératures de dépendance ou d'alimentation.
Premièrement, la stimulation par impulsions appariées a été utilisée pour estimer les périodes réfractaires et les vitesses de conduction des fibres du "premier stade" (les populations de fibres pertinentes pour la récompense et l'alimentation qui sont directement activées par le courant appliqué à la pointe de l'électrode ). La méthode d'estimation des périodes réfractaires, c'est-à-dire le temps nécessaire pour que la membrane neuronale se recharge après la dépolarisation d'un potentiel d'action, est basée sur la méthode utilisée par les électrophysiologistes qui étudient des neurones isolés. Bien que certaines subtilités soient à considérer dans la pratique, la méthode est en principe très simple. Lors de l'étude de neurones individuels, il suffit de stimuler le neurone deux fois, en faisant varier l'intervalle entre les première et seconde stimulations afin de trouver l'intervalle minimal permettant à la cellule de répondre à la seconde stimulation. Si la seconde stimulation suit la première trop rapidement, le neurone ne se sera pas remis des effets de la première à temps pour répondre à la seconde. Si la seconde impulsion arrive suffisamment tard, le neurone sera suffisamment remis du tir provoqué par la première impulsion pour reprendre son cours en réponse à la seconde. L'intervalle minimal entre impulsions pour obtenir des réponses aux deux impulsions définit la «période réfractaire» de l'axone stimulé.
Pour obtenir des réponses comportementales à des niveaux modérés de stimulation électrique, il faut plus que de la fibre et plus d'une impulsion de stimulation. des niveaux plus élevés de stimulation sont donnés pour atteindre de nombreuses fibres autour de l'électrode, et des «trains» d'impulsions de stimulation répétées sont nécessaires pour les activer plusieurs fois. Dans les études d'auto-stimulation, les trains de stimulation de 0.5 secondes sont traditionnellement donnés; dans les études d’alimentation induites par stimulation, des trains de stimulation de 20 ou 30 secondes sont donnés. Chaque impulsion dans un train ne dure généralement que 0.1 msec: suffisamment longtemps pour activer les neurones proches une fois, mais pas assez pour qu'ils puissent récupérer et tirer une seconde fois pendant la même impulsion. Les impulsions sont généralement données à des fréquences de 25 – 100 Hz, de sorte que même dans un train de stimulation d'une demi-seconde, il existe des dizaines d'impulsions répétées. Un simple train d'impulsions de stimulation est schématisé dans Figure 1A.
Pour déterminer les périodes réfractaires des neurones du premier étage, des trains de apparié légumineuses (Fig. 1B) plutôt que par trains d'impulsions uniques (Fig. 1A), sont donnés. La première impulsion de chaque paire est appelée impulsion «C» ou «conditionnement»; la deuxième impulsion de chaque paire est appelée impulsion «T» ou «test» (Fig. 1C). Si les impulsions T sont suivies de trop près par leurs impulsions T respectives, les impulsions T seront inefficaces et l'animal réagira comme s'il ne recevait que les impulsions C. Si l'intervalle entre les impulsions C et T est suffisamment allongé, l'impulsion T deviendra efficace et l'animal, recevant plus de récompense, répondra plus vigoureusement. Étant donné que la population de neurones de premier stade présente une gamme de périodes réfractaires, les réponses comportementales à la stimulation commencent lorsque l'intervalle CT atteint la période réfractaire des fibres pertinentes les plus rapides et s'améliorent à mesure que les intervalles CT sont étendus jusqu'à dépasser la période réfractaire. fibres les plus lentes (Fig. 1D). Ainsi, la méthode nous donne les caractéristiques de période réfractaire de la population ou des populations de neurones de premier stade pour le comportement en question.
Comme le montrent ces méthodes, les périodes réfractaires absolues pour les fibres médiatrices de la stimulation de la stimulation cérébrale hypothalamique latérale vont d’environ 0.4 à environ 1.2 msec (37-40). Les périodes réfractaires absolues pour l’alimentation induite par stimulation se situent également dans cette plage (38, 40). Non seulement les plages de périodes réfractaires des deux populations sont similaires; Les deux distributions ont une anomalie similaire: dans chaque cas, elles ne montrent aucune amélioration comportementale lorsque les intervalles de CT sont augmentés entre 0.6 et 0.7 msec (39, 40). Ceci suggère qu’il existe deux sous-populations de fibres contribuant à la chacun Comportement: une petite sous-population de fibres très rapides (périodes réfractaires allant de 0.4 à 0.6 msec) et une sous-population plus importante de fibres plus lentes (périodes réfractaires allant de 0.7 à 1.2 msec ou peut-être un peu plus longtemps). Il est difficile d’imaginer que différentes populations transmettent les effets de stimulation stimulants et stimulants de la stimulation lorsque les profils de période réfractaire sont si semblables, chacun présentant une discontinuité entre 0.6 et 0.7 msec.
Une preuve supplémentaire de l'existence d'un substrat commun pour les effets d'entraînement et de récompense de la stimulation est que la stimulation à des sites situés ailleurs le long du faisceau cérébral antérieur peut également induire à la fois une alimentation (32-34, 40, 41) et récompense (29, 42-44). Les distributions de période réfractaire pour la récompense et l’alimentation induite par stimulation sont les mêmes, que les électrodes stimulantes soient au niveau du tegmental ventral ou du niveau hypothalamique latéral du faisceau médial du cerveau antérieur (40). Ceci suggère fortement que les deux mêmes sous-populations de fibres de passage sont responsables des deux comportements.
En outre, une fois que la trajectoire des fibres médiatisant un effet de stimulation a été partiellement identifiée, les vitesses de conduction des fibres du premier étage pour les deux comportements peuvent être déterminées et comparées (43). La méthode d’estimation des vitesses de conduction est semblable à celle utilisée pour estimer les périodes réfractaires, mais dans ce cas, les impulsions C sont délivrées sur un site de stimulation le long du trajet de la fibre (par exemple, l’hypothalamus latéral) et les impulsions T sont délivrées sur un autre. (par exemple, la région tegmentale ventrale). Cela nécessite des électrodes stimulantes alignées pour dépolariser les mêmes axones en deux points de leur longueur (45). Lorsqu'une paire d'électrodes s'avère alignée de manière optimale le long des fibres pour obtenir une récompense, elles s'avèrent également être alignées de manière optimale le long des fibres pour une alimentation induite par stimulation (33). Ici, lorsque des impulsions appariées sont données, un intervalle plus long entre les impulsions C et les impulsions T doit être autorisé avant que les impulsions T ne soient efficaces. En effet, outre le temps nécessaire pour récupérer de la réfractarité, il faut prévoir du temps pour la conduction du potentiel d’action d’un bout d’électrode à l’autre (43, 45). En soustrayant la période réfractaire (déterminée par stimulation d'électrode unique) de l'intervalle CT critique pour les impulsions données aux différentes électrodes, nous pouvons estimer la plage des temps de conduction et en déduire la plage des vitesses de conduction pour la population de fibres de premier stade. Des études utilisant cette méthode ont montré que les fibres pour la récompense induite par stimulation ont des vitesses de conduction identiques ou très similaires à celles des fibres pour une alimentation induite par stimulation (33). Ainsi, le paradoxe lecteur-récompense ne se résout pas facilement sur la base des limites, des périodes réfractaires, des vitesses de conduction ou du chemin de conduction des substrats pour les effets de stimulation et d’incitation de la stimulation électrique hypothalamique latérale; au contraire, il semble que le mécanisme des effets d'entraînement déclenchés par la stimulation du faisceau cérébral antérieur médial soit identique ou remarquablement similaire au mécanisme des effets de renforcement de la stimulation.
Les preuves pharmacologiques suggèrent en outre un substrat commun pour la récompense de la stimulation cérébrale et l'alimentation induite par la stimulation; ces preuves suggèrent l'implication commune de neurones dopaminergiques, neurones qui n'ont pas la caractéristique de période réfractaire et de vitesse de conduction des fibres du premier étage du faisceau cérébral antérieur médial, mais sont vraisemblablement des fibres du deuxième ou du troisième étage en aval des fibres directement activées. Tout d’abord, l’alimentation induite par la stimulation et la récompense de la stimulation cérébrale hypothalamique latérale sont atténuées par des antagonistes de la dopamine (46-51). En outre, chacune est facilitée par des injections vegmentales ventrales de morphine (52, 53) et les agonistes des opioïdes mu et delta (54, 55) activant le système dopaminergique (56). De même, le delta-9 tetrahydrocannabinol (57-59). Bien que l’amphétamine soit un médicament anorexigène, elle potentialise même certains aspects de l’alimentation induite par la stimulation (60) ainsi que la récompense de stimulation cérébrale (61), en particulier lorsqu’il est microinjecté dans le noyau accumbens (62, 63).
Interactions avec le système dopaminergique
Comment les fibres du premier stade de la récompense de stimulation cérébrale interagissent-elles avec le système dopaminergique? Une autre étude sur la stimulation à deux électrodes suggère que les fibres du premier stade se projettent de manière caudale d'un point rostral à la zone hypothalamique latérale, en direction ou à travers la zone tegmentale ventrale d'où provient le système dopaminergique. La stimulation est à nouveau appliquée en utilisant deux électrodes alignées pour influencer les mêmes fibres en différents points de leur longueur, mais dans ce cas, l'une des électrodes est utilisée comme cathode (injection de cations positifs) pour dépolariser localement les axones à la pointe de l'électrode et l'autre utilisé comme anode (collecte des cations) pour hyperpolariser les mêmes axones en un point différent de leur longueur. Puisque l'impulsion nerveuse implique le mouvement vers le bas de l'axone d'une zone de dépolarisation phasique, l'impulsion échoue si elle entre dans une zone d'hyperpolarisation. Lorsque la stimulation anodale bloque les effets comportementaux de la stimulation cathodique, cela signifie que l'anode se situe entre la cathode et le terminal nerveux. En commutant la stimulation cathodique et le blocage anodal entre les deux sites d'électrodes et en déterminant quelle configuration est efficace sur le plan comportemental, nous pouvons déterminer le sens de conduction des fibres de premier stade. Ce test indique que la majeure partie des fibres stimulées transmettent des messages de récompense dans la direction rostrale-caudale, en direction de la région tegmentale ventrale (64). Bien que l’origine ou les origines du système restent à déterminer, une hypothèse est que les fibres descendantes du premier stade se terminent dans la région tegmentale ventrale en se synchronisant sur les cellules dopaminergiques (65) une autre hypothèse est que les fibres du premier stade passent à travers la région tegmentale ventrale et se terminent dans le noyau tegmental de la pédonculopopine, qui retourne aux cellules dopaminergiques (66). De toute façon, de nombreuses preuves suggèrent que les mêmes sous-populations ou des sous-populations très similaires de fibres du faisceau cérébral antérieur médial (67) portent à la fois les effets gratifiants et inducteurs d’entraînement de la stimulation hypothalamique latérale caudale vers la région tégmentale ventrale et que les neurones dopaminergiques de la région tégmentale ventrale constituent un lien essentiel dans la voie commune finale des deux effets de stimulation.
Drogue et alimentation induites par la drogue
Le paradoxe lecteur-récompense n’est pas propre aux études sur le comportement induit par la stimulation électrique; un autre exemple concerne le comportement induit par les microinjections de médicaments. Par exemple, les rats pressent le levier ou piquent le nez pour administrer des microinjections de morphine (68, 69), ou l’endomorphine mu opioïde endogène (70) dans l'aire tegmentale ventrale; ils apprennent également à s’auto-administrer les opioïdes sélectifs DAMGO et DPDPE, mu et delta, dans cette région du cerveau (71). Les opioïdes mu et delta sont gratifiants proportionnellement à leur capacité à activer le système dopaminergique; Les opioïdes mu sont plus de fois plus efficaces que les opioïdes delta par rapport à 100 dans l'activation du système dopaminergique (56) et, de la même manière, sont plus efficaces que 100 (comme récompense) (71). Ainsi, les opioïdes mu et delta ont des actions enrichissantes attribuées à l'activation (ou, plus vraisemblablement, à la désinhibition [72]) des origines du système dopaminergique mésocorticolimbique. Les injections directes d’opioïdes dans la région tegmentale ventrale stimulent également l’alimentation des rats rassasiés et l’améliorent chez ceux qui ont faim. L’alimentation est induite par des injections tegmentales ventrales de morphine (73-75) ou des opioïdes mu ou delta (76, 77). Comme dans le cas de leurs effets bénéfiques, l'opioïde mu DAMGO est 100 ou plus de fois plus efficace que l'opioïde delta DPDPD pour stimuler l'alimentation (77). Ainsi, encore une fois, récompense et alimentation peuvent être stimulées en manipulant un site cérébral commun, en utilisant, dans ce cas, des médicaments beaucoup plus sélectifs que la stimulation électrique pour activer des éléments neuronaux spécifiques.
Un autre exemple concerne les agonistes du neurotransmetteur GABA. Microinjections de GABA ou du GABAA muscimol agoniste dans la partie caudale mais pas dans la partie rostrale de la région du tegmental ventral induisent une alimentation chez les animaux endoloris (78). De même, les injections de muscimol dans la région caudale, mais pas dans la région tegmentale ventrale rostrale sont enrichissantes (79) GABAA antagonistes sont également enrichissants (80) et provoquer une élévation de la dopamine du noyau accumbens (81) dans ce cas, le site d’injection effectif est le rostral et le pas caudal zone tegmentale ventrale, suggérant des systèmes GABAergiques rostraux et caudaux opposés. L'alimentation n'a pas encore été étudiée avec des antagonistes du GABA-A dans ces régions.
Enfin, les cannabinoïdes systémiques (82) et des cannabinoïdes micro-injectés dans la région tégmentale ventrale (83) sont en train de se renforcer et que les cannabinoïdes systémiques potentialisent également l'alimentation induite par la stimulation électrique hypothalamique latérale (84). Encore une fois, nous trouvons des injections qui sont à la fois gratifiantes et motivantes pour l’alimentation. Là encore, le système dopaminergique mésocorticolimbique est impliqué; dans ce cas, les cannabinoïdes sont efficaces (au moins, comme récompenses) dans la région tegmentale ventrale, où ils interagissent avec les entrées du système dopaminergique et entraînent son activation (85, 86).
Les études examinées ci-dessus impliquent un système descendant dans le faisceau cérébral antérieur médial dans le yin et le yang de la motivation: la motivation à agir par la promesse d'une récompense avant qu'elle ne soit gagnée et le renforcement des associations récentes de réponse et de stimulation par la réception opportune de récompense, une fois obtenue. Ce système fait saillie caudalement de l’hypothalamus latéral vers le système dopaminergique - vraisemblablement en synapse sur lui ou sur ses entrées - ce qui joue un rôle important (mais peut-être pas nécessaire (87, 88)), rôle dans l'expression de cette motivation (46) et ce renforcement (50).
Une hypothèse
Comment le système dopaminergique, un système impliqué dans les conséquences de la consommation de drogues entraînant une dépendance alimentaire, qui engendre une dépendance, pourrait-il être impliqué dans la motivation antécédente à obtenir ces récompenses? La possibilité la plus évidente est que différents sous-systèmes de dopamine puissent être utilisés pour ces différentes fonctions. La différenciation nominale des systèmes nigrostriatal, mésolimbique et mésocortical, ainsi que des sous-systèmes qui en font partie, suggère que les sous-systèmes puissent remplir différentes fonctions. Le système nigrostriatal est traditionnellement associé à l’initiation du mouvement, tandis que le système mésolimbique est plus traditionnellement associé à une récompense (89, 90) et de motivation (91) fonction (mais voir [92]). Le système mésocortical est également impliqué dans la fonction de récompense (93-95). Le striatum ventromédial (coquillage), ventrolatéral (noyau) et dorsal - les principaux champs terminaux de la dopamine - réagissent différemment à différents types de récompenses et de prédicteurs de récompense (96-101). Le fait qu'il existe deux classes générales de récepteurs de la dopamine (D1 et D2) et deux voies de sortie striatales (directe et indirecte) les exprimant de manière sélective suggère également que différents sous-systèmes pourraient remplir différentes fonctions. Une autre possibilité intéressante, cependant, est que les mêmes neurones dopaminergiques puissent servir les différents états en utilisant différents modèles de signalisation neuronale. La distinction la plus intéressante est peut-être la distinction entre deux états d'activité des neurones dopaminergiques: un état de stimulateur cardiaque tonique et un état d'éclatement phasique (102).
C’est l’état de rupture phasique des neurones dopaminergiques qui a la fidélité temporelle pour signaler l’arrivée de récompenses ou de prédicteurs de récompense (103). Les neurones dopaminergiques explosent avec une latence courte lorsque des récompenses ou des prédicteurs de récompense sont détectés. Étant donné que les neurones dopaminergiques ne réagissent eux-mêmes aux récompenses que lorsqu'ils sont inattendus, changeant leur réponse aux prédicteurs au fur et à mesure que la prédiction s'établit, il est devenu fréquent de voir la récompense et la prédiction de la récompense traitées comme des événements indépendants (103). Selon un autre point de vue, le prédicteur d’une récompense, par le biais du conditionnement pavlovien, devient un renforçateur conditionné et une composante conditionnée de l’événement gratifiant net (104): en effet, il devient le fer de lance de la récompense (105, 106). C’est l’effet générateur d’habitude des récompenses - qu’il s’agisse de récompenses conditionnelles ou conditionnelles (prédicteurs de récompense) - qui nécessite une distribution à faible latence, progressive, conditionnée par une réponse. Les récompenses distribuées immédiatement après une réponse sont beaucoup plus efficaces que les récompenses distribuées même une seconde plus tard. L’impact de la récompense diminue de manière hyperbolique en fonction du délai après la réponse qui le rapporte (107). L’activation phasique du système dopaminergique est connue pour être déclenchée par deux entrées excitatrices: le glutamate (108) et l’acétylcholine (109). Chacune de celles-ci participe aux effets enrichissants de la cocaïne gagnée: les contributions glutamatergique et cholinergique au système de dopamine sont chacune déclenchées par l'espoir d'une récompense de la cocaïne, et chacune de ces entrées ajoute aux effets positifs de la cocaïne elle-même (110, 111).
D'autre part, ce sont les changements lents dans les neurones à dopamine déclenchés par le stimulateur cardiaque et les changements dans la concentration extracellulaire de dopamine qui les accompagnent et qui sont plus susceptibles d'être associés aux changements d'état de motivation qui accompagnent les fringales de nourriture ou de drogues. Contrairement au renforcement, les états de motivation ne dépendent pas du timing de la latence courte et du temps de réponse. Les états de motivation peuvent se développer progressivement et être maintenus pendant de longues périodes. Ces caractéristiques temporelles sont le plus susceptibles de refléter des changements lents du rythme de déclenchement des neurones dopaminergiques par le stimulateur cardiaque et des changements lents des niveaux de dopamine extracellulaire. Les effets motivationnels de l’élévation des niveaux de dopamine (112) sont peut-être mieux illustrés par le paradigme de la réintégration de la réponse de l'auto-administration d'aliments et de médicaments (113), lorsque les animaux qui ont subi une formation d'extinction peuvent être provoqués par un léger stress dû au choc des pieds, par un apprêt alimentaire ou médicamenteux, ou par des signaux sensoriels liés à l'alimentation ou à la drogue afin de renouveler la recherche de nourriture ou de drogue. Chacune de ces provocations - stress de choc de pied (114), aliments (115) ou un médicament (116) amorçage et nourriture (97) ou drogue- (110, 111, 116) indices liés: élève les niveaux de dopamine extracellulaire pendant des minutes ou des dizaines de minutes. Ainsi, les changements dans le déclenchement des neurones dopaminergiques par le stimulateur cardiaque sont le corrélat probable de la motivation à initier des réponses apprises pour des aliments ou des drogues provoquant une dépendance.
Bien que les explications du paradoxe pulsion-récompense restent non confirmées, les études décrites ci-dessus suggèrent fortement que les fonctions pulsion et récompense sont médiées par un système commun de fibres médianes du cerveau antérieur descendantes qui activent, directement ou indirectement, les systèmes de dopamine du cerveau moyen. L’hypothèse la plus simple est que la dopamine remplit une fonction générale d’éveil qui est essentielle à la fois pour l’entraînement et pour le renforcement. Ceci est cohérent avec le fait que la dopamine extracellulaire est essentielle à tous les comportements, comme le confirme l’akinésie des animaux présentant une déplétion quasi-totale de la dopamine (117). Les augmentations toniques indépendantes de la réponse des niveaux de dopamine extracellulaire (associées à une augmentation du nombre de tirs toniques du système dopaminergique) entraînent une augmentation de l'activité locomotrice générale, peut-être simplement en augmentant la saillance des stimuli nouveaux et conditionnés qui déclenchent des réponses d'investigation et des réponses instrumentales apprises de Pavlovian (118-120). De ce point de vue, les augmentations des taux de dopamine tonique induites par des stimuli prédictifs alimentaires ou médicamenteux sont le corrélat fréquent des envies subjectives ou «manques». Les augmentations, en fonction des réponses, des taux de dopamine momentanés associées au déclenchement phasique du système dopaminergique dans le stimulus et des associations de réponse, probablement en renforçant la consolidation de la trace encore active qui médie la mémoire à court terme de ces associations (121, 122). Bien que ce point de vue soit fondé sur le fait que les fluctuations extracellulaires de la dopamine induisent à la fois des effets d'entraînement et de renforcement, il soutient que les effets de renforcement sont primaires; ce n'est qu'après que la vue de la nourriture ou un levier de réaction a été associé aux effets renforçants de cet aliment ou d'une drogue provoquant une dépendance que la nourriture ou le levier devient un stimulus de motivation incitatif qui peut lui-même stimuler l'appétit et susciter une approche. L'argument avancé ici est que ce sont les effets de renforcement d'un aliment ou d'un médicament en particulier qui établissent les envies actuelles pour cet aliment ou ce médicament.
Commentaires de clôture
Il ne suffit pas que la surconsommation d'aliments riches en énergie devienne compulsive et se maintienne face aux conséquences négatives, ce qui suggère que la suralimentation revêt les propriétés de la dépendance. Il est difficile d'imaginer comment la sélection naturelle aurait pu créer un mécanisme distinct pour la dépendance lorsque des sources enrichies de drogues et la capacité de les fumer ou de les injecter à forte concentration sont des événements relativement récents dans notre histoire évolutive. La recherche de drogues et la recherche de nourriture nécessitent les mêmes mouvements coordonnés et leurs mécanismes partagent donc un chemin commun final. Ils sont chacun associés à des envies subjectives et sont sujets à une satiété momentanée. Chacun implique des circuits du cerveau antérieur qui contribuent de manière importante à la motivation et au renforcement, des circuits fortement impliqués dans l'établissement d'habitudes instrumentales compulsives (12, 123-125). Bien que les études sur la toxicomanie suscitent beaucoup d’intérêt pour ce que nous pouvons apprendre sur l’obésité (126), il sera également intéressant de voir ce que nous pouvons apprendre sur la dépendance grâce aux études sur l'obésité et la consommation alimentaire. Par exemple, les neurones hypothalamiques d’oreexine / hypocrétine ont des rôles suggérés dans l’alimentation (127) et récompense (128) et il est connu que la stimulation cérébrale récompense (129), comme récompense alimentaire (130) peut être modulé par la leptine, l'hormone périphérique de la satiété. Nouvelles méthodes optogénétiques (131) permettent une activation beaucoup plus sélective des circuits de motivation que ne le fait la stimulation électrique, et on espère que ces méthodes pourront faire progresser notre compréhension de la consommation compulsive de drogue et de la surconsommation compulsive et résoudre le paradoxe pulsion-récompense.
Remerciements
La préparation de ce manuscrit a été financée sous forme de salaire par le Programme de recherche intra-muros, Institut national de lutte contre l'abus des drogues, Instituts nationaux de la santé.
Notes
Informations financières
L'auteur ne signale aucun intérêt financier biomédical ou conflit d'intérêts potentiel.
Avis de non-responsabilité de l'éditeur: Ceci est un fichier PDF d’un manuscrit non édité qui a été accepté pour publication. En tant que service à nos clients, nous fournissons cette première version du manuscrit. Le manuscrit subira une révision, une composition et une révision de la preuve résultante avant sa publication dans sa forme définitive. Veuillez noter que des erreurs pouvant affecter le contenu peuvent être découvertes au cours du processus de production, de même que tous les dénis de responsabilité qui s'appliquent à la revue.
Bibliographie