Suffisance de la stimulation des neurones dopaminergiques mésolimbiques pour la progression vers la toxicomanie (2015)

 

Vincent Pascoli3,Jean Terrier3,Agnès Hiver

,Christian Lüscher'Informations sur la correspondance de l'auteur Christian Lüscherhttp://www.cell.com/templates/jsp/_style2/_marlin/images/icon_email.pngEnvoyer un email à l'auteur Christian Lüscher

DOI: http://dx.doi.org/10.1016/j.neuron.2015.10.017

Avantages

• L'autostimulation par les neurones dopaminergiques évoque la plasticité synaptique dans le cancer nerveux autonome, entraînant une rechute

• La dopamine est suffisante pour déclencher une prise compulsive

• Les neurones du cortex orbitofrontal sont hyperexcitables chez les souris résistantes au châtiment

• L'inhibition chimiogénétique de l'OFC réduit l'auto-stimulation compulsive

Résumé

Les facteurs à l'origine du passage de la consommation de drogues récréatives à la toxicomanie restent largement inconnus. Il n'a pas été testé si la dopamine (DA) est suffisante pour déclencher ce processus. Ici, nous utilisons l'auto-stimulation optogénétique des neurones DA de la zone tegmentale ventrale (VTA) pour imiter de manière sélective le caractère commun définissant des drogues addictives. Toutes les souris ont facilement acquis une auto-stimulation. Après des semaines d'abstinence, une rechute induite par le signal a été observée en parallèle avec une potentialisation des afférents excitateurs sur les neurones exprimant le récepteur D1 du noyau accumbens (NAc). Lorsque les souris ont dû subir un léger choc électrique au pied pour obtenir une stimulation, certaines se sont arrêtées tandis que d'autres ont persévéré. La résistance à la punition était associée à une activité neuronale accrue dans le cortex orbitofrontal (OFC) tandis que l'inhibition chimiogénétique de l'OFC réduisait la compulsivité. Ensemble, ces résultats montrent que la stimulation des neurones VTA DA induit des caractéristiques comportementales et cellulaires de la dépendance, indiquant une suffisance pour l'induction et la progression de la maladie.

Introduction

La toxicomanie est une maladie qui évolue en plusieurs étapes (Everitt et al., 2008, George et al., 2014). Le diagnostic est posé lorsque l'usage récréatif devient compulsif, persistant malgré les conséquences négatives. Alors qu'une hypothèse de premier plan sur la toxicomanie postule que les drogues abusives causent la maladie parce qu'elles augmentent excessivement la concentration de dopamine (DA) dans le cerveau, on ne sait pas si le déclenchement de ce système est suffisant pour conduire les transitions de l'utilisation récréative à la dépendance (Di Chiara et Bassareo, 2007, Volkow et Morales, 2015). Les preuves à l'appui de l'hypothèse de l'AD pour le renforcement des médicaments se sont accumulées au cours de plusieurs décennies et reposent sur l'effet initial des médicaments. Par exemple, les drogues addictives réduisent le seuil d'auto-stimulation intracrânienne (ICSS) du faisceau médial du cerveau antérieur, un tractus fibreux contenant, entre autres, une projection de DA ascendante du mésencéphale (Stein, 1964, Crow, 1970, Kornetsky et al., 1979). Des études de pharmacologie et de lésion ont ensuite identifié le système DA mésocorticolimbique comme l'origine de ce circuit (Wise et Bozarth, 1982). À la fin des années 1980, une mesure directe de la concentration de DA extracellulaire avec microdialyse a confirmé que les drogues addictives partageaient la propriété d'évoquer une poussée de DA dans la NAc (Di Chiara et Imperato, 1988). Cela a conduit à la proposition d'une classification mécaniste des drogues addictives (Lüscher et Ungless, 2006).

On en sait beaucoup moins sur la manière dont ces effets initiaux de la consommation de drogues facilitent la transition vers la toxicomanie. Des mécanismes indépendants de l'AD ont été envisagés car les drogues addictives ont d'autres cibles pharmacologiques. Par exemple, la cocaïne, en plus d'inhiber le transporteur DA (DAT), se lie également au SERT (transporteur de la sérotonine) et au NET (transporteur de la noradrénaline) pour diminuer respectivement la recapture de la sérotonine et de la noradrénaline, augmentant ainsi la concentration de toutes les principales monoamines (Han et Gu, 2006, Tassin, 2008). Des préoccupations similaires peuvent s'appliquer à d'autres psychostimulants. En outre, il y a une affirmation selon laquelle les opiacés sont, au moins dans la phase initiale, indépendants de l'AD (Badiani et al., 2011, Ting-A-Kee et van der Kooy, 2012). L'hypothèse DA a également été contestée sur la base de modèles génétiques de souris, où, après interférence avec le système DA, certaines formes de comportement adaptatif aux médicaments étaient encore apparentes. Par exemple, des souris knock-out DAT s'auto-administrent de la cocaïne (Rocha et al., 1998) et l'abolition de la synthèse de DA soit pharmacologiquement (Pettit et al., 1984) soit génétiquement (Hnasko et al., 2007) n'a pas réussi à empêcher l'auto-administration de médicaments. ou préférence de lieu conditionné. Bien qu'une meilleure caractérisation de ces souris transgéniques et la génération de knock-out de transporteurs de double monoamine aient résolu certains de ces problèmes (Rocha, 2003, Thomsen et al., 2009), la suffisance de DA pour déclencher les caractéristiques cardinales de la dépendance est inconnue. Pour contourner les problèmes de non-spécificité, nous avons donc décidé de permettre aux souris d'auto-stimuler les neurones VTA DA en utilisant une approche optogénétique.

Des études récentes ont montré que l'activation des neurones DA dans le mésencéphale peut induire une préférence de place (Tsai et al., 2009) ou renforcer le comportement instrumental (Adamantidis et al., 2011, Witten et al., 2011, Kim et al., 2012, Rossi et al., 2013, McDevitt et al., 2014, Ilango et al., 2014). Si cette activation sélective des voies de l'AD confirme les études d'auto-stimulation intracrânienne (ICSS) menées il y a plus de 30 ans pour délimiter le système de récompense (Fouriezos et al., 1978), elles échouent à démontrer l'induction d'un comportement adaptatif de stade avancé qui définit la dépendance, et ils n'ont pas non plus identifié les adaptations neuronales sous-jacentes. Ici, nous avons utilisé la manipulation optogénétique non seulement pour permettre le test direct du critère de suffisance pour la signalisation DA phasique dans l'initiation du renforcement, mais aussi pour tester la transition vers la dépendance.

Une observation frappante des derniers stades de la maladie est que même avec les drogues les plus addictives, seule une fraction des utilisateurs devient dépendante (Warner et al., 1995, O'Brien, 1997). Les toxicomanes humains continueront à consommer de la drogue malgré les conséquences négatives (voir «Definition of Addiction» de l'American Society for Addiction Medicine, DSM5, American Psychiatric Association, 2013), généralement liées à des défaites sociales et psychologiques souvent retardées. De même, chez les rongeurs, environ un animal sur cinq qui acquiert une auto-administration de cocaïne est finalement classé comme toxicomane (Deroche-Gamonet et al., 2004, Kasanetz et al., 2010; mais voir George et al., 2014). La persévérance de la consommation de médicaments malgré les conséquences négatives peut également être modélisée chez les rongeurs en introduisant un simple stimulus aversif dans le programme de consommation. Alors que la maladie humaine est plus complexe, l'association de la punition à la consommation est un modèle simple d'une composante essentielle de la dépendance.

Ici, nous avons utilisé un choc au pied léger pour évaluer ses conséquences sur l'auto-administration de cocaïne, de saccharose et l'auto-stimulation optogénétique. Nous étudions en outre si l'auto-stimulation neuronale DA peut induire deux comportements liés à une dépendance - la recherche de récompense associée à un indice et la compulsivité associée à la consommation malgré des conséquences négatives - et caractérise la plasticité neuronale associée à ces comportements.

Résultats

Acquisition de l'autostimulation VTA DA Neuron

 

Pour contrôler l'activité des neurones DA, nous avons injecté un virus adéno-associé (AAV) induit par Cre avec un cadre de lecture ouvert inversé à double flox (DIO) contenant ChR2 fusionné à une protéine fluorescente jaune améliorée (eYFP) (Atasoy et al., 2008, Brown et al., 2010) dans la VTA de souris DAT-Cre. De plus, une fibre optique a été placée pour cibler le VTA (ChR2, Voir Procédures expérimentales). Spécificité du ChR2 L’expression a été confirmée par la co-localisation de eYFP avec la Tyrosine Hydroxylase (TH), une enzyme nécessaire à la synthèse de DA (Figure 1UNE). 

Tout d'abord, pour établir le protocole de stimulation laser, les souris ont été placées dans une boîte opérante où elles pouvaient appuyer sur un levier actif, ce qui déclenchait un certain nombre de stimulations laser variées (1, 2, 8, 32, 60 ou 120 rafales) chaque deux séances. Pour émuler le schéma de tir phasique (Hyland et al., 2002, Mameli-Engvall et al., 2006, Zhang et al., 2009) typiquement induit par une récompense naturelle (Schultz, 1998), nous avons utilisé une stimulation en rafale. Une salve consistait en cinq impulsions laser de 4 ms, à 20 Hz, et était répétée deux fois par seconde. Nous avons constaté que les souris adaptaient leur comportement de pression du levier en fonction des rafales par stimulation laser, contrôlant ainsi le nombre total de rafales reçues (Figure 1B). Ce comportement rappelait l'auto-administration de drogues addictives, lorsque la dose par perfusion était variée (Piazza et al., 2000). Pour les expériences suivantes, nous avons choisi d'administrer 30 rafales par presse à levier, ce qui donne un nombre semi-maximal de rafales (Figure 1B). Pour imiter le retard de l'augmentation de la DA généralement observé lorsque les médicaments sont administrés par voie intraveineuse (Aragona et al., 2008), nous avons retardé la stimulation laser de 5 s et ajouté une lumière de signal clignotante pendant 10 s (Figure 1C).

Pendant 12 jours consécutifs, les souris ont été autorisées à s'auto-stimuler un maximum de 80 fois en 2 heures. Les souris ont rapidement augmenté le taux de stimulation laser, atteignant 80 stimulations laser (LS) avant la fin de la première heure d'une session (Chiffres 1D et 1E). La distinction entre le levier actif et le levier inactif a été rapidement acquise et le nombre de presses à levier actives a augmenté proportionnellement avec les programmes à rapport fixe croissant (FR1, 2, 3) (Chiffres 1F et 1G). Dans des expériences de contrôle utilisant des souris DAT-Cre- ou des souris exprimant ChR2 dans des neurones à acide γ-aminobutyrique (GABA) (souris GAD-Cre +, afin de cibler les neurones inhibiteurs de la VTA), les taux d'auto-stimulation étaient faibles et continuellement réduits. sessions. Cela s'appliquait également à deux animaux Cre + pour lesquels une validation post-hoc a montré que la VTA n'était pas infectée par ChR2-eYFP (non représenté). De plus, aucune discrimination entre les leviers actif et inactif n’a été détectée (Figures S1A et S1B).

Nous avons observé que les souris DAT-Cre + appuyaient plus souvent sur le levier actif que nécessaire pour la stimulation laser. En fait, ces presses à levier actives «futiles» représentaient plus de 30% de toutes les presses à levier actives (Figure S2A) et a eu lieu - au fil des sessions - principalement entre le début du signal et celui de la stimulation laser (Figures S2B et S2C). Ce comportement singulier s'est développé pendant l'acquisition et peut refléter des réponses impulsives.

Pris ensemble, l'activité en rafale dans les neurones VTA DA renforce fortement la réponse du levier.

 

Occlusion de l'autostimulation neuronale VTA DA par la cocaïne

Pour tester si l'auto-stimulation des neurones VTA DA repose sur les mêmes circuits cérébraux que ceux ciblés par les drogues addictives pour renforcer le comportement, nous avons injecté de la cocaïne par voie intrapéritonéale (ip) immédiatement avant les séances d'auto-stimulation (accès gratuit au laser pendant 45 min, Figure 2UNE). Au départ, les animaux bien entraînés ont pressé environ 400 fois pour obtenir 85 LS en 45 minutes selon le programme FR3. Après l'injection de cocaïne, la performance a diminué de manière significative de manière dose-dépendante à environ 30 LS pour 100 presses à levier avec la dose la plus élevée (Figure 2B). Cette occlusion était la plus prononcée au cours des 30 premières minutes de la séance, reflétant la pharmacocinétique du médicament (Figure 2C) Cette expérience indique que le renforcement par auto-stimulation optogénétique et le renforcement par la cocaïne partagent les circuits neuronaux sous-jacents.

Plasticité synaptique associée à la recherche après le retrait

Pour comparer davantage l'auto-stimulation optogénétique aux drogues addictives, nous avons ensuite demandé si les souris rechuteraient à l'auto-stimulation des neurones VTA DA après plusieurs semaines de sevrage. Étant donné que la recherche de médicaments associés aux signaux est un modèle établi de rechute (Epstein et al., 2006, Soria et al., 2008, Bossert et al., 2013), nous avons replacé les souris dans la chambre opérante 30 jours après la dernière auto- session de stimulation, où la pression du levier actif a maintenant déclenché la lumière de repère sans stimulation laser (Figure 3UNE). Un comportement de recherche robuste associé à un repère, démontré par un taux élevé de presses à levier actives, n'était apparent que chez les souris présentant une expression de eYFP-ChR2 dans les neurones VTA DA (souris DAT-Cre + mais pas DAT-Cre−, Figure 3B).

Des études antérieures ont montré le lien de causalité entre la rechute associée aux signaux et la plasticité synaptique évoquée par la cocaïne dans un sous-type de neurones NAc exprimant le DA D1R (Pascoli, Terrier et al., 2014). Par conséquent, pour évaluer cette plasticité synaptique, nous avons généré des souris DAT-Cre croisées avec Drd1a-tdTomato souris pour identifier le sous-type de neurones épineux de taille moyenne (MSN) dans le NAc. Au lieu du test de recherche, des tranches de NAc ont été préparées dans lesquelles les D1R-MSN étaient rouges, contrastant avec les fibres vertes des neurones VTA DA infectés par flox-ChR2-eYFP (Figure 3C). Les enregistrements de patch-clamp de cellules entières ex vivo ont révélé une relation de tension de courant de redressement pour les courants postsynaptiques évoqués par AMPAR (AMPAR-EPSC) et un rapport AMPAR / NMDAR accru (Chiffres 3D et 3E), dans les D1R-MSN mais pas dans les D2R-MSN. Des découvertes similaires précédemment obtenues après le retrait de l'auto-administration de cocaïne se sont révélées indiquer l'insertion combinée d'AMPAR manquant de GluA2 et d'AMPAR contenant du GluA2, à des entrées séparées sur les D1R-MSN (Pascoli, Terrier et al., 2014).

 

 

 

Auto-stimulation malgré la punition

La consommation de substances malgré les conséquences négatives est une autre caractéristique déterminante cruciale de la dépendance (voir la définition du DSM5, American Psychiatric Association, 2013). Des modèles de rats ont été établis (Deroche-Gamonet et al., 2004, Pelloux et al., 2007, Pelloux et al., 2015, Chen et al., 2013) où un choc électrique introduit dans le calendrier d'auto-administration de la cocaïne supprime la cocaïne consommation chez certains animaux. Après 12 jours d'exposition initiale (acquisition), les souris ont été autorisées à avoir trois sessions supplémentaires à FR3 mais avec un seuil de session réduit (60 min ou 40 récompenses maximum). Ces trois séances ont servi de base pour les quatre séances suivantes, où chaque troisième stimulation laser était associée à un choc au pied (500 ms; 0.2 mA) prédit par un nouveau signal (Figure 4UNE). L'intensité et la durée du choc au pied ont été ajustées pour supprimer complètement le levier en appuyant sur la récompense de saccharose (voir également les données ci-dessous). Le calendrier de punition a entraîné deux réactions comportementales opposées (Figure 4B) Certaines souris ont rapidement cessé de répondre lorsque la punition a été introduite (dite «sensible»), tandis que d'autres ont continué à répondre pour obtenir le maximum de stimulations laser et peuvent être considérées comme «résistantes» à la punition. Les deux groupes d'animaux ont complètement émergé à la fin des quatre séances de punition (Figure 4C) Les «souris résistantes» conservent le nombre de stimulations laser (réduction inférieure à 20%), tandis que les «souris sensibles» diminuent l'auto-stimulation de plus de 80%. Avec ces critères, un seul animal (points gris) n'a pas pu être attribué. Cette observation démontre qu'une activité d'éclatement forcée évoquée par l'auto-stimulation des neurones VTA DA est suffisante pour induire une consommation persistante, malgré les conséquences négatives chez une fraction de souris. En tant que témoin, la nociception a été évaluée à l’aide du test du coup de la queue chez un groupe de souris indépendantes ayant présenté une résistance ou une sensibilité à la punition associée à l’autostimulation. Aucune différence dans le temps de latence pour retirer la queue immergée dans l’eau chaude entre sensible et résistant n’a été détectée (Figure S3).

Nous avons ensuite demandé, post-hoc, si une caractéristique particulière au cours de la phase d’acquisition de l’autostimulation aurait pu prédire la résistance à la sanction. Les souris sensibles et résistantes ont effectué un nombre identique d'appuis au levier actifs et inactifs au cours des sessions de base, et toutes les souris ont atteint le maximum de 80 LS (Figures S4A et S4B), dans un laps de temps similaire (Figures S4A et S4C). Même si la fraction de la futile presse à levier active n’était pas différente dans les deux sous-populations (Chiffres 4D et S4D), à la fin des séances d’acquisition, le nombre de presses à levier inutiles avant l’apparition de la stimulation laser est devenu nettement plus élevé chez les souris résistantes (Chiffres 4E et S4E). Au fur et à mesure que ce comportement se développe lors de l'acquisition, il peut contribuer, avec l'impulsivité innée (Economidou et al., 2009, Broos et al., 2012, Jentsch et al., 2014), à établir la résistance à la punition. De plus, un essai de rapport progressif a été réalisé au jour 11 pour quantifier la motivation de la stimulation optogénétique (Richardson et Roberts, 1996). Les souris résistantes ont présenté un point de rupture non statistiquement différent de celui des souris sensibles (Figure S4F).

Résistance à la punition pour la cocaïne mais pas pour le saccharose

Pour tester si le paradigme de la consommation malgré les conséquences néfastes ainsi que la pression du levier d'impulsion pouvait également prédire la consommation compulsive d'une drogue addictive, une nouvelle cohorte de souris a subi 12 jours d'auto-administration de cocaïne. Les paramètres expérimentaux pour l'acquisition d'auto-administration de cocaïne ont été fixés à un maximum de 80 perfusions de cocaïne dans les 4 heures pendant l'acquisition et à 40 perfusions dans les 2 heures au cours des trois séances de référence précédant les quatre séances de punition (Chiffres 5Un et S5UNE). De nouveau, deux groupes ont émergé après avoir associé la cocaïne récompense à des décharges électriques. En effet, 5 sur des souris 22 ont été classées comme résistantes (moins de 20% de diminution par rapport au départ), alors que 17 était qualifié de sensible (plus de 80% de diminution) et qu'un animal se situait entre (infusions 13 le jour 19) (Figure 5B) Nous avons ensuite cherché des prédicteurs comportementaux de la résistance à la peine. Entre les deux groupes, le nombre de perfusions, le taux de perfusion et le nombre de presses à levier actives ou inactives ne différaient pas (Figures S5B – S5D), et les points de rupture étaient similaires (Figure S5E). Ce qui diffère, c’est l’évolution de la répartition dans le temps des futiles appuis sur le levier actif. Au cours des quatre premières sessions, les inutilement presses à levier ont régulièrement diminué pendant les périodes d'expiration, tant chez les souris résistantes que sensibles, alors qu'à la fin de l'acquisition, seules les souris sensibles ont conservé ce comportement (Chiffres 5C et 5D et S5F). En revanche, les souris résistantes ont tendance à augmenter le nombre total de presses à levier futiles (Chiffres 5C et S5D), en particulier au cours du dernier trimestre de la période de temporisation (Figure 5RÉ). Bien que qualitativement similaire à l'observation faite auparavant avec la stimulation optogénétique des neurones DA (voir ci-dessus), le regroupement des presses futiles au début du délai d'attente n'a pas été observé avec la cocaïne, très probablement en raison de la cinétique plus lente avec laquelle le médicament augmentation des niveaux de DA. Néanmoins, des conclusions similaires pourraient être tirées de cette évolution singulière de la distribution de la presse à levier futile au cours de la courte période précédant «la détection interne de la poussée de DA». Nos observations suggèrent donc que la distribution de la presse à levier active futile prédit l'utilisation de drogues malgré les conséquences négatives.

Enfin, nous avons répété l'expérience avec des souris nourries ad libitum capables de faire pression pour obtenir une récompense de saccharose. Une fois la punition introduite, toutes les souris ont cessé de s’auto-administrer le saccharose (Figure 5E), démontrant que ce programme supprimait la prise d'une récompense naturelle non essentielle, mais permettait la détection de la prise compulsive d'une drogue provoquant une dépendance ou d'une forte stimulation des neurones DA.

Pris ensemble, ces résultats démontrent que l'auto-stimulation de la VTA DA est suffisante pour induire une compulsivité, comme le montre la résistance à la punition dans un sous-ensemble de souris (68%). De même, après la prise de cocaïne SA, certaines souris sont devenues résistantes au châtiment (23%), ce qui n’était jamais le cas après saccharose SA (Figure 5F).

 

 

 

Un corrélat cellulaire de la résistance à la peine  

Pour identifier la zone cérébrale qui peut contrôler la décision de persévérer dans l'auto-administration malgré les conséquences négatives, nous avons d'abord surveillé «l'activité neuronale» générique en comptant le nombre de neurones dans lesquels la séance de punition a déclenché l'expression du gène précoce immédiat cFos dans 15 différentes régions. Les souris ont été perfusées par voie intracardique avec du PFA 90 min après la fin de la dernière séance de punition. Les groupes témoins comprenaient des animaux naïfs, ainsi que des souris attelées à des souris sensibles ou résistantes afin de contrôler l'effet éventuellement confondant du nombre de chocs reçus.

Alors que dans la plupart des régions choisies, le nombre de neurones positifs pour cFos était le plus élevé dans les tranches de souris résistantes par rapport aux tranches de souris naïves, deux types de réponses sont apparus, parmi lesquels le cortex pré-limique (PL) et l'OFC latéral. Dans le PL, nous avons constaté une augmentation similaire des cellules positives pour cFos chez les souris résistantes et leurs témoins sous attelage, tandis que dans l’OFC, cette augmentation n’était apparente que chez les souris résistantes et non sous leur attache (Chiffres 6A et 6B). Pour quantifier cette différence, toutes les données ont d'abord été normalisées aux niveaux d'expression chez des animaux naïfs. Ensuite, nous avons calculé le rapport entre le sur-sensible résistant et le divisé par lecfos = (R / S) / (YR / YS), Figure 6B). Cette procédure a identifié le cortex cingulaire, l'OFC et le VTA comme les régions qui sont activées chez les souris résistantes mais non sensibles et où il y avait peu de différence dans les deux groupes de témoins attelés (neurones à faible cFos-positifs similaires dans attelage, en fait) . Trouver le VTA n'est pas surprenant, car il s'agit de la région des neurones stimulés par laser. Ceci est conforme à un rapport précédent montrant que la stimulation ChR2 déclenche l'activation du cFos (Lobo et al., 2010, Van den Oever et al., 2013). Un faible ratiocfos a été trouvé dans des régions où l’activation était similaire chez les sujets sensibles et résistants (tels que CeA et PAG). Le rapportcfos était également faible lorsque l’activation était accompagnée d’une grande différence entre les commandes à l’attache (comme le Figure 6C pour le rapport résumécfos Les données). Une expression similaire de cFos chez les souris résistantes et résistantes à l’étrier était donc probablement due au nombre de chocs au pied et n’avait que très peu à voir avec la résistance à la punition. Pris ensemble, le ratio élevécfos dans l'OFC suggère que l'activité neuronale dans cette région est associée à la résistance à la peine et peut donc favoriser la transition vers la dépendance.

 

 

 

Plasticité pour la résistance à la punition  

Pour identifier le substrat de l'augmentation de l'activité neuronale dans l'OFC chez les souris résistant à la punition, nous avons préparé des tranches de la PL et L-OFC 24 heures après la dernière séance de punition pour tester l'excitabilité intrinsèque. Les deux régions ont été choisies en raison de leur modèle très distinct d'expression de c-Fos dans les expériences précédentes. L'excitabilité neuronale a été quantifiée en comptant le nombre de potentiels d'action (AP) induits par l'injection de quantités croissantes de courant (de 0 à 600 pA) dans les enregistrements de cellules entières. Ces enregistrements ont révélé une hypo-excitabilité soutenue dans les neurones pyramidaux de la PL de souris résistantes (et leur contrôle attelé) par rapport aux souris sensibles ou naïves (Figure 7UNE). Le potentiel de membrane au repos (RMP) des neurones enregistrés n’était pas différent entre les groupes expérimentaux (Figure 7B) Ces résultats suggèrent fortement que l’excitabilité des neurones dans le PL est en corrélation directe avec le nombre de chocs reçus, et peut-être pas avec la décision de résister à la punition. Cela reflète très probablement une adaptation à la rétroaction négative déclenchée par une excitation neuronale provoquée par les chocs du pied la veille. En revanche, les neurones de L-OFC n'étaient plus excitables que chez les souris résistantes. L’excitabilité des neurones de souris à joug n’était pas différente de celle des neurones de souris naïves, excluant un effet du choc au pied lui-même (Chiffres 7C et 7D). Cette activité accrue des neurones OFC sous-tend probablement l'expression de cFos et peut conduire à la résistance à la punition.

 

Réduction de la compulsivité avec inhibition chimiogénétique du CFO 

Pour tester la causalité entre l'excitabilité des neurones OFC améliorée et la résistance à la punition, nous avons exprimé l'inhibiteur DREADD (récepteurs de concepteur exclusivement activés par des drogues de synthèse: CamKIIα-hM4D) dans des neurones pyramidaux de l'OFC de souris DAT-Cre + (Figure 8UNE). Dans les coupes aiguës de l’OFC, l’application de CNO dans le bain (clozapine-N-oxyde) a induit un courant sortant lent, probablement provoqué par les canaux GIRK, qui a été inversé par le baryum2+), un bloqueur non spécifique des canaux potassiques (Figure 8B) Le CNO a également décalé la courbe entrée / sortie vers la droite (Figure 8C) Les souris DAT-Cre + infectées par AAV1 / CamKIIα-hM4D-mCherry dans l’OFC (Figure 8D) acquis le paradigme d'auto-stimulation des neurones DA suivi de deux blocs successifs avec le calendrier de punition, le premier en présence de CNO et le second sans CNO. Les deux blocs ont été interrompus de 6 jours sans punition (Figure 8E). À la fin du premier bloc de punition, en présence de CNO, seules les souris 5 de 16 étaient résistantes (Figure 8F, panneau de gauche). En revanche, sans inhibition OFC, au cours de la deuxième période de punition, 14 sur 16 a été classé comme «résistant» (Chiffres 8F, panneau de droite, et 8G). En d’autres termes, la fraction de souris résistantes était significativement plus faible en présence de CNO par rapport à la première cohorte de souris 34 précédemment testée dans les mêmes conditions (comparaison entre les groupes, Figure 8H) et est devenu similaire à la première cohorte sans CNO (comparaison intra-groupe). Enfin, pour les neuf souris qui sont passées de sensibles à résistantes, le CNO n’a pas modifié le temps de latence lors de l’immersion dans l’eau chaude (Figure 8JE).

Pris ensemble, cette expérience démontre que l'activité des neurones pyramidaux de l'OFC détermine la poursuite de l'auto-stimulation malgré les conséquences négatives qui constituent un élément clé de la transition vers la dépendance chez les rongeurs.

a lieu 

Un modèle de toxicomanie récemment proposé distingue trois étapes dans la progression de la maladie: l'usage sporadique de drogues à des fins récréatives, suivi d'une consommation de drogues intensifiée, soutenue et en escalade, et finalement l'usage compulsif associé à une perte de contrôle (Piazza et Deroche-Gamonet, 2013; mais voir George et al., 2014). Notre étude démontre que la stimulation des neurones VTA DA est suffisante pour conduire cette progression avec un cours temporel relativement rapide.

En imitant un modèle de tir en rafale naturel, une libération efficace de DA est évoquée dans les régions cibles du VTA, comme le NAc (Bass et al., 2010). Les niveaux de DA dans le NAc régissent donc probablement l'auto-stimulation, tout comme les rongeurs s'auto-administrent la prochaine perfusion de cocaïne ou d'héroïne une fois que la concentration de DA tombe en dessous du seuil (Wise et al., 1995). Ceci est également corroboré par notre observation selon laquelle la cocaïne injectée ip peut bloquer l'auto-stimulation. Ainsi, l'auto-stimulation des neurones DA ressemble étroitement à l'auto-administration de médicaments, même si sa cinétique est certainement plus rapide que toute substance pharmacologique, y compris la cocaïne, comme le suggèrent les différents taux de réponses observés dans la présente étude.

Alors que nous avons ciblé sélectivement les neurones DA de la VTA, leur auto-stimulation optogénétique peut avoir activé des groupes de cellules avec différentes fonctions physiologiques. Par exemple, il a récemment été suggéré que certains neurones DA codent pour des stimuli aversifs (Lammel et al., 2012, Gunaydin et al., 2014). Ces cellules se projettent vers le mPFC, tandis que les neurones VTA DA se projetant vers la coquille NAc latérale assurent un renforcement positif (Lammel et al., 2012). Il serait intéressant d'évaluer l'auto-stimulation et la progression avec un ciblage sélectif (Gunaydin et al., 2014). Puisque notre manipulation a activé tous les neurones VTA DA, tout comme la cocaïne agit sur tous les neurones exprimant le DAT, il est concevable que certains neurones DA conduisent à l'apprentissage par renforcement tandis que d'autres neurones DA conduisent à l'apprentissage par aversion. L'effet net serait encore un renforcement du comportement; cependant, les «neurones d'aversion» pourraient contribuer à l'induction d'un processus d'opposition (Koob, 2013, Wise et Koob, 2014).

Après l'abstinence forcée, la ré-exposition au contexte a induit la recherche de l'auto-stimulation, un modèle rongeur établi de rechute médicamenteuse. Remarquablement, la plasticité neuronale sous-jacente est indiscernable de celle observée après le retrait de l'auto-administration de cocaïne (Pascoli, Terrier et al., 2014). Ceci s'ajoute à une étude qui rapportait précédemment une plasticité synaptique identique dans les neurones VTA DA évoquée par une seule session de stimulation optique ou une première injection d'un médicament addictif (Brown et al., 2010). Un modèle d'adaptations synaptiques émerge, ce comportement adaptatif est commun à toutes les drogues addictives.

Une caractéristique frappante de notre étude est la dichotomie dans la réponse à un stimulus aversif qui est suffisamment fort pour perturber la consommation de récompense naturelle non essentielle chez tous les animaux. Dans notre contexte, les souris résistantes n'ont pas montré une motivation significativement plus élevée pour l'auto-livraison de récompense, ce qui contraste avec une étude avec la cocaïne chez le rat (Pelloux et al., 2007). Le prédicteur comportemental de la résistance à la punition chez la souris, cependant, était une pression de levier futile pendant les 5 s précédant le début de la stimulation des neurones DA. L'incapacité à attendre la délivrance de la récompense peut donc être considérée comme un marqueur d'impulsivité (Dalley et al., 2011, Olmstead, 2006, Everitt et al., 2008, Winstanley, 2011, Leyton et Vezina, 2014). Nous avons été intrigués par l'observation que la prise impulsive ne s'est développée qu'après plusieurs séances d'auto-stimulation. Cela soulève la possibilité que la résistance à la punition (et par extension la vulnérabilité à la dépendance) ne soit pas totalement innée, mais se développe au cours des phases initiales vers la dépendance. Si tel est le cas, alors la dichotomie observée par nous et d'autres (Deroche-Gamonet et al., 2004) peut ne pas être uniquement déterminée par des facteurs génétiques. Cela expliquerait également qu'une fraction similaire d'individus devient dépendante de souches de souris génétiquement relativement homogènes et de populations humaines génétiquement certainement plus diversifiées.

Si la résistance à la punition révèle la vulnérabilité individuelle à la dépendance, estimée au top 20% chez l'homme même avec de la cocaïne (Warner et al., 1995, O'Brien, 1997, George et al., 2014), alors la proportion beaucoup plus élevée trouvée ici pourrait refléter la puissance de la stimulation directe et sélective des neurones DA. En d'autres termes, la stimulation sélective des neurones DA peut être beaucoup plus addictive que n'importe quel médicament. Cela peut s'expliquer par l'action non sélective des substances pharmacologiques. Dans le cas de la cocaïne, par exemple, des monoamines autres que l'AD peuvent en fait retarder le déclenchement de la dépendance. En effet, la sérotonine peut s'opposer aux comportements adaptatifs dépendants de la DA, tels que la réponse à une récompense conditionnée, l'auto-stimulation et la préférence de lieu conditionnée (Wang et al., 1995, Fletcher et Korth, 1999, Fletcher et al., 2002) en facilitant l'association des indices de stimuli aversifs (Bauer, 2015, Hindi Attar et al., 2012). En variante, la différence peut résider dans la différence de cinétique entre l'auto-stimulation optogénétique et l'induction pharmacologique de l'augmentation de la DA extracellulaire. Une telle variation de puissance addictive peut également exister entre différentes drogues d'abus (George et al., 2014).

Bien que nous ne puissions pas exclure formellement les différences de libération de DA et / ou de signalisation relative contribuant à l’établissement de la résistance à la punition, ce scénario est peu probable car la validation histologique de l’infection des animaux inclus dans l’étude a montré: eYFP-ChR2 expression dans l'ensemble de la VTA. De plus, le protocole de stimulation optogénétique conçu pour saturer la libération de DA a conduit à une auto-stimulation qui a abouti à des valeurs distribuées de manière unimodale pour le point de rupture, reflétant la motivation par incitation.

Un autre résultat surprenant est que le nombre de chocs électriques du pied est corrélé à l'excitabilité des neurones dans le PL. Une diminution de l'excitabilité des neurones pyramidaux et une augmentation du rapport AMPAR / NMDAR dans les neurones pyramidaux des mêmes cellules a été observée chez des «rats toxicomanes», mais ces études n'ont pas contrôlé l'effet des chocs électriques en soi (Kasanetz et al., 2010, Kasanetz et al., 2013, Chen et al., 2013). La non-dissociation peut donc s'expliquer par le double rôle du mPFC à la fois dans les processus de décision et dans l'intégration de la peur (Peters et al., 2009). Pour l'inverse, le changement de l'excitabilité des neurones pyramidaux dans le cortex infralimbique est en corrélation avec les chocs du pied (Santini et al., 2008). Cette preuve n'exclut pas la possibilité que le mPFC joue un rôle de premier plan dans la décision de poursuivre l'admission. Cependant, notre analyse cFos et nos observations de l'excitabilité intrinsèque pointent vers l'OFC et le cortex cingulaire. En outre, l'inhibition de l'excitabilité neuronale dans l'OFC avec DREADD a empêché la résistance à la punition. Ce lien causal représente une étape importante dans la compréhension des mécanismes cellulaires responsables de la transition vers l'addiction. Des études futures seront nécessaires pour vérifier si cela s'applique également à toute la gamme des drogues addictives.

Nos résultats vont dans le sens des observations selon lesquelles un dysfonctionnement de l'OFC peut nuire à la prise de décision coût-bénéfice (Seo et Lee, 2010, Walton et al., 2010, Fellows, 2011) et peut conduire à des comportements compulsifs (Burguière et al., 2013) ). Chez l'homme, l'abus de drogues a été lié à une prise de décision altérée et à une fonction OFC altérée (Lucantonio et al., 2012, Gowin et al., 2013). Prises ensemble, l'activité des neurones OFC apparaît comme un déterminant clé de la transition vers la consommation compulsive de drogues (Everitt et al., 2007). Cela n'exclut pas un rôle pour la plasticité évoquée par le médicament au niveau des afférents excitateurs sur les MSN observés ici et dans d'autres études (Kasanetz et al., 2010). Il sera intéressant d'évaluer si les manipulations visant à contrôler l'excitabilité de l'OFC affectent la motivation des toxicomanes.

Nous proposons ici l'auto-stimulation des neurones DA comme un modèle puissant pour étudier les étapes menant à la dépendance. Nous reproduisons les composantes essentielles de la toxicomanie, telles que la rechute, la plasticité synaptique et la persévérance de la consommation malgré les conséquences négatives. Bien que le modèle ne soit certainement pas adapté pour étudier les effets spécifiques d'un médicament donné (par exemple, comparer les opioïdes aux psychostimulants), il présente plusieurs avantages. Il permet un contrôle temporel précis de la délivrance de la récompense, il n'active très spécifiquement que les neurones VTA DA, et enfin et surtout, il donne la possibilité d'étudier les souris pendant un temps beaucoup plus long qu'avec l'auto-administration de médicaments. En se concentrant sur la définition commune des drogues addictives, l'espoir est de démêler les mécanismes neuronaux sous-jacents aux formes de dépendance également non dépendantes de la substance (Alavi et al., 2012, Robbins et Clark, 2015) et de contribuer ainsi à une théorie générale de la maladie. Les modèles de maladies optogénétiques permettent ainsi une étape décisive pour une compréhension approfondie du dysfonctionnement neuronal impliqué dans les stades avancés de la toxicomanie et guideront de nouveaux traitements rationnels pour une maladie actuellement sans cure.

Contributions d'auteur  

VP, JT et AH ont effectué les expériences comportementales, tandis que VP a effectué les enregistrements électrophysiologiques et coordonné l'analyse. L'étude a été conçue et écrite par tous les auteurs.

Remerciements  

Le travail a été financé par des subventions de la Fondation nationale suisse et de la bourse avancée ERC (MeSSI), de Carigest SA, de la Société académique de Genève et de la Fondation Privée des Hôpitaux Universitaires de Genève. JT est un étudiant au doctorat en médecine rémunéré par la Confédération suisse.

 

Information supplémentaire 

Document S1. Procédures expérimentales supplémentaires et figures S1 – S6

Table S1. Analyses statistiques