Hinreichende mesolimbische Dopamin-Neuron-Stimulation für die Suchtprogression (2015)

 

Vincent Pascoli3,Jean Terrier3,Agnès Hiver

,Christian Lüscher'Korrespondenzinformationen zum Autor Christian Lüscherhttp://www.cell.com/templates/jsp/_style2/_marlin/images/icon_email.pngSenden Sie eine E-Mail an den Autor Christian Lüscher

DOI: http://dx.doi.org/10.1016/j.neuron.2015.10.017

Highlights

•Die Selbststimulation von Dopamin-Neuronen ruft synaptische Plastizität im NAc hervor, was zu Rückfällen führt

•Dopamin reicht aus, um eine zwanghafte Einnahme auszulösen

•Neuronen im orbitofrontalen Kortex sind bei bestrafungsresistenten Mäusen übererregbar

•Die chemogenetische Hemmung des OFC reduziert die zwanghafte Selbststimulation

Zusammenfassung

Die Faktoren, die den Übergang vom Freizeitdrogenkonsum zur Sucht verursachen, sind noch weitgehend unbekannt. Es wurde nicht getestet, ob Dopamin (DA) ausreicht, um diesen Prozess auszulösen. Hier nutzen wir die optogenetische Selbststimulation von DA-Neuronen des ventralen Tegmentalbereichs (VTA), um die definierende Gemeinsamkeit von Suchtmitteln selektiv nachzuahmen. Alle Mäuse erlangten problemlos Selbststimulation. Nach wochenlanger Abstinenz wurde ein durch Signale ausgelöster Rückfall beobachtet, der mit einer Potenzierung erregender Afferenzen auf D1-Rezeptor-exprimierende Neuronen des Nucleus accumbens (NAc) einherging. Als die Mäuse einen leichten elektrischen Fußschock ertragen mussten, um eine Stimulation zu erhalten, hörten einige auf, während andere durchhielten. Der Widerstand gegen Bestrafung war mit einer erhöhten neuronalen Aktivität im orbitofrontalen Kortex (OFC) verbunden, während die chemogenetische Hemmung des OFC die Zwanghaftigkeit verringerte. Zusammengenommen zeigen diese Ergebnisse, dass die Stimulierung von VTA-DA-Neuronen Verhaltens- und zelluläre Suchtmerkmale induziert, was darauf hindeutet, dass sie für die Auslösung und das Fortschreiten der Krankheit ausreichend sind.

Einleitung

Sucht ist eine Krankheit, die sich in mehreren Schritten entwickelt (Everitt et al., 2008, George et al., 2014). Die Diagnose wird gestellt, wenn der Freizeitkonsum zwanghaft wird und trotz negativer Folgen anhält. Während eine führende Suchthypothese davon ausgeht, dass Missbrauchsdrogen die Krankheit verursachen, weil sie die Konzentration von Dopamin (DA) im Gehirn übermäßig erhöhen, ist unklar, ob die Auslösung dieses Systems ausreicht, um den Übergang vom Freizeitkonsum zur Sucht voranzutreiben (Di Chiara und Bassareo, 2007, Volkow und Morales, 2015). Die unterstützenden Beweise für die DA-Hypothese zur Arzneimittelverstärkung haben sich über mehrere Jahrzehnte angesammelt und basieren auf der anfänglichen Wirkung von Arzneimitteln. Suchtmittel verringern beispielsweise die Schwelle für die intrakranielle Selbststimulation (ICSS) des medialen Vorderhirnbündels, eines Fasertrakts, der unter anderem die aufsteigende DA-Projektion vom Mittelhirn enthält (Stein, 1964, Crow, 1970, Kornetsky et al., 1979). Pharmakologie und Läsionsstudien identifizierten dann das mesocorticolimbische DA-System als Ursprung dieses Kreislaufs (Wise und Bozarth, 1982). In den späten 1980er Jahren bestätigte eine direkte Messung der extrazellulären DA-Konzentration mittels Mikrodialyse, dass Suchtmittel die Eigenschaft haben, einen DA-Anstieg im NAc hervorzurufen (Di Chiara und Imperato, 1988). Dies führte zum Vorschlag einer mechanistischen Klassifizierung von Suchtmitteln (Lüscher und Ungless, 2006).

Es ist viel weniger darüber bekannt, wie diese anfänglichen Auswirkungen des Drogenkonsums den Übergang in die Sucht erleichtern. DA-unabhängige Mechanismen wurden in Betracht gezogen, da Suchtmittel andere pharmakologische Ziele haben. Kokain beispielsweise hemmt nicht nur den DA-Transporter (DAT), sondern bindet auch an SERT (Serotonin-Transporter) und NET (Noradrenalin-Transporter), um die Wiederaufnahme von Serotonin bzw. Noradrenalin zu verringern und so die Konzentration aller wichtigen Monoamine (Han und) zu erhöhen Gu, 2006, Tassin, 2008). Ähnliche Bedenken gelten möglicherweise auch für andere Psychostimulanzien. Darüber hinaus wird behauptet, dass Opiate zumindest in der Anfangsphase DA-unabhängig sind (Badiani et al., 2011, Ting-A-Kee und van der Kooy, 2012). Die DA-Hypothese wurde auch anhand genetischer Mausmodelle in Frage gestellt, bei denen nach Eingriffen in das DA-System immer noch einige Formen medikamentenadaptiver Verhaltensweisen erkennbar waren. Beispielsweise verabreichen sich DAT-Knockout-Mäuse selbst Kokain (Rocha et al., 1998), und die Abschaffung der DA-Synthese, sei es pharmakologisch (Pettit et al., 1984) oder genetisch (Hnasko et al., 2007), konnte die Selbstverabreichung von Medikamenten nicht verhindern oder konditionierte Ortspräferenz. Während eine bessere Charakterisierung dieser transgenen Mäuse und die Erzeugung doppelter Monoamintransporter-Knockouts einige dieser Probleme gelöst haben (Rocha, 2003, Thomsen et al., 2009), ist unbekannt, ob DA ausreicht, um grundlegende Suchtmerkmale auszulösen. Um Probleme der Unspezifität zu umgehen, haben wir uns daher entschieden, Mäusen die Selbststimulation von VTA-DA-Neuronen mithilfe eines optogenetischen Ansatzes zu ermöglichen.

Aktuelle Studien haben gezeigt, dass die Aktivierung von DA-Neuronen im Mittelhirn eine Ortspräferenz auslösen (Tsai et al., 2009) oder instrumentelles Verhalten verstärken kann (Adamantidis et al., 2011, Witten et al., 2011, Kim et al., 2012, Rossi et al., 2013, McDevitt et al., 2014, Ilango et al., 2014). Während diese selektive Aktivierung von DA-Signalwegen Studien zur intrakraniellen Selbststimulation (ICSS) bestätigt, die vor mehr als 30 Jahren zur Abgrenzung des Belohnungssystems durchgeführt wurden (Fouriezos et al., 1978), sind sie nicht in der Lage, die Induktion von adaptivem Verhalten im Spätstadium zu belegen definiert Sucht, noch identifizierten sie die zugrunde liegenden neuronalen Anpassungen. Hier verwendeten wir optogenetische Manipulation nicht nur, um das Suffizienzkriterium für die phasische DA-Signalisierung bei der Auslösung der Verstärkung direkt zu testen, sondern auch, um den Übergang zur Sucht zu testen.

Eine bemerkenswerte Beobachtung in den späteren Stadien der Krankheit ist, dass selbst bei den am stärksten abhängig machenden Drogen nur ein Bruchteil der Konsumenten süchtig wird (Warner et al., 1995, O'Brien, 1997). Abhängige Menschen werden trotz negativer Folgen weiterhin Drogen konsumieren (siehe „Definition of Addiction“ der American Society for Addiction Medicine, DSM5, American Psychiatric Association, 2013), die typischerweise mit sozialen und psychologischen Niederlagen verbunden sind, die oft zeitlich verzögert auftreten. In ähnlicher Weise wird bei Nagetieren etwa jedes fünfte Tier, das sich Kokain selbst verabreicht, schließlich als süchtig eingestuft (Deroche-Gamonet et al., 2004, Kasanetz et al., 2010; siehe jedoch George et al., 2014). Die Beharrlichkeit der Medikamenteneinnahme trotz negativer Folgen kann bei Nagetieren auch durch die Einführung eines einfachen aversiven Reizes in den Konsumplan modelliert werden. Während die menschliche Krankheit komplexer ist, ist die Verknüpfung von Bestrafung mit Konsum ein einfaches Modell für eine Kernkomponente der Sucht.

Hier verwendeten wir einen leichten Fußschock, um dessen Auswirkungen auf die Selbstverabreichung von Kokain, Saccharose und die optogenetische Selbststimulation zu bewerten. Wir untersuchen weiter, ob die Selbststimulation von DA-Neuronen zwei süchtig machende Verhaltensweisen hervorrufen kann – die Suche nach Belohnungen im Zusammenhang mit Reizen und die mit Konsum verbundene Zwanghaftigkeit trotz negativer Konsequenzen – und charakterisieren die mit diesen Verhaltensweisen verbundene neuronale Plastizität.

Die Ergebnisse

Erwerb von VTA DA Neuron Self-Stimulation

 

Um die Aktivität von DA-Neuronen zu kontrollieren, injizierten wir ein Cre-induzierbares Adeno-assoziiertes Virus (AAV) mit einem doppelt gefloxten invertierten offenen Leserahmen (DIO). ChR2 fusioniert mit Enhanced Yellow Fluorescent Protein (eYFP) (Atasoy et al., 2008, Brown et al., 2010) in die VTA von DAT-Cre-Mäusen. Zusätzlich wurde eine optische Faser platziert, um die VTA anzuvisieren (ChR2, Siehe Experimentelle Verfahren). Spezifität der ChR2 Die Expression wurde durch die Co-Lokalisierung von eYFP mit Tyrosinhydroxylase (TH) bestätigt, einem Enzym, das für die DA-Synthese erforderlich ist (Abbildung 1A). 

Um das Laserstimulationsprotokoll zu etablieren, wurden die Mäuse zunächst in eine Operationsbox gelegt, wo sie einen aktiven Hebel drücken konnten, der jeweils eine unterschiedliche Anzahl von Laserstimulationen auslöste (1, 2, 8, 32, 60 oder 120 Stöße). zwei Sitzungen. Um das phasische Feuermuster (Hyland et al., 2002, Mameli-Engvall et al., 2006, Zhang et al., 2009) zu emulieren, das typischerweise durch natürliche Belohnung induziert wird (Schultz, 1998), verwendeten wir Burst-Stimulation. Ein Burst bestand aus fünf Laserpulsen von 4 ms bei 20 Hz und wurde zweimal pro Sekunde wiederholt. Wir fanden heraus, dass Mäuse ihr Verhalten beim Drücken des Hebels als Funktion der Stöße pro Laserstimulation anpassten und so die Gesamtzahl der empfangenen Stöße kontrollierten (Abbildung 1B). Dieses Verhalten erinnerte an die Selbstverabreichung von Suchtmitteln, wenn die Dosis pro Infusion variiert wurde (Piazza et al., 2000). Für die nachfolgenden Experimente entschieden wir uns für die Verabreichung von 30 Stößen pro Hebelbetätigung, was einer halbmaximalen Anzahl von Stößen entspricht (Abbildung 1B). Um die Verzögerung des DA-Anstiegs nachzuahmen, die typischerweise bei intravenöser Verabreichung von Medikamenten beobachtet wird (Aragona et al., 2008), haben wir die Laserstimulation um 5 Sekunden verzögert und ein blinkendes Hinweislicht für 10 Sekunden hinzugefügt (Abbildung 1C).

An 12 aufeinanderfolgenden Tagen durften sich die Mäuse innerhalb von 80 Stunden maximal 2 Mal selbst stimulieren. Mäuse erhöhten schnell die Geschwindigkeit der Laserstimulation und erreichten vor dem Ende der ersten Stunde einer Sitzung 80 Laserstimulationen (LS).Figuren 1D und 1E). Die Unterscheidung zwischen dem aktiven und dem inaktiven Hebel wurde schnell erlernt und die Anzahl der Betätigungen des aktiven Hebels erhöhte sich entsprechend mit zunehmenden festen Übersetzungsplänen (FR1, 2, 3) (Figuren 1F und 1G). In Kontrollexperimenten mit DAT-Cre−-Mäusen oder Mäusen, die ChR2 in γ-Aminobuttersäure (GABA)-Neuronen exprimierten (GAD-Cre+-Mäuse, um auf die inhibitorischen Neuronen des VTA abzuzielen), waren die Selbststimulationsraten niedrig und nahmen kontinuierlich ab Sitzungen. Dies traf auch auf zwei Cre+-Tiere zu, bei denen eine Post-hoc-Validierung zeigte, dass der VTA nicht mit ChR2-eYFP infiziert war (nicht gezeigt). Darüber hinaus wurde keine Unterscheidung zwischen aktivem und inaktivem Hebel festgestellt (Figuren S1A und S1B).

Wir beobachteten, dass DAT-Cre+-Mäuse häufiger auf den aktiven Hebel drückten, als für die Laserstimulation erforderlich war. Tatsächlich machten solche „vergeblichen“ aktiven Hebeldrücke mehr als 30 % aller aktiven Hebeldrücke aus (Abbildung S2A) und traten im Verlauf der Sitzungen meist zwischen dem Reizsignal und dem Beginn der Laserstimulation auf (Figuren S2B und S2C). Dieses einzigartige Verhalten entwickelte sich während der Akquise und spiegelt möglicherweise impulsive Reaktionen wider.

Zusammengenommen verstärkt die Burst-Aktivität in VTA-DA-Neuronen die Reaktion des Hebels erheblich.

 

Okklusion der Selbststimulation von VTA DA-Neuronen durch Kokain

Um zu testen, ob die Selbststimulation der VTA-DA-Neuronen von denselben Schaltkreisen im Gehirn abhängt, auf die Suchtmittel zur Verhaltensverstärkung abzielen, injizierten wir Kokain intraperitoneal (ip) unmittelbar vor den Selbststimulationssitzungen (freier Zugang zum Laser für 45 Minuten). Abbildung 2A). Zu Beginn drückten gut trainierte Tiere etwa 400 Mal, um nach dem FR85-Schema 45 LS in 3 Minuten zu erreichen. Nach der Kokaininjektion sank die Leistung dosisabhängig deutlich auf etwa 30 LS bei 100 Hebeldrücken mit der höchsten Dosis (Abbildung 2B). Dieser Verschluss war während der ersten 30 Minuten der Sitzung am stärksten ausgeprägt, was die Pharmakokinetik des Arzneimittels widerspiegelt (Abbildung 2C). Dieses Experiment zeigt, dass die Verstärkung durch optogenetische Selbststimulation und die Verstärkung durch Kokain die zugrunde liegenden neuronalen Schaltkreise gemeinsam nutzen.

Synaptische Plastizität im Zusammenhang mit der Suche nach Rückzug

Um die optogenetische Selbststimulation weiter mit Suchtmitteln zu vergleichen, fragten wir als nächstes, ob Mäuse nach mehrwöchigem Entzug wieder auf die Selbststimulation von VTA-DA-Neuronen zurückfallen würden. Da die reizassoziierte Drogensuche ein etabliertes Rückfallmodell ist (Epstein et al., 2006, Soria et al., 2008, Bossert et al., 2013), setzten wir Mäuse 30 Tage nach dem letzten Selbstversuch wieder in die Operationskammer ein. Stimulationssitzung, bei der das aktive Drücken des Hebels nun das Hinweislicht auslöste ohne Laserstimulation (Abbildung 3A). Ein robustes Cue-assoziiertes Suchverhalten, das durch eine hohe Rate aktiver Hebeldrücke demonstriert wurde, war nur bei Mäusen mit Expression von eYFP erkennbar.ChR2 in VTA-DA-Neuronen (DAT-Cre+, aber nicht DAT-Cre− Mäuse, Abbildung 3B).

Frühere Studien haben den kausalen Zusammenhang zwischen einem mit dem Reizsignal verbundenen Rückfall und der durch Kokain hervorgerufenen synaptischen Plastizität in einem Subtyp von NAc-Neuronen gezeigt, die den DA D1R exprimieren (Pascoli, Terrier et al., 2014). Um diese synaptische Plastizität zu bewerten, haben wir daher DAT-Cre-Mäuse gekreuzt mit Drd1a-tdTomato Mäuse, um den Subtyp der mittelgroßen stacheligen Neuronen (MSNs) im NAc zu identifizieren. Anstelle des Suchtests wurden Schnitte des NAc hergestellt, in denen D1R-MSNs rot waren, im Gegensatz zu grünen Fasern von VTA-DA-Neuronen, die mit Flox-ChR2-eYFP infiziert waren (Abbildung 3C). Ex-vivo-Patch-Clamp-Aufzeichnungen ganzer Zellen zeigten eine gleichrichtende Strom-Spannungs-Beziehung für durch AMPAR hervorgerufene postsynaptische Ströme (AMPAR-EPSCs) und ein erhöhtes AMPAR/NMDAR-Verhältnis (Figuren 3D und 3E), in den D1R-MSNs, aber nicht in den D2R-MSNs. Ähnliche Ergebnisse, die zuvor nach dem Absetzen der Kokain-Selbstverabreichung erzielt wurden, deuten auf die kombinierte Insertion von AMPARs ohne GluA2 und mit GluA2-haltigen AMPARs an getrennten Eingängen in D1R-MSNs hin (Pascoli, Terrier et al., 2014).

 

 

 

Selbststimulation trotz Bestrafung

Substanzkonsum trotz negativer Folgen ist ein weiteres entscheidendes definierendes Merkmal von Sucht (siehe DSM5-Definition, American Psychiatric Association, 2013). Es wurden Rattenmodelle etabliert (Deroche-Gamonet et al., 2004, Pelloux et al., 2007, Pelloux et al., 2015, Chen et al., 2013), bei denen ein im Kokain-Selbstverabreichungsplan eingeführter Elektroschock die Kokainproduktion unterdrückt Verzehr bei manchen Tieren. Nach 12 Tagen anfänglicher Exposition (Akquisition) durften die Mäuse drei weitere Sitzungen bei FR3 absolvieren, jedoch mit einer verkürzten Sitzungsunterbrechung (60 Minuten oder maximal 40 Belohnungen). Diese drei Sitzungen dienten als Grundlage für die folgenden vier Sitzungen, in denen jede dritte Laserstimulation mit einem Fußschock (500 ms; 0.2 mA) gepaart war, der durch einen neuartigen Hinweis vorhergesagt wurde (Abbildung 4A). Die Intensität und Dauer des Fußschocks wurden angepasst, um das Drücken des Hebels zur Saccharose-Belohnung vollständig zu unterdrücken (siehe auch Daten unten). Der Bestrafungsplan führte zu zwei gegensätzlichen Verhaltensreaktionen (Abbildung 4B). Einige Mäuse reagierten schnell nicht mehr, als die Bestrafung eingeführt wurde (sogenannte „empfindliche Mäuse“), während andere weiterhin reagierten, um die maximale Anzahl an Laserstimulationen zu erhalten, und als „resistent“ gegenüber Bestrafung angesehen werden können. Die beiden Tiergruppen kamen am Ende der vier Bestrafungssitzungen vollständig zum Vorschein (Abbildung 4C). „Resistente Mäuse“ behielten die Anzahl der Laserstimulationen bei (weniger als 20 % Reduzierung), während „sensible Mäuse“ die Selbststimulation um mehr als 80 % verringerten. Mit diesen Kriterien konnte lediglich ein Tier (graue Punkte) nicht zugeordnet werden. Diese Beobachtung zeigt, dass eine erzwungene Burst-Aktivität, die durch Selbststimulation von VTA-DA-Neuronen hervorgerufen wird, ausreicht, um bei einem Bruchteil der Mäuse trotz negativer Folgen einen anhaltenden Konsum zu induzieren. Als Kontrolle wurde die Nozizeption in einer unabhängigen Gruppe von Mäusen, die Widerstand oder Empfindlichkeit gegenüber der mit der Selbststimulation verbundenen Bestrafung gezeigt hatten, mithilfe des Tail-Flick-Assays bewertet. Es wurde kein Unterschied in der Latenzzeit zum Zurückziehen des in heißes Wasser getauchten Schwanzes zwischen empfindlichen und resistenten Tieren festgestellt (Abbildung S3).

Als nächstes fragten wir post hoc, ob ein bestimmtes Merkmal während der Erwerbsphase der Selbststimulation den Widerstand gegen Bestrafung hätte vorhersagen können. Empfindliche und resistente Mäuse machten während der Basissitzungen eine identische Anzahl an aktiven und inaktiven Hebeldrücken, und alle Mäuse erreichten das Maximum von 80 LS (Figuren S4A und S4B) in ähnlicher Zeit (Figuren S4A und S4C). Während der Anteil vergeblicher aktiver Hebeldrücke in den beiden Teilpopulationen wiederum nicht unterschiedlich war (Figuren 4D und S4D), die Anzahl der vergeblichen Hebeldrücke vor Beginn der Laserstimulation wurde bei resistenten Mäusen am Ende der Erfassungssitzungen deutlich höher (Figuren 4E und S4E). Da sich dieses Verhalten während des Erwerbs entwickelte, kann es zusammen mit der angeborenen Impulsivität (Economidou et al., 2009, Broos et al., 2012, Jentsch et al., 2014) zur Etablierung des Widerstands gegen Bestrafung beitragen. Darüber hinaus wurde am 11. Tag ein Progressive-Ratio-Test durchgeführt, um die Motivation für die optogenetische Stimulation zu quantifizieren (Richardson und Roberts, 1996). Resistente Mäuse zeigten einen Bruchpunkt, der sich statistisch nicht von empfindlichen Mäusen unterschied (Abbildung S4F).

Widerstand gegen die Strafe für Kokain, aber nicht für Saccharose

Um zu testen, ob das Paradigma des Konsums trotz schädlicher Folgen zusammen mit dem Drücken des Impulshebels auch die zwanghafte Einnahme einer Suchtdroge vorhersagen kann, unterzog sich eine neue Kohorte von Mäusen 12 Tage lang der Selbstverabreichung von Kokain. Die experimentellen Parameter für den Erwerb von Kokain durch Selbstverabreichung wurden auf maximal 80 Kokaininfusionen innerhalb von 4 Stunden während des Erwerbs und auf 40 Infusionen innerhalb von 2 Stunden während der drei Basissitzungen vor den vier Bestrafungssitzungen festgelegt (Figuren 5A und S5A). Auch hier entstanden zwei Gruppen, nachdem die Kokain-Belohnung mit Elektroschocks kombiniert wurde. Tatsächlich wurden 5 von 22 Mäusen als resistent eingestuft (weniger als 20 % Rückgang gegenüber dem Ausgangswert), während 17 als empfindlich eingestuft wurden (mehr als 80 % Rückgang) und ein Tier dazwischen lag (13 Infusionen am 19. Tag) (Abbildung 5B). Anschließend suchten wir nach Verhaltensprädiktoren für den Widerstand gegen Bestrafung. Zwischen den beiden Gruppen unterschieden sich die Anzahl der Infusionen, die Infusionsgeschwindigkeit und die Anzahl der aktiven oder inaktiven Hebeldrücke nicht (Figuren S5B–S5D) und die Bruchstellen waren ähnlich (Abbildung S5E). Was sich unterschied, war die zeitliche Entwicklung der vergeblichen Betätigung des aktiven Hebels. In den ersten vier Sitzungen nahm das vergebliche Drücken des Hebels während der Auszeitperioden sowohl bei resistenten als auch bei empfindlichen Mäusen regelmäßig ab, während am Ende der Erfassung nur empfindliche Mäuse dieses Verhalten beibehielten (Figuren 5C und 5D und S5F). Im Gegensatz dazu neigten resistente Mäuse dazu, die Gesamtzahl vergeblicher Hebeldrücke zu erhöhen (Figuren 5C und S5D), insbesondere im letzten Viertel der Auszeit (Abbildung 5D). Obwohl dies qualitativ der Beobachtung ähnelt, die zuvor bei der optogenetischen Stimulation von DA-Neuronen gemacht wurde (siehe oben), wurde bei Kokain keine Häufung vergeblicher Drücke während der frühen Auszeitperiode beobachtet, was höchstwahrscheinlich auf die langsamere Kinetik zurückzuführen ist, mit der das Medikament arbeitet erhöhte DA-Werte. Dennoch könnten ähnliche Schlussfolgerungen auf der Grundlage dieser einzigartigen Entwicklung der vergeblichen Verteilung von Hebeldrücken während der kurzen Zeitspanne vor der „internen Erkennung des DA-Anstiegs“ gezogen werden. Unsere Beobachtungen legen daher nahe, dass die Verteilung der vergeblichen aktiven Hebeldrücke den Drogenkonsum trotz negativer Folgen vorhersagt.

Schließlich wiederholten wir das Experiment mit ad libitum gefütterten Mäusen, die eine Hebelpresse für eine Saccharose-Belohnung einsetzen konnten. Sobald die Bestrafung eingeführt wurde, hörten alle Mäuse auf, sich selbst Saccharose zu verabreichen (Abbildung 5E), was zeigt, dass dieser Plan die Aufnahme einer nicht essentiellen natürlichen Belohnung unterdrückte, aber die Erkennung einer zwanghaften Einnahme einer Suchtdroge oder einer starken DA-Neuronenstimulation ermöglichte.

Zusammengenommen zeigen diese Ergebnisse, dass die Selbststimulation von VTA DA ausreicht, um Zwanghaftigkeit auszulösen, wie die Widerstandsfähigkeit gegen Bestrafung bei einer Untergruppe von Mäusen (68 %) zeigt. In ähnlicher Weise entwickelten einige Mäuse nach Kokain-SA eine Strafresistenz (23 %), was nach Saccharose-SA nie der Fall war (Abbildung 5F).

 

 

 

Ein zelluläres Korrelat des Widerstands gegen Bestrafung  

Um den Gehirnbereich zu bestimmen, der die Entscheidung steuern kann, trotz negativer Konsequenzen an der Selbstverabreichung festzuhalten, haben wir zunächst die generische „neuronale Aktivität“ überwacht, indem wir die Anzahl der Neuronen gezählt haben, in denen die Bestrafungssitzung die Expression des unmittelbar frühen Gens cFos in 15 ausgelöst hat verschiedene Regionen. Mäuse wurden 90 Minuten nach dem Ende der letzten Bestrafungssitzung intrakardial mit PFA perfundiert. Zu den Kontrollgruppen gehörten naive Tiere sowie Mäuse, die an empfindliche oder resistente Mäuse gejocht wurden, um die möglicherweise verwirrende Wirkung der Anzahl der erhaltenen Schocks zu kontrollieren.

Während in den meisten der ausgewählten Regionen die Anzahl der cFos-positiven Neuronen in Schnitten resistenter Mäuse im Vergleich zu Schnitten naiver Mäuse am höchsten war, traten zwei Arten von Reaktionen auf, für die der prälimbische Kortex (PL) und der laterale OFC Beispiele sind. Im PL fanden wir einen ähnlichen Anstieg cFos-positiver Zellen bei resistenten Mäusen und ihren unter Joch gehaltenen Kontrollen, während dieser Anstieg im OFC nur bei den resistenten und nicht bei den entsprechenden unter Joch gehaltenen Mäusen erkennbar war (Figuren 6A und 6B ). Um diesen Unterschied zu quantifizieren, wurden alle Daten zunächst auf die Expressionsniveaus bei naiven Tieren normalisiert. Dann wurde das Verhältnis zwischen beständig über empfindlich dividiert durch Joch zu resistent über Joch zu empfindlich berechnet (Verhältniscfos = (R/S) / (YR/YS), Abbildung 6B). Dieses Verfahren identifizierte den cingulären Kortex, das OFC und VTA als die Regionen, die in resistenten, aber nicht in empfindlichen Mäusen aktiviert werden und in denen es in beiden Gruppen von Joch-Kontrollen nur geringe Unterschiede gab (tatsächlich gab es ähnliche schwach cFos-positive Neuronen in Joch-Mäusen). . Das Auffinden des VTA ist nicht überraschend, da es sich um die Region laserstimulierter Neuronen handelt. Dies steht im Einklang mit einem früheren Bericht, der zeigt, dass die ChR2-Stimulation die cFos-Aktivierung auslöst (Lobo et al., 2010, Van den Oever et al., 2013). Ein niedriges Verhältniscfos wurde in Regionen gefunden, in denen die Aktivierung bei empfindlichen und resistenten Regionen ähnlich war (wie CeA und PAG). Das Verhältniscfos war auch niedrig, wenn die Aktivierung mit einem hohen Unterschied in den Jochkontrollen einherging (z. B. PL, Abbildung 6C für zusammengefasstes Verhältniscfos Daten). Eine ähnliche cFos-Expression bei resistenten und jochresistenten Mäusen hing daher höchstwahrscheinlich von der Anzahl der Fußschocks ab und hatte wenig mit dem Widerstand gegen Bestrafung zu tun. Zusammengenommen ist die Quote hochcfos im OFC legt nahe, dass neuronale Aktivität in dieser Region mit Widerstand gegen Bestrafung verbunden ist und somit den Übergang zur Sucht begünstigen könnte.

 

 

 

Plastizität für Widerstand gegen Strafe  

Um das Substrat der erhöhten neuronalen Aktivität im OFC bei den Mäusen, die sich der Bestrafung widersetzten, zu identifizieren, haben wir 24 Stunden nach der letzten Bestrafungssitzung Scheiben des PL und des L-OFC vorbereitet, um die intrinsische Erregbarkeit zu testen. Die beiden Regionen wurden aufgrund ihres sehr unterschiedlichen Musters der c-Fos-Expression in den vorherigen Experimenten ausgewählt. Die neuronale Erregbarkeit wurde quantifiziert, indem die Anzahl der Aktionspotentiale (APs) gezählt wurde, die durch die Injektion zunehmender Strommengen (von 0 bis 600 pA) in Ganzzellaufzeichnungen hervorgerufen wurden. Diese Aufzeichnungen zeigten eine anhaltende Hypoerregbarkeit in Pyramidenneuronen der PL resistenter Mäuse (und ihrer Jochkontrolle) im Vergleich zu empfindlichen oder naiven Mäusen (Abbildung 7A). Das Ruhemembranpotential (RMP) der aufgezeichneten Neuronen unterschied sich zwischen den Versuchsgruppen nicht (Abbildung 7B). Diese Ergebnisse deuten stark darauf hin, dass die Erregbarkeit von Neuronen im PL direkt mit der Anzahl der empfangenen Schocks korreliert und möglicherweise nicht mit der Entscheidung, sich der Bestrafung zu widersetzen. Dies spiegelt höchstwahrscheinlich eine negative Rückkopplungsanpassung wider, die durch die neuronale Erregung ausgelöst wurde, die durch die Fußstöße am Vortag ausgelöst wurde. Im Gegensatz dazu waren Neuronen aus L-OFC nur bei resistenten Mäusen stärker erregbar. Die Erregbarkeit von Neuronen von Mäusen mit Joch unterschied sich nicht von der Erregbarkeit von Neuronen von naiven Mäusen, was einen Effekt des Fußschocks selbst ausschließt (Figuren 7C und 7D). Diese erhöhte Aktivität von OFC-Neuronen liegt wahrscheinlich der cFos-Expression zugrunde und kann den Widerstand gegen Bestrafung fördern.

 

Reduzierung der Zwanghaftigkeit durch chemogenetische Hemmung von OFC 

Um den Kausalzusammenhang zwischen erhöhter Erregbarkeit von OFC-Neuronen und Bestrafungsresistenz zu testen, exprimierten wir das inhibitorische DREADD (Designerrezeptoren, die ausschließlich durch Designerdrogen aktiviert werden: CamKIIα-hM4D) in Pyramidenneuronen des OFC von DAT-Cre+-Mäusen (Abbildung 8A). In akuten Schnitten des OFC induzierte die Badanwendung von CNO (Clozapin-N-oxid) einen langsamen Auswärtsstrom, höchstwahrscheinlich vermittelt durch GIRK-Kanäle, der durch Barium (Ba) umgekehrt wurde2+), ein unspezifischer Blocker von Kaliumkanälen (Abbildung 8B). Der CNO hat auch die Input/Output-Kurve nach rechts verschoben (Abbildung 8C). Die mit AAV1/CamKIIα-hM4D-mCherry infizierten DAT-Cre+-Mäuse im OFC (Abbildung 8D) erworbenes DA-Neuron-Selbststimulationsparadigma, gefolgt von zwei aufeinanderfolgenden Blöcken mit dem Bestrafungsplan, der erste in Anwesenheit von CNO und der zweite ohne CNO. Die beiden Sperren wurden um 6 Tage ohne Strafe unterbrochen (Abbildung 8E). Am Ende des ersten Bestrafungsblocks waren in Gegenwart von CNO nur 5 von 16 Mäusen resistent (Abbildung 8F, linkes Feld). Ohne OFC-Hemmung hingegen wurden im zweiten Strafzeitraum 14 von 16 als „resistent“ eingestuft (Figuren 8F, rechtes Feld und 8G). Mit anderen Worten: Der Anteil resistenter Mäuse war in Gegenwart von CNO deutlich geringer als in der ersten Kohorte von 34 Mäusen, die zuvor unter den gleichen Bedingungen getestet wurden (Vergleich zwischen den Gruppen, Abbildung 8H) und ähnelte der ersten Kohorte ohne CNO (Vergleich innerhalb der Gruppe). Schließlich veränderte CNO bei den neun Mäusen, die von empfindlich zu resistent wechselten, die Schwanzbewegungslatenz beim Eintauchen in heißes Wasser nicht (Abbildung 8ICH).

Zusammenfassend zeigt dieses Experiment, dass die Aktivität der Pyramidenneuronen des OFC die Entscheidung, die Selbststimulation trotz negativer Konsequenzen fortzusetzen, vorantreibt, was ein Schlüsselmerkmal des Übergangs zur Sucht bei Nagetieren darstellt.

Diskussion 

Ein kürzlich vorgeschlagenes Suchtmodell unterscheidet drei Schritte im Fortschreiten der Krankheit: sporadischer Drogenkonsum in der Freizeit, gefolgt von intensiviertem, anhaltendem, eskaliertem Drogenkonsum und schließlich zwanghaftem Konsum verbunden mit Kontrollverlust (Piazza und Deroche-Gamonet, 2013; aber siehe George et al., 2014). Unsere Studie zeigt, dass die Stimulation von VTA-DA-Neuronen ausreicht, um diesen Fortschritt in einem relativ schnellen Zeitverlauf voranzutreiben.

Durch die Nachahmung eines natürlich vorkommenden Feuerstoßmusters wird eine effiziente Freisetzung von DA in Zielregionen des VTA, wie etwa dem NAc, hervorgerufen (Bass et al., 2010). Die DA-Spiegel im NAc bestimmen daher wahrscheinlich die Selbststimulation, so wie Nagetiere die nächste Infusion von Kokain oder Heroin selbst verabreichen, sobald die DA-Konzentration unter den Schwellenwert fällt (Wise et al., 1995). Dies wird auch durch unsere Beobachtung gestützt, dass ip injiziertes Kokain die Selbststimulation beeinträchtigen kann. Somit ähnelt die Selbststimulation von DA-Neuronen stark der Selbstverabreichung von Medikamenten, auch wenn ihre Kinetik sicherlich schneller ist als bei jeder pharmakologischen Substanz, einschließlich Kokain, wie die in der vorliegenden Studie beobachteten unterschiedlichen Reaktionsraten nahelegen.

Während wir selektiv auf DA-Neuronen des VTA abzielten, könnte ihre optogenetische Selbststimulation Zellgruppen mit unterschiedlichen physiologischen Funktionen aktiviert haben. Beispielsweise wurde kürzlich vermutet, dass einige DA-Neuronen aversive Reize kodieren (Lammel et al., 2012, Gunaydin et al., 2014). Diese Zellen projizieren auf mPFC, während VTA-DA-Neuronen, die auf die laterale NAc-Hülle projizieren, positive Verstärkung vermitteln (Lammel et al., 2012). Es wäre interessant, die Selbststimulation und das Fortschreiten mit selektivem Targeting zu bewerten (Gunaydin et al., 2014). Da unsere Manipulation alle VTA-DA-Neuronen aktivierte, so wie Kokain auf alle DAT-exprimierenden Neuronen wirkt, ist es denkbar, dass einige DA-Neuronen das Verstärkungslernen vorantreiben, während andere DA-Neuronen das Abneigungslernen vorantreiben würden. Der Nettoeffekt wäre immer noch eine Verstärkung des Verhaltens; Allerdings könnten die „Aversionsneuronen“ zur Auslösung eines gegnerischen Prozesses beitragen (Koob, 2013, Wise und Koob, 2014).

Nach erzwungener Abstinenz löste die erneute Auseinandersetzung mit dem Kontext die Suche nach Selbststimulation aus, einem etablierten Nagetiermodell für Drogenrückfälle. Bemerkenswerterweise ist die zugrunde liegende neuronale Plastizität nicht von der zu unterscheiden, die nach dem Entzug aus der Selbstverabreichung von Kokain beobachtet wird (Pascoli, Terrier et al., 2014). Dies ergänzt eine Studie, die zuvor über eine identische synaptische Plastizität in VTA-DA-Neuronen berichtete, die durch eine einzelne Sitzung optischer Stimulation oder eine erste Injektion eines Suchtmittels hervorgerufen wurde (Brown et al., 2010). Es zeichnet sich ein Muster synaptischer Anpassungen ab, das adaptives Verhalten ermöglicht, das allen Suchtmitteln gemeinsam ist.

Ein auffälliges Merkmal unserer Studie ist die Dichotomie in der Reaktion auf einen aversiven Reiz, der stark genug ist, um den Konsum nicht notwendiger natürlicher Belohnungen bei allen Tieren zu stören. In unserem Umfeld zeigten resistente Mäuse keine signifikant höhere Motivation für die Selbstabgabe der Belohnung, was im Gegensatz zu einer Studie mit Kokain an Ratten steht (Pelloux et al., 2007). Der Verhaltensprädiktor für den Widerstand gegen Bestrafung bei Mäusen war jedoch das vergebliche Drücken des Hebels während der 5 Sekunden vor Beginn der DA-Neuronenstimulation. Die Unfähigkeit, auf die Belohnung zu warten, kann daher als ein Marker für Impulsivität angesehen werden (Dalley et al., 2011, Olmstead, 2006, Everitt et al., 2008, Winstanley, 2011, Leyton und Vezina, 2014). Faszinierend für uns war die Beobachtung, dass sich impulsives Nehmen erst nach mehreren Sitzungen der Selbststimulation entwickelte. Dies erhöht die Möglichkeit, dass der Widerstand gegen Bestrafung (und damit auch die Anfälligkeit für Sucht) möglicherweise nicht vollständig angeboren ist, sondern sich in den Anfangsphasen der Sucht entwickelt. Wenn dies der Fall ist, dann ist die von uns und anderen beobachtete Dichotomie (Deroche-Gamonet et al., 2004) möglicherweise nicht ausschließlich durch genetische Faktoren bestimmt. Dies würde auch erklären, dass ein ähnlicher Anteil der Individuen in genetisch relativ homogenen Mausstämmen und genetisch sicherlich vielfältigeren menschlichen Populationen süchtig wird.

Wenn die Bestrafungsresistenz die individuelle Anfälligkeit für Sucht offenbart, die bei Menschen selbst bei Kokain auf über 20 % geschätzt wird (Warner et al., 1995, O'Brien, 1997, George et al., 2014), dann ist der Anteil hier viel höher könnte die Kraft der direkten und selektiven DA-Neuronenstimulation widerspiegeln. Mit anderen Worten: Die selektive DA-Neuronenstimulation kann viel stärker abhängig machen als jedes Medikament. Dies kann durch die nicht selektive Wirkung pharmakologischer Substanzen erklärt werden. Im Fall von Kokain beispielsweise können andere Monoamine als DA die Suchtentwicklung tatsächlich verzögern. Tatsächlich kann Serotonin DA-abhängigen adaptiven Verhaltensweisen wie der Reaktion auf konditionierte Belohnung, Selbststimulation und konditionierter Ortspräferenz entgegenwirken (Wang et al., 1995, Fletcher und Korth, 1999, Fletcher et al., 2002), indem es die Assoziation erleichtert von Hinweisen auf aversive Reize (Bauer, 2015, Hindi Attar et al., 2012). Alternativ kann der Unterschied in der unterschiedlichen Kinetik zwischen optogenetischer Selbststimulation und pharmakologischer Induktion eines extrazellulären DA-Anstiegs liegen. Solche Unterschiede in der Suchtkraft können auch zwischen verschiedenen Drogen bestehen (George et al., 2014).

Obwohl wir formal nicht ausschließen können, dass Unterschiede in der DA-Freisetzung und/oder der relativen Signalübertragung zur Etablierung von Bestrafungsresistenz beitragen, ist dieses Szenario unwahrscheinlich, da die histologische Validierung der Infektion der in die Studie einbezogenen Tiere gezeigt hat eYFP-ChR2 Ausdruck im gesamten VTA. Darüber hinaus führte das optogenetische Stimulationsprotokoll zur Sättigung der DA-Freisetzung zu einer Selbststimulation, die in unimodal verteilten Werten für den Bruchpunkt gipfelte, was die Anreizmotivation widerspiegelte.

Ein weiteres überraschendes Ergebnis ist, dass die Anzahl der elektrischen Fußschocks mit der Erregbarkeit der Neuronen im PL korrelierte. Bei „süchtigen Ratten“ wurde eine verminderte Erregbarkeit von Pyramidenneuronen und ein erhöhtes AMPAR/NMDAR-Verhältnis in Pyramidenneuronen derselben Zellen beobachtet, diese Studien kontrollierten jedoch nicht die Wirkung von Elektroschocks per se (Kasanetz et al., 2010, Kasanetz et al., 2013, Chen et al., 2013). Die Nichtdissoziation kann daher durch die doppelte Rolle des mPFC sowohl bei Entscheidungsprozessen als auch bei der Angstintegration erklärt werden (Peters et al., 2009). Umgekehrt korreliert eine Veränderung der Erregbarkeit von Pyramidenneuronen im infralimbischen Kortex mit Fußstößen (Santini et al., 2008). Diese Beweise schließen die Möglichkeit nicht aus, dass mPFC eine herausragende Rolle bei der Entscheidung über die Aufnahmeverfolgung spielt. Unsere cFos-Analyse und Beobachtungen der intrinsischen Erregbarkeit deuten jedoch auf den OFC und den cingulären Kortex hin. Darüber hinaus verhinderte die Hemmung der neuronalen Erregbarkeit im OFC durch DREADD den Widerstand gegen Bestrafung. Dieser kausale Zusammenhang stellt einen wichtigen Schritt zum Verständnis der zellulären Mechanismen dar, die für den Übergang zur Sucht verantwortlich sind. Ob dies auch für das gesamte Suchtmittelspektrum gilt, muss in zukünftigen Studien geprüft werden.

Unsere Ergebnisse stehen im Einklang mit Beobachtungen, dass eine Funktionsstörung des OFC die Kosten-Nutzen-Entscheidungsfindung beeinträchtigen kann (Seo und Lee, 2010, Walton et al., 2010, Fellows, 2011) und zu zwanghaftem Verhalten führen kann (Burguière et al., 2013). ). Beim Menschen wurde Drogenmissbrauch mit einer beeinträchtigten Entscheidungsfindung und einer veränderten OFC-Funktion in Verbindung gebracht (Lucantonio et al., 2012, Gowin et al., 2013). Zusammengenommen erweist sich die Aktivität von OFC-Neuronen als Schlüsselfaktor für den Übergang zum zwanghaften Drogenkonsum (Everitt et al., 2007). Dies schließt eine Rolle der durch Medikamente hervorgerufenen Plastizität bei erregenden Afferenzen auf MSNs nicht aus, die hier und in anderen Studien beobachtet wurde (Kasanetz et al., 2010). Es wird interessant sein zu untersuchen, ob Manipulationen, die darauf abzielen, die Erregbarkeit des OFC zu kontrollieren, die Motivation von Süchtigen beeinflussen.

Hier schlagen wir die Selbststimulation von DA-Neuronen als leistungsstarkes Modell zur Untersuchung der zur Sucht führenden Stadien vor. Wir reproduzieren Kernkomponenten der Drogensucht, wie etwa Rückfälle, synaptische Plastizität und die Beharrlichkeit des Konsums trotz negativer Folgen. Während das Modell sicherlich nicht dazu geeignet ist, spezifische Wirkungen einer bestimmten Droge zu untersuchen (z. B. Opioid mit Psychostimulanzien zu vergleichen), bietet es mehrere Vorteile. Es ermöglicht eine präzise zeitliche Kontrolle der Belohnungsabgabe, es aktiviert sehr spezifisch nur die VTA-DA-Neuronen und nicht zuletzt bietet es die Möglichkeit, Mäuse über einen viel längeren Zeitraum zu untersuchen als bei der Selbstverabreichung von Medikamenten. Durch die Fokussierung auf die definierende Gemeinsamkeit von Suchtmitteln besteht die Hoffnung, die neuronalen Mechanismen zu entschlüsseln, die auch nicht substanzabhängigen Suchtformen zugrunde liegen (Alavi et al., 2012, Robbins und Clark, 2015) und so zu einer allgemeinen Theorie beizutragen die Krankheit. Optogenetische Krankheitsmodelle ermöglichen somit einen entscheidenden Schritt für ein umfassendes Verständnis der neuronalen Dysfunktion im Spätstadium der Sucht und werden als Leitfaden für neuartige, rationale Behandlungen für eine Krankheit dienen, die derzeit nicht heilbar ist.

Autorenbeiträge  

VP, JT und AH führten die Verhaltensexperimente durch, während VP die elektrophysiologischen Aufzeichnungen durchführte und die Analyse koordinierte. Die Studie wurde von allen Autoren entworfen und verfasst.

Anerkennungen  

Die Arbeit wurde durch Zuschüsse des Schweizerischen Nationalfonds und des ERC advanced grant (MeSSI), Carigest SA, der Akademischen Gesellschaft Genf und der Fondation Privée des Hopitaux Universitaires de Genève unterstützt. JT ist ein MD-Doktorand, der von der Schweizerischen Eidgenossenschaft bezahlt wird.

 

Zusätzliche Informationen 

Dokument S1. Ergänzende experimentelle Verfahren und Abbildungen S1-S6

Tabelle S1. Statistische Analysen