Differenziale Dopamin-Freisetzungsdynamik im Kern und in der Schale von Nucleus Accumbens zeigen komplementäre Signale für die Fehlervorhersage und die Motivationsmotivation (2015)

  1. Regina M. Carelli 2

+Mitgliedschaften anzeigen

Autorenbeiträge: Von MPS und FC entworfene Forschung; MPS und FC führten Forschungen durch; MPS und FC analysierten Daten; MPS, RMW und RMC schrieben die Zeitung.

Abstrakt

Mesolimbic Dopamin (DA) wird während des Appetitivverhaltens phasisch freigesetzt, obwohl hinsichtlich des spezifischen Zwecks dieser DA-Signale erhebliche Meinungsverschiedenheiten bestehen. Zum Beispiel deuten Vorhersagefehlermodelle (PE) auf eine Rolle des Lernens hin, während Anreizmodelle (IS) -Modelle argumentieren, dass das DA-Signal Stimuli mit Wert füllt und dadurch motiviertes Verhalten anregt. Innerhalb der Nucleus Accumbens (NAc) -Muster der DA-Freisetzung können sich jedoch die Unterregionen auffallend unterscheiden. Daher ist es möglich, dass diese Muster unterschiedlich zu Aspekten von PE und IS beitragen. Um dies zu beurteilen, haben wir die DA-Freisetzung in Unterregionen des NAc während einer Verhaltensaufgabe gemessen, bei der sequenziell zielgerichtete Reize räumlich zeitlich getrennt wurden. Elektrochemische Methoden wurden verwendet, um die Freisetzung von NAc-Dopamin im Sekundärteil in Kern und Schale während eines gut erlernten Instrumentenkettenplans zu messen, in dem Ratten trainiert wurden, um einen Hebel zu drücken (Suchen; SL), um Zugang zu einem zweiten Hebel (Einnahme; TL) zu erhalten, der mit verbunden ist Lieferung von Lebensmitteln und wieder während des Aussterbens. Im Kern war die phasische DA-Veröffentlichung nach der ersten SL-Präsentation am größten, für die nachfolgenden TL- und Belohnungsereignisse jedoch minimal. Im Gegensatz dazu zeigte phasic shell DA bei allen Aufgabenereignissen eine robuste Veröffentlichung. Die Signalisierung nahm zwischen dem Beginn und dem Ende von Sitzungen in der Shell ab, jedoch nicht im Kern. Während der Extinktion zeigte die Peak-DA-Freisetzung im Kern eine abgestufte Abnahme für die SL und Pausen in der Freisetzung während der erwarteten Belohnungen, während die Shell-DA-Freisetzung überwiegend während der TL abnahm. Diese Freisetzungsdynamik deutet auf parallele DA-Signale hin, die verschiedene Theorien des appetitiven Verhaltens unterstützen können.

BEDEUTUNG Die Dopamin-Signalgebung im Gehirn ist wichtig für eine Vielzahl kognitiver Funktionen wie Lernen und Motivation. Normalerweise wird davon ausgegangen, dass ein einzelnes Dopaminsignal ausreicht, um diese kognitiven Funktionen zu unterstützen, obwohl konkurrierende Theorien darüber uneinig sind, wie Dopamin zu belohnungsbasiertem Verhalten beiträgt. Hier haben wir festgestellt, dass die Echtzeit-Dopaminfreisetzung innerhalb des Nucleus accumbens (ein primäres Ziel von Mittelhirn-Dopamin-Neuronen) zwischen Kern- und Schalen-Subregionen auffallend variiert. Im Kern stimmt die Dopamindynamik mit lernbasierten Theorien überein (z. B. Fehler bei der Vorhersage von Belohnungen), wohingegen Dopamin in der Schale mit Motivationstheorien (z. B. Incentive Salience) im Einklang steht. Diese Ergebnisse zeigen, dass Dopamin mehrere und komplementäre Rollen spielt, die auf diskreten Schaltkreisen basieren, die Tieren helfen, belohnendes Verhalten zu optimieren.

Einleitung

Das Verständnis der Rolle von Dopamin (DA) -Signalen in Bezug auf Lernen, Verhalten und Sucht ist ein zentrales Thema in der Verhaltensneurowissenschaft. Zeitgenössische Theorien stimmen mit der anatomischen Organisation des mesolimbischen DA-Systems überein, bei dem eine relativ kleine Population von daergischen Neuronen im ventralen Tegmentalbereich (VTA) Kollateralen im gesamten Gehirn sendet, um Schaltkreise für Lernen und Handeln breit zu modulieren. Die jüngsten Beweise deuten jedoch darauf hin, dass die DA-Signalgebung möglicherweise heterogener ist als zuvor angenommen. Zum Beispiel wird die phasische DA-Freisetzung nach belohnungsvorhersagenden Hinweisen mit dem erwarteten subjektiven Belohnungswert im Kern des Nukleus accumbens (NAc), nicht jedoch mit der Schale (Day et al., 2010; Sugam et al., 2012). Im Gegensatz dazu sind Motivationsverschiebungen bei der hedonischen Verarbeitung von arzneimittelprognostischen Geschmacksstoffen auf phasische Änderungen bei der DA-Freisetzung in der NAc-Schale lokalisiert, nicht jedoch auf den Kern (Wheeler et al., 2011). Darüber hinaus haben wir und andere gezeigt, dass die DA-Freisetzung während erlernter Aufgaben Stimuli zwischen Kern und Hülle unterschiedlich codiert (Aragona et al., 2009; Owesson-White et al., 2009; Badrinarayan et al., 2012; Cacciapaglia et al., 2012). Anstelle eines globalen DA-Signals deuten diese Befunde darauf hin, dass DA differenziert und diskret auf bestimmte Zielregionen abgestimmt sein kann, um die Plastizität innerhalb definierter Schaltkreise zu unterstützen, die sich auf Lernen, Motivation und Aktion beziehen.

Die genauen Funktionen dieser heterogenen DA-Signale sind jedoch nicht gut verstanden. Ein einflussreiches Modell hat postuliert, dass DA ein Lehrsignal liefert, um assoziative Erwartungen hinsichtlich zukünftiger Ergebnisse zu generieren und um zu bestimmen, ob diese Vorhersagen zutreffend sind [Prognosefehler (PE)]. DA-Neuronen zeigen diese Art der Kodierung an (Schultz et al., 1997; Schultz und Dickinson, 2000; Waelti et al., 2001; Tobler et al., 2003), obwohl neuere Erkenntnisse bestätigen, dass im Wesentlichen alle optogenetisch identifizierten DA-Neuronen im VTA eine PE-Signalisierung zeigen (Cohen et al., 2012). Im Gegensatz dazu legen Incentive-Salience- (IS) -Modelle nahe, dass DA Stimuli mit geschätzten Verstärkern ausstatten und Motivation für diese Ergebnisse schaffen (Berridge und Robinson, 1998; Robinson und Berridge, 2008; Zhang et al. 2009; Berridge, 2012). Obwohl PE- und IS-Modelle ähnlich sind, treffen sie stark voneinander abweichende Vorhersagen für die DA-Funktion hinsichtlich ihrer Notwendigkeit in Bezug auf Lernen, Motivation und Drogensucht (Redisch, 2004; Tindell et al., 2009; Bromberg-Martin et al., 2010; Berridge, 2012).

Bei einfachen Konditionierungsaufgaben ist es schwierig zu wissen, welche phasische DA-Veröffentlichung die Kodierung vornimmt (dh, ob Belohnung vorhersagbar ist oder wie viel Aufklärung möglich ist?). Durch räumlich-zeitliche Isolation von prädiktiven und hervorstechenden Reizen innerhalb derselben Aufgabe ist es jedoch möglich, spezifische Lern- und Handlungsmerkmale zu analysieren, um Komponenten wie Anfangsvorhersagen, Konsumverhalten, Motivation und sogar das Aussterben zu isolieren. Um dieses Problem zu lösen, haben wir eine Instrumental-Chain-Schedule-Task verwendet, bei der Pressen auf einen Hebel (Suchhebel (SL)) den Zugriff auf Pressen auf einen zweiten Einnahmehebel (TL) gewährten, und Pressen auf den TL führten zur Lieferung von Lebensmitteln. Bei der schnellen Abtastung der cyclischen Voltammetrie (FSCV) zur Messung von Echtzeit-DA-Freisetzungsmustern im NAc-Kern oder in der Schale von gut trainierten Ratten differenzierten wir außerdem, wie sich aufgabenselektive Merkmale der DA-Kodierung in den NAc-Subregionen unterscheiden. Schließlich untersuchten wir, wie sich diese Signale dynamisch verschoben haben, wenn Aspekte der Motivation (Hunger) und der Vorhersage (Aussterben) geändert wurden. Wir beobachteten unterschiedliche Muster der DA-Freisetzung im Kern und in der Schale, die mit PE- bzw. IS-Modellen in hohem Maße übereinstimmten und im Allgemeinen die Idee mehrerer mesolimbischer DA-Signale unterstützen, die komplementäre, aber unterschiedliche Aspekte zielorientierten Verhaltens unterstützen können.

Materialen und Methoden

Tiere.

Zwölf männliche Sprague-Dawley-Ratten mit einem Gewicht von 280-330 g wurden als Probanden verwendet. Die Ratten wurden einzeln mit einem 12 h-Licht / Dunkel-Zyklus untergebracht, wobei die Futtermenge auf mindestens 90% des freien Futtergewichts beschränkt war (10 – 15 g Purina-Laborfutter täglich, zusätzlich zu ∼2.7 g Sucrose, die während der täglichen Sitzungen verbraucht wurde ). Für die Dauer der Verhaltenstests gab es eine Lebensmitteleinschränkung, außer während der postoperativen Erholungsphase, in der Lebensmittel nach Belieben gegeben wurden. Alle Verfahren wurden in Übereinstimmung mit der University of North Carolina in Chapel Hill durchgeführt.

Verhaltenstraining: Kettenplan.

Die Testkammern enthielten zwei einziehbare Hebel mit einem Cue-Light über jedem Hebel und einem Lebensmittelbehälter, der in gleichem Abstand zwischen den Hebeln angeordnet war, wie zuvor beschrieben (Cacciapaglia et al., 2012). Für jedes Subjekt wurde ein Hebel (z. B. links) der TL und der andere Hebel (z. B. rechts) für die Dauer aller Testsitzungen als SL bezeichnet. Die Seite von TL und SL wurde zwischen den Probanden ausgewogen.

Die Ratten wurden zuerst trainiert, um Saccharosepellets (45 mg, Purina) aus dem Nahrungsmittelbehälter zu erhalten. Während einer einzigen Vorschulungssitzung wurden 50-Pellets ungefähr einmal alle 30-Zellen zufällig geliefert. Die Ratten wurden daraufhin geschult, während einer einzigen täglichen Sitzung Saccharosepellets selbst zu verabreichen. Um die instrumentelle Reaktion zu formen, wurden die Tiere zuerst trainiert, um die TL zu drücken. Jeder Versuch während der Formgebung begann mit der Ausleuchtung eines Lichtschlags direkt über dem TL in Verbindung mit der Verlängerung des TL in die TestkammerO)]. Jeder Einnahmehebel drückt [TLP; Ein festes Verhältnis 1 (FR1)] innerhalb der Verlängerung von 15 führte zur Abgabe eines einzelnen Saccharosepellets (45 mg) in das Gefäß, zum Zurückziehen der TL und zum Abbruch des Cue-Light. Wenn Tiere den TL nicht innerhalb von 15 s gedrückt haben, wurde der Hebel zurückgezogen, das Cue-Licht erlischt und der Versuch als Auslassung gewertet. Die Studien wurden durch ein variables Intertrialintervall mit einem Durchschnitt von 15s (Bereich: 5 – 25s; Formungstage 1 und 2) getrennt und dann an den Formungstagen 45 – 3 (Bereich: 4 – 30) auf einen Durchschnitt von 60s erhöht s).

Nach der Etablierung stabiler Antworten auf den TL (dh nicht mehr als 2-Auslassungsfehler in einer Sitzung) wurde der Kettenzeitplan eingeführt (Abb.. 1 A), angepasst von Olmstead et al. (2000). Versuche während Kettenplanungssitzungen begannen mit der Erweiterung des SL und der gleichzeitigen Beleuchtung des Cue - Lichts direkt darüber (SLO). Jeder SLP (FR1) führte zum Rückzug des SL und zum Löschen des Cues, gefolgt von der Präsentation des TLO (Hebelverlängerung, Cue Light). Wie oben beschrieben, führten TL-Pressen zum Zurückziehen der TL, zum Löschen des Cue-Lichts und zur Abgabe eines Saccharosepellets an den Nahrungsmittelbecher. Die Studien wurden durch ein interaktives Intervall der Variablen 45 (Bereich: 30 – 60s) getrennt, und jede Sitzung bestand aus 30-Studien. Für den Tag 1 des Kettenfahrplans gab es keine Verzögerung zwischen dem Rückzug des SL und der Verlängerung des TL. An den folgenden Tagen wurde zwischen dem Zurückziehen der SL-Presse und dem Ausfahren des TL ein variables Intervall (VI) von 3-5s eingeführt. Außerdem wurde zwischen TL-Presse und der Lieferung der Saccharose-Verstärkung ein VI 1-3 eingeführt. Variable Verzögerungen wurden während des Trainings (dh alle Sitzungen vor den FSCV-Aufzeichnungen) verwendet, um die Fähigkeit von Ratten zu eliminieren, die Abgabe von Ereignissen vorherzusagen. Die Ratten wurden für 5 d mit diesem Kettenfahrplan trainiert oder bis sie eine stabile Leistung von zwei aufeinanderfolgenden Sitzungen zeigten, ohne dass der SL oder TL ausgelassen wurde. Danach wurden sie chirurgisch für die voltammetrische Aufzeichnung vorbereitet.

Verhaltenstraining: Aussterben.

Nach der letzten Aufnahmesitzung erloschen einige Tiere (Kernaufnahmen: n = 3; Shell-Aufnahmen: n = 7). Während des Aussterbens SLO Präsentationen zeigten den Beginn einer neuen Studie an. Die Versuche waren identisch mit denen der Testsitzung, bei der SL-Pressen zu Präsentationen des TL führtenO 4 s später, aber Pressen auf den TL wurden nicht verstärkt. Die Extinktionssitzungen wurden fortgesetzt, bis die Ratten auf die SL in aufeinanderfolgenden 10-Studien nicht mehr reagierten (Abb.. 1 B).

Vorherige Studien (Schoenbaum et al., 2003; Saddoris et al., 2005) haben gezeigt, dass neuronale Korrelate limbischer Aktivität sehr empfindlich auf Änderungen des Lern- und Motivationszustandes reagieren. Daher haben wir hier mit Antwortlatenzmarkern Blöcke für jedes Subjekt definiert (Abb.. 1 B). Der erste Block war das frühe Aussterben, bei dem die Antwortlatenz für einen SLP Die Antwort war der belohnten Sitzung ähnlich. Als nächstes der erste SLP Die Antwortlatenz, die mindestens um 2 SD länger war als während der zuvor belohnten Kettensitzung, markiert den Beginn von Delay Extinction. Schließlich befanden sich alle Versuche, die auf die erste unterlassene Antwort folgten, im späten Extinktionsblock und wurden danach gruppiert, ob die Ratte eine SL ausließP Antwort (spätes Nein drücken) oder wieder aufgenommen (spätes Drücken). Das gesamte Extinktionsverhalten wurde mit dem unmittelbar vorangegangenen verstärkten Kettenplan verglichen.

Chirurgische Maßnahmen.

Nach dem Verhaltenstraining wurden die Tiere wie zuvor beschrieben für voltammetrische Aufnahmen operativ präpariert (Cacciapaglia et al., 2012). Kurz gesagt, wurden Ratten mit einer intramuskulären Injektion von Ketaminhydrochlorid (100 mg / kg, im) und Xylazinhydrochlorid (20 mg / kg) gemischt. Eine Führungskanüle (Bioanalytical Systems) wurde entweder über der NAc-Schale (+ 1.7 mm AP, + 0.8 mm ML) oder dem Kern (+ 1.3 mm AP, + 1.3 mm ML) implantiert und eine bipolare Stimulationselektrode (Plastics One) eingesetzt der VTA (-5.2 mm AP, + 1.0 mm ML und -7.8 DV). Eine andere Führungskanüle für die Ag / AgCl-Referenzelektrode wurde in die kontralaterale Hemisphäre eingesetzt. Die Komponenten wurden mit Schrauben und cranioplastischem Zement am Schädel befestigt.

Voltammetrische Aufnahme.

Die hier verwendeten FSCV-Aufnahmetechniken waren wie zuvor ausführlich beschrieben (Cacciapaglia et al., 2012; Sugam et al., 2012). Kurz gesagt, nach der Operation konnten sich die Ratten auf ihr Körpergewicht vor der Operation (mindestens 5 d der Genesung) erholen. Am Tag des Experiments wurde eine Kohlefaser-Mikroelektrode mit einem lokal aufgebauten Mikrodrive (Chemistry Department Electronic Facility, Universität North Carolina, Chapel Hill, NC, USA) in die NAc-Schale oder den Kern abgesenkt, nachdem eine Ag / AgCl-Referenzelektrode eingesetzt wurde die kontralaterale Hemisphäre. Die Kohlenstoffaser-Mikroelektrode wurde bei -0.4 V gegen Ag / AgCl-Referenzelektrode gehalten. Periodisch wurde ein zyklisches Voltammogramm (100-ms-Intervalle) aufgenommen, indem eine dreieckige Wellenform angelegt wurde, die das Potential auf 1.3 V und zurück auf -0.4 V brachte. Vor Beginn jeder Aufnahmesitzung erhielten wir elektrisch hervorgerufene DA-Freisetzungsereignisse durch Treiben der bipolaren Stimulation Elektrode in der VTA und die resultierende DA-Freisetzung in der NAc aufgezeichnet. Wenn eine Stimulation beim Auslösen der DA-Freisetzung nicht erfolgreich war, wurde die Elektrode an einen neuen Ort abgesenkt und der Vorgang wurde wiederholt. Nachdem die elektrische Stimulation erfolgreich die DA-Freisetzung in der NAc ausgelöst hatte, wurde ein Trainingssatz der evozierten DA-Freisetzung unter Verwendung einer Kombination von Stimulationsfrequenzen (zwischen 10 und 60 Hz) und der Anzahl der biphasischen Impulse (von 4 bis 25) von der bipolaren VTA-Elektrode erstellt. In einer Teilmenge von Aufzeichnungen wurde nach dem Ende der Verhaltenssitzung ein zusätzlicher Trainingssatz erstellt, um die Elektrodenstabilität während der Sitzung sicherzustellen. In einer Untergruppe von Ratten (n = 9) Nach Aufzeichnung einer vollständigen Sitzung mit 30 Versuchen wurde die Elektrode um weitere 300 & mgr; m abgesenkt, bis eine andere Freisetzungsstelle gefunden wurde. Zu diesem Zeitpunkt wurde eine weitere Aufzeichnung für eine weitere Sitzung mit 30 Versuchen durchgeführt. Die Analyse der FSCV-Daten (HDCV-Analyse) verwendete eine chemometrische Hauptkomponentenanalyse, um Änderungen des Stroms aufgrund von DA unter Verwendung des elektrisch stimulierten Trainingssatzes jedes Probanden aus der zugehörigen Aufzeichnungssitzung zu extrahieren, die vor dem Testen gesammelt wurde, wie zuvor beschrieben (Heien et al., 2005; Keithley et al., 2010). Für jede Region (Kern und Hülle) wurde eine durchschnittliche DA-Konzentrationskurve an jedes Verhaltensereignis angepasst und mit der durchschnittlichen DA-Konzentration über einer 5-Grundlinie unmittelbar vor SL verglichenO Beginn unter Verwendung einer bidirektionalen gemischten Modell-ANOVA (Faktoren: Ereignis, Region) zu Probendurchschnitten.

Für Extinktionssitzungen wurden DA-Spuren ebenfalls an den Verhaltensereignissen ausgerichtet. Da aber viele SLO Auf die Präsentationen folgte keine Presse in Extinktion, es wurden zwei verschiedene Analysen verwendet. Zum einen wurden DA-Spuren an SL ausgerichtetO und gruppiert nach Phase des Aussterbens (siehe Abb.. 6) und unter Verwendung einer wiederholten Zwei-Wege-Messung unter Verwendung der Extinktionsphase und des Stimulusereignisses als Faktoren analysiert. Für die zweite Analyse nur Versuche, in denen die Ratte den TL drückteP wurden verwendet und die Peak-DA-Konzentrationen (dh die maximale DA-Freisetzung innerhalb von 300 ms nach dem Ereignis) wurden für beide TL erhaltenP und Belohnung, und ebenfalls analysiert mit einer Zweiweg-ANOVA mit wiederholten Messungen unter Verwendung der Extinktionsphase und des Stimulus der Aufgabe als Faktoren. Alles Post-hoc- Paarweise Vergleiche wurden unter Verwendung von Tukeys HSD durchgeführt, korrigiert um Ungleichheit N wenn angemessen. Alle statistischen Analysen wurden mit Prism 4.0 für Windows (GraphPad Software) oder Statistica für Windows (StatSoft) durchgeführt.

Histologie.

Nach jedem Experiment wurden Ratten mit einer Mischung aus Ketamin (100 mg / kg) / Xylazin (20 mg / kg) (im) tief anästhesiert. Eine Wolframelektrode, die in demselben Mikromanipulator untergebracht war, der während des Experiments verwendet wurde, wurde zur experimentellen Aufzeichnungsstelle abgesenkt und eine kleine elektrolytische Läsion (50 – 500 μA, 5s) zur Markierung der Position der Elektrodenspitze hergestellt. Mehrere Läsionen wurden gemacht, wenn mehrere Aufnahmen gemacht wurden. Jedes Gehirn wurde entfernt, in 4% Formaldehyd fixiert und dann zu -80C gefroren, bevor es mit einem Kryostat in koronale 40-µm-Abschnitte geschnitten wurde. Die Schnitte wurden auf Dias montiert, mit Hellfeldmikroskopie betrachtet und digital abgebildet (Abb.. 1 C).

Vergleich der stimulierten und ereignisaktivierten DA-Freisetzung in Core und Shell.

Es war möglich, dass die beobachteten Unterschiede zwischen der DA-Freisetzung von Core und Shell für Verhaltensereignisse nicht auf Unterschiede in der Release-Dynamik zurückzuführen waren, sondern auf Unterschiede in der Kinetik der DA-Clearance zwischen den Regionen. Beispielsweise ist die striatale DA-Freisetzungs- und Aufnahmedynamik in der Hülle langsamer als der Kern, da die Dichte des Dopamin-Transporters in der Hülle geringer ist (Jones et al., 1996; Budygin et al., 2002). Unterschiede zwischen Core und Shell bei späteren Ereignissen (z. B. TLOBelohnung) könnte durch die Persistenz der restlichen DA in der synaptischen Region in der Schale erklärt werden.

Um diese Bedenken auszuräumen, haben wir die durch Verhaltensereignisse (z. B. SL) hervorgerufenen DA-Freisetzungs- und Aufnahmemuster verglichenO) während der Kettenplanaufgabe an DA, die durch einen kurzen Ausbruch der elektrischen Stimulation von VTA-Afferenzen ausgelöst wurde. Ursprünglich wurde eine elektrische Stimulation (2 ms zweiphasige Impulse) von VTA-Fasern über ein breites Spektrum von Stimulationsfrequenzen (10–60 Hz) und Impulszahlen (4–25 Impulse) durchgeführt, um ein vollständiges Spektrum der Freisetzungsdynamik zum Aufbau eines zu erhalten chemometrisches Trainingsset. Daher war eine große Anzahl elektrischer Stimulationen wesentlich größer (z. B. 2000 nm) als bei natürlich vorkommenden Transienten (typischerweise 40–150 nm). Bei extrem hohen Konzentrationen der DA-Freisetzung ist es möglich, dass der DA-Transporter gesättigt wird, was zu einer langsameren Clearancekinetik führt als im normalen Bereich. Um dies direkt anzugehen, haben wir nur Versuche zur elektrischen Stimulation ausgewählt, bei denen die maximale DA-Freisetzung <200 nm war. Ebenso haben wir nur Verhaltensstudien ausgewählt, bei denen die maximale DA-Freisetzung auf den SL ausgerichtet warO war mindestens 100 nm. Für jedes Subjekt wurden alle in Frage kommenden Studien für die Analyse gemittelt. Unter Verwendung dieser Metrik erhielten wir elektrische Stimulationen für 23 und 15-Cue-evozierte Sitzungen im Core sowie elektrische 14-Stimulationen und 11-Cue-evozierte Sitzungen in der Shell.

Vergleiche der Freisetzung von Queues gegenüber elektrisch hervorgerufenem DA wurden mit mehreren Metriken durchgeführt. Erstens wurde Peak DA aus den Verhaltensereignissen bei SL abgeleitetO (dh größte DA-Konzentration innerhalb von 1.5 s SLO Beginn), TLO (größte DA-Konzentration zwischen 4 und 5.5 nach SLO Beginn) und Belohnung (größte DA-Konzentration zwischen 6.5-8 nach SLO Beginn) für Cue-Ereignisse und zu den entsprechenden Zeitpunkten für elektrisch stimulierte Ereignisse (dh zu denselben Zeitpunkten, jedoch nach Stimulationsbeginn statt nach SL)O Beginn). Als nächstes wurde die Clearance-Dynamik anhand zuvor veröffentlichter Metriken untersucht (Yorgason et al., 2011). Speziell untersuchten wir die Latenz bis zur Halbwertzeit (Konzentration der halben Peaks) nach dem Peak. T 20 (die Zeit für 20% Abnahme vom Peak) und T 80 (Zeit für 80% Abnahme vom Peak). Diese Werte wurden unter Verwendung einer ANOVA mit gemischten Modellen unter Verwendung des Stimulationstyps (Kern, Schale) der Region (SL) verglichenO ausgerichtet, elektrisch stimuliert) als Subjektfaktoren und entweder DA-Konzentration bei jedem Ereignistyp (Basislinie, SLO, TLOund Belohnung) oder Verfall (Latenzzeiten T 20Halbwertszeit und T 80jeweils) als wiederholte Messungen. Post hoc Vergleiche wurden unter Verwendung von Tukeys HSD für ungleich durchgeführt N.

Die Ergebnisse

Verstärktes Kettenfahrverhalten

Ratten lernten schnell die Kettenplanaufgabe. Bei der abschließenden Voroperationssitzung haben Ratten 99.8% der Studien im Durchschnitt genau abgeschlossen. Während dieser Sitzungen nahmen Ratten im Durchschnitt 783 ± 253 ms ein, um nach SL zu drückenOund 588 ± 298 ms nach TL drückenO, ein Unterschied, der fast signifikant war, t (17) = 1.77, p = 0.085 An postoperativen Aufnahmetagen machten Ratten jedoch fast keine Auslassungen (99.5%), zeigten jedoch deutlich schnellere Antwortlatenzen für TLP (999 ± 64 ms) als SLP (444 ± 39 ms), t (29) = 7.48, p <0.0001. Wichtig ist, dass an den Tagen der Aufzeichnung keine Unterschiede in der Reaktionsverzögerung für in der Schale aufgezeichnete Tiere gegenüber dem Kern auftraten. t (29) = 0.78, p = 0.48. Somit waren Ratten in beiden Gruppen (Kern und Hülle) gleichermaßen kompetent, den Kettenplan zu vervollständigen, wenn die Aufgabe verstärkt wurde.

Differenzielle DA-Freisetzung in NAc-Kern und -schale während eines verstärkten Kettenplans

Als Nächstes haben wir FSCV verwendet, um Echtzeit-DA-Aufnahmen vom NAc-Kern zu erhalten (n = 13) oder Shell (n = 12) während der Performance auf dem gut erlernten Kettenplan (Abb.. 1 C). Bei Ratten, bei denen mehrere Aufnahmen gemacht wurden, wurde die Elektrodenspitze zwischen den Sitzungen um mindestens 300 μm abgesenkt, um sicherzustellen, dass sich die 100 μm-Kohlefaser-Elektrodenspitze für jede Aufzeichnung vollständig in frischem Gewebe befand. Mit beiden übereinstimmend PE und IS Bei den Modellen fanden wir eine robuste phasische DA-Veröffentlichung, die mit dem Einsetzen des SL und dem Cue-Light (SL) begannO) in Kern und Schale. Beispiele für diese Signalisierung aus repräsentativen Aufnahmesitzungen (gemittelt über 30-Versuche) werden für den Kern gezeigt (Abb.. 2 A) und Schale (Abb.. 2 B), mit Farbdarstellungen eines einzelnen Tieres. Die DA-Signalisierung unterschied sich auffallend zwischen den Teilregionen. Bei allen Ratten im Kern (Abb.. 2 C – E(schwarze Spuren), DA erreichte zu Beginn des vorhersagenden Cues (SLO Beginn) und ging dann zum Zeitpunkt des TL schnell auf die Grundlinie zurückP. Im Gegensatz dazu in der Schale (Abb.. 2 C – E(graue Spuren) fiel der schnelle Anstieg der DA-Konzentration mit SL zusammenO Präsentation und blieb für andere motivational hervorstechende Stimuli mit diskreten Peaks bei TL erhöhtO und Belohnung, bevor Sie am Ende der Testphase wieder zur Basislinie zurückkehren.

Abbildung 1. 

A , Schema des Aufgabenentwurfs. Während des Kettenfahrplans wurde ein Hebel (SL) gleichzeitig in die Testkammer ausgefahren, während ein Cue-Licht über dem Hebel (SL) beleuchtet wurdeO). SLP löschte das Licht und zog den Hebel zurück. Nach einer Verzögerung wurde der andere Hebel in der Kammer (TL) ausgefahren und das dazugehörige Cue-Licht beleuchtet (TLO). Nach einer Presse auf dem TL (TLP) Ratten erhielten nach einer Verzögerung (R) eine Nahrungsverstärkung. B , Extinktionsverhalten bei Tieren mit FSCV-Aufzeichnungen im Kern oder in der Schale. Das Verhalten und die Analyse beim Aussterben wurden basierend auf dem Verhalten der Ratte nach Blöcken gruppiert. Versuche in der unmittelbar vorhergehenden Kettenaufgabe wurden verwendet, um Ereignisse in Extinktion zu vergleichen. Das frühe Aussterben war alle Versuche bis zur ersten signifikanten Verzögerung der Reaktion auf dem SL, während das verzögerte Aussterben alle Versuche zwischen dem ersten verzögerten SL warenP und die erste ausgelassene Presse nach SLO Präsentation. Innerhalb des Spätlöschblocks wurde unterschieden, ob das Subjekt eine Presse machte oder eine Antwort ausließ. C , Histologie der Elektrodenplatzierung im Kern (schwarze Kreise) und mediale Schale (graue Kreise).

Abbildung 2. 

Die Performance des verketteten Zeitplans führte zu unterschiedlichen DA-Freigabedynamiken innerhalb des NAc. Dopamin-Freisetzungsdynamik im Kern ( A ) und Schale ( B ) des NAc ausgerichtet auf den Zeitpunkt der SL-Verlängerung in die Kammer (SLO). Farbdarstellungen zeigen jeweils Durchschnittswerte eines repräsentativen Themas im Kern bzw. in der Hülle. Durchschnittliche Zeit (▴) der TL-Erweiterung (TLO) und Belohnung (R) und Bereich (± 2 SD) relativ zu SLO sind unten gezeigt. C - E , Acrossubjektiv bedeutet, dass die DA-Veröffentlichung für alle Aufnahmen in Core (schwarz) und Shell (grau) relativ zu ( C ) SLO, ( D ) SLPund die Erweiterung des TLO 4 s später und ( E ) TLPund das Belohnungspellet (R) lieferte 2.5 nach dem Pressen. Eine gestrichelte Linie zeigt den SEM des Durchschnitts für jede Region. Untere Reihe ( F - H ) zeigt die durchschnittliche Peak-DA-Freisetzung für jedes Verhaltensereignis. *p <0.05 gegenüber der Grundlinie; †p <0.05 Kern gegen Schale.

Wir haben diese Beobachtungen quantifiziert, indem wir den Durchschnitt aller Aufnahmen berechnet, die entweder im Kern oder in der Hülle aufgenommen wurden, und zwar an jedem der Verhaltensereignisse im Kettenplan (Abb.. 2 CH). In den FSCV-Aufnahmesitzungen ist die Zeit zwischen SLP und TLO wurde behoben (4 s) sowie die Zeit zwischen TLP und Belohnungsabgabe (2.5-Werte), um eine bessere Ausrichtung der Aufgabenreize für die DA-Analyse zu ermöglichen. Also auf SL ausrichtenO, SLP/ TLOund TLPDie Belohnung erlaubte die Ausrichtung aller Verhaltensmarker und die Analyse der Peak-DA-Freisetzung in Bezug auf diese Ereignisse.

Eine bidirektionale ANOVA, bei der der Peak (maximale DA-Konzentration innerhalb von 300 ms nach dem Ereignis) die DA-Konzentrationen über die Region (Kern, Schale) und das Ereignis (Basislinie, SLO, SLP, TLO, TLP, Belohnung) gab an, dass die Shell insgesamt mehr DA als der Kern freigegeben hat, F (1,24) = 13.63, p <0.002. Wichtig ist eine signifikante Wechselwirkung von Region × Ereignis, F (5,120) = 9.88, p <0.0001 ergab, dass die DA-Signalisierung in Kern und Hülle unterschiedlich auf die Verhaltensereignisse reagierte (Abb.. 2 F – H). Insbesondere wurde die Kern-DA-Veröffentlichung bei SL signifikant erhöhtOrelativ zur Basislinie (p <0.0001) und blieb zum Zeitpunkt der SL über der GrundlinieP (p <0.0001), wenn auch deutlich darunter bei SLO (p <0.05). Es gab jedoch keine Unterschiede in der Spitzen-DA im Kern im Vergleich zur Basislinie für beide TL-Ereignisse (TL)O gegen Basiswert, p = 0.59; TLP gegen Basiswert, p = 1.0) und keine Differenz zum Ausgangswert zum Zeitpunkt des Erhaltes der Prämie (p = 1.0).

Im Gegensatz dazu zeigten die maximalen DA-Konzentrationen in der Schale für alle Ereignisse eine signifikante DA-Freisetzung. Alle Ereignisse waren mit einer größeren DA-Freisetzung als der Baseline verbunden (alle Vergleiche vs. p <0.0002), während sich keines der Ereignisse signifikant voneinander unterschied (alle paarweise SLO, SLP, TLO, TLPund Belohnungsvergleiche p > 0.96).

Beim direkten Vergleich von Core und Shell fanden wir wichtige Unterschiede in der DA-Signalgebung zwischen Regionen. Zwar gab es keine Unterschiede in der DA-Freisetzung während der beiden Baseline (p = 1.0) oder die SL-Ereignisse (SLO, p = 1.0; SLP, p = 0.22), Shell-DA war im Vergleich zum Core für beide TL-Ereignisse (TLO, p <0.01; TLP, p <0.001) und Belohnung (p <0.0005; Abb.. 3 D-F).

Abbildung 3. 

Änderungen der DA-Signalisierung zwischen dem Beginn der Sitzung (früh (erste 5-Versuche des Kettenfahrplans) und dem Ende der Sitzung (spät; letzte 5-Versuche). A Durchschnittliche DA-Konzentrationen im NAc-Kern aus den Durchschnittswerten der ersten fünf Versuche jedes Probanden (hellblau) und der letzten fünf Versuche (lila). B , Im Kern war die maximale DA-Signalisierung innerhalb der Probanden zwischen dem Beginn der Sitzung und dem Ende unverändert. C Durchschnittliche DA-Konzentrationen in der NAc-Schale aus den Durchschnittswerten der ersten fünf Versuche jedes Probanden (rot) und der letzten fünf Versuche (orange). D , Shell DA zeigte bei beiden SL einen signifikanten Rückgang innerhalb der ProbandenP und TLP Hinweise und Belohnung (**p <0.01), während die Abnahme am SLO Cue war fast signifikant (#p = 0.073). Fehlerbalken zeigen den SE-Unterschied (früh vs. spät).

Regionale Änderungen der DA-Freigabe zwischen Sitzungsbeginn und -ende

Als Nächstes verglichen wir die DA-Veröffentlichung in Core und Shell während der verstärkten Kettenzeitplanaufgabe zu Beginn der Sitzung (erste 5-Versuche) mit dem Ende der Sitzung (letzte 5-Versuche; Abb.. 3). Dies war wichtig, um zu testen, ob die Elektrode während der gesamten Sitzung stabil war (dh, dass die Elektrode im Laufe der Zeit nicht an Empfindlichkeit verlor), und um zu beurteilen, ob DA subtile Änderungen des Motivationszustands (z. B. aufgrund von Effekten) aufzeichnet verminderten Hungers nach dem Verzehr der Nahrung) nach Präsentation der verschiedenen Reize.

Im Kern (Abb.. 3 A), eine bidirektionale ANOVA zeigte einen signifikanten Haupteffekt des Ereignisses (BL, SLO, SLP, TLO, TLP, Rew; F (5,65) = 35.03, p <0.0001), aber keine Auswirkung der Sitzungsphase (früh gegen spät; F (1,13) = 3.55, p = 0.08) oder Interaktion zwischen Ereignis × Sitzungsphase (F (5,65) = 0.82, p = 0.54). Post hoc Vergleiche zwischen frühen und späten Blöcken zeigten, dass die Peak-DA-Freisetzung im Verhältnis zu den Verhaltensereignissen im Kern zwischen Beginn und Ende der Sitzung gleich blieb (Tukey: alle frühen und späten paarweisen Vergleiche für BL, SL.)O, SLP, TLO, TLPund belohnung p > 0.50; Abb.. 3 B).

Die phasische DA-Freisetzung zu Aufgabenreizen nahm jedoch im Allgemeinen während der Sitzung in der Schale ab (Abb.. 3 C,D), mit wesentlichen Auswirkungen des Ereignisses (F (5,55) = 13.52, p <0.0001), Sitzungsphase (F (1,11) = 6.95, p = 0.02) und eine Interaktion zwischen Ereignis- und Sitzungsphase (F (5,55) = 3.74, p = 0.006). Wie im Kern Post-hoc- Tests zeigten keinen Unterschied bei BL, aber eine signifikante Abnahme der DA-Freisetzung an das SLP, TLPund Belohnung (Tukey: alle p <0.0005), ein Trend zur Signifikanz bei der SLO Stichwort (p = 0.060), aber kein Unterschied am TLO Stichwort (p = 0.36). Daher beschränkten sich Änderungen in der Hülle (aber nicht im Kern) hauptsächlich auf motivierte Aktionen und den Belohnungskonsum mit unterschiedlichen (wenn auch bescheidenen) Effekten. Diese sitzungsübergreifenden Verschiebungen der DA-Freisetzung waren nicht auf allgemeine Änderungen der Elektrodenempfindlichkeit zurückzuführen, sondern legen nahe, dass stimulus- und schalenspezifische Änderungen der DA-Freisetzungsmuster Informationen über die veränderte Bedeutung von Aufgabenstimuli in wiederholten Versuchen anzeigen. Angesichts der Tatsache, dass die Tiere am Ende jeder Aufzeichnungssitzung durchschnittlich mindestens 25 Pellets konsumiert hatten (dh 1144 mg oder 7.6% des Gewichts des täglichen, auf Lebensmittel beschränkten Regimes der Ratten), deuten diese Ergebnisse auf eine erhöhte Aufnahme des Futters hin reduzierte erfolgreich den motivierten Hungerzustand des Tieres, der sich in Veränderungen in der Schale, aber nicht im Kern im Verlauf der Sitzung manifestierte.

Cue-evozierte vs. elektrisch stimulierte DA-Dynamik in Core und Shell

Ein Nachteil dieser Erkenntnisse ist, dass der Kern und die Hülle aufgrund der geringeren Dichte des DA-Transporters in der Hülle im Vergleich zum Kern eine unterschiedliche DA-Clearance aufweisen (Jones et al., 1996; Budygin et al., 2002). Daher ist es möglich, dass Shell-DA bei TL- und Belohnungsereignissen auf die verbleibende DA-Freigabe zum Zeitpunkt von SL zurückzuführen istO, kann jedoch nicht so effizient wie im Kern aus dem synaptischen Überlauf gelöscht werden. Um dem zu begegnen, haben wir die elektrisch stimulierte DA-Freisetzung an derselben Elektrodenposition wie bei den Aufzeichnungen des Kettenplans verglichen, um zu sehen, ob die elektrisch stimulierte Dynamik mit der durch Cue hervorgerufenen Dynamik in Kern und Schale übereinstimmt (Abb.. 4 A). Wir haben vorhergesagt, dass, wenn die langsamere Clearance-Kinetik in der Hülle für die Unterschiede in der nachfolgenden Ereignissignalisierung (z. B. TL) verantwortlich istO) zwischen Kern und Schale, dann sollte die elektrisch stimulierte und durch Cue hervorgerufene Freisetzung in ihren jeweiligen Subregionen nahezu identischen Freisetzungs- und Clearance-Mustern folgen. Im Gegensatz dazu deuten signifikante Abweichungen von elektrischen Stimulationen darauf hin, dass die DA-Freisetzung in diesem Bereich aufgabenbezogene Ereignisse auf eine Weise verfolgt, die nicht allein durch die synaptische Clearance-Dynamik erklärt werden kann.

Abbildung 4. 

Vergleich der elektrisch stimulierten gegenüber der durch Cue hervorgerufenen DA-Signalisierung im NAc-Kern und der Schale. A , Die durchschnittliche Konzentration von DA ist entweder auf den SL ausgerichtetO Cue oder elektrische Stimulation des Beginns der VTA-Faser. Der Zeitpunkt des Beginns der TLO Cue und Belohnung wurden anhand einer Reihe von Antwortzeiten für die Ergebnisse nach SL geschätztO (mittlere Antwortzeit durch Dreieck angegeben; Breite bedeutet ± 95% -Konfidenzintervall). B , Vergleich der durchschnittlichen DA-Basiskonzentration (BL) mit der maximalen DA-Konzentration innerhalb der 1-Werte von SLO oder elektrische Stimulation (Stim / SLO) und innerhalb des 95% -Konfidenzintervallbereichs für die dem TL entsprechenden ZeitenO oder belohnen Epochen. C Latenz bis Spitzenkonzentration nach SLO oder elektrische Stimulation (Peak Lat) und nachfolgendes Abklingen (Clearance) nach Freisetzung in Kern und Schale. T20 und T80 sind die Zeiten, zu denen das Signal 20% bzw. 80% vom Peak entfernt ist, während die Halbwertszeit die Latenz ist, die auf den Peak bis zum Erreichen der halben Peakkonzentration folgt. *p <0.0001, elektrische Stimulation / SLO gegenüber dem Ausgangswert; †p <0.0001, Shell: Cue größer [DA] als alle anderen Stimulationstypen; ‡ p <0.0001, Shell: Weisen Sie auf eine höhere Latenz hin, um vom Peak abzufallen als bei allen anderen Stimulationstypen. Fehlerbalken zeigen die SE des Unterschieds (Cue vs Electric).

Insgesamt stellten wir fest, dass Kern und Hülle sich in ihrer Beziehung zwischen der durch Cue und elektrisch hervorgerufenen DA-Freisetzung stark unterscheiden (Abb.. 4 B). Betrachtet man die Spitzenkonzentrationen bei Aufgabenereignissen, so gab es signifikante Unterschiede bei den DA-Konzentrationen als Wechselwirkung zwischen Region (Kern / Schale) × Stimulationstyp (elektrisch vs. Queue) × Ereignis (BL, SLO, TLO, Rew; F (3,174) = 12.31, p <0.0001). Im Kern waren die maximalen DA-Konzentrationen für Cue-evozierte und elektrisch stimulierte Spuren nahezu identisch; Es gab keine statistischen Unterschiede zwischen diesen Stimulationstypen zu Studienbeginn, SLO, TLOoder belohnen Epochen (Tukey: alle p > 0.80). Im Gegensatz dazu zeigte die Schale ein unterschiedliches Dynamikmuster zwischen elektrisch und Cue-evozierten DA-Freisetzungsmustern. Es gab jedoch keinen Konzentrationsunterschied zu Studienbeginn oder SLO (Tukey: beide p > 0.98) war DA für die TL signifikant größerO und belohnen Epochen in den Cue - Studien im Vergleich zu den elektrischen Stimulationen (beide p <0.0001).

Auch die Freisetzungsrate und die anschließende Clearance aus der Synapse zeigten ein ähnliches Muster (Abb.. 4 C). Betrachtet man die Clearance-Raten als Funktion des Abfalls vom Peak, so bestand eine signifikante Wechselwirkung zwischen Region × Stimulationstyp × Decay-Parameter (Peakzeit, T20Halbwertzeit, T80; F (3,174) = 80.23, p <0.00001). Wie oben unterschieden sich die Kernclearance und die Zerfallsdynamik nicht zwischen Cue-evozierten und elektrisch evozierten Stimulationstypen. Die Latenz bis zur Spitze, T 20Halbwertszeit und T 80 waren alle statistisch ähnlich, unabhängig vom Stimulationstyp (elektrisch vs. p > 0.95). Im Gegensatz dazu zeigten die DA-Spiegel in der Schale einen signifikant verzögerten Abfall zur Grundlinie nach SLO Präsentationen in Bezug auf elektrisch stimulierte Studien. Während der Latenz bis zur Spitze und T 20 waren ähnlich zwischen anregenden und elektrisch hervorgerufenen Stimulationen (p > 0.98), Latenz bis zur Halbwertszeit (p <0.0001) und T 80 (p <0.0001) waren in den Cue-Versuchen im Vergleich zur elektrischen Stimulation signifikant verzögert. Zusammengenommen zeigen diese Ergebnisse, dass intrinsische Unterschiede in der Clearancekinetik in der Schale und im Kern nicht ausreichen, um Unterschiede in der DA-Signalübertragung während der Verhaltensleistung zu erklären.

Extinktionsverhalten

Ratten zeigten während der Sitzungen ein Extinktionsverhalten, wenn die Futterbelohnung weggelassen wurde, indem die Latenzzeit zum Drücken der verschiedenen Hebel im Verlauf der Extinktionssitzung schrittweise erhöht wurde. Wir haben verhaltensdefinierte Phasen basierend auf diesen Latenzverschiebungen relativ zur Drucklatenz auf SL und TL während der unmittelbar vorhergehenden Sitzung mit verstärkter Kette generiert. Die frühe Phase wurde als die Versuche definiert, bei denen die Latenzen die gleichen waren wie während der verstärkten Sitzung. Wenn die Ratten den Hebel signifikant langsamer drückten (dh> 2 SD) als normal, wurde dies als Verzögerungsphase bezeichnet, die von der ersten verzögerten Reaktion bis zum Auslassen einer Reaktion durch das Subjekt dauerte. Alle Versuche nach dieser ersten Auslassung wurden als späte Phase bezeichnet, basierend darauf, ob die Ratte drückte (späte Presse) oder eine Antwort ausließ (späte keine Presse).

Zuerst haben wir die Anzahl der durchgeführten Versuche untersucht, bevor die Ratten eine Latenzverschiebung von der Frühphase in die Verzögerungsphase zeigten, sowie die Anzahl der Versuche bis zur ersten ausgelassenen Studie (dh Versetzung in die späte Phase) für SL bzw. TL (Abb.. 5 A). Ratten verlangsamten die Reaktion auf die TL, bevor sie für die SL eine Paarung zeigten t Test: t (7) = 2.49, p = 0.04, was darauf hindeutet, dass der TL (vielleicht aufgrund seiner unmittelbaren Beziehung zur Belohnung) empfindlicher für die Belohnung von Belohnungen war als der SL. Im Gegensatz dazu war die Anzahl der Versuche vor der ersten Unterlassung sowohl für SL- als auch für TL-Hebel nahezu identisch (p > 0.9), was möglicherweise darauf hinweist, dass ausgelassene Antworten nur ausgegeben wurden, wenn die Vorhersage der Belohnung zu Beginn des Versuchs genau auf Null aktualisiert worden war. In Übereinstimmung damit fanden wir selten Versuche, bei denen Tiere eine SL durchführtenP aber ein nachfolgendes TL weggelassenP Reaktion (nur 4 / 140-Gesamtversuche in der späten Phase; 2.9%), was darauf hindeutet, dass Ratten fast ausschließlich entweder die gesamte Kettensequenz oder überhaupt nicht durchführten. Insofern waren Auslassungen wahrscheinlich mehr mit den im SL verfügbaren Informationen verbunden als mit TL.

Abbildung 5. 

Extinktionsverhalten bei Tieren mit FSCV-Aufnahmen im Kern oder in der Hülle. A Die Anzahl der Studien vor Ratten zeigte einen signifikanten Anstieg der Antwortlatenz, um sich von der frühen Phase der Extinktionsphase (links) zu verschieben und die Reaktion (rechts) für SL (hellgrau) und TL (dunkelgrau) zu verzögern. Ratten zeigten eine Latenzverschiebung für die TL in deutlich weniger Versuchen als die SL, obwohl die Anzahl der Versuche, bevor eine Studie ausgelassen wurde, zwischen Ansuchen und Antworten gleich war. *p <0.05 SL gegen TL. B , Antwortwartezeit für die Antwort auf den SL (links) und den TL (rechts) über die Extinktionsphasen hinweg. Die Antwortlatenz nahm über die Blöcke hinweg zu und war in den Verzögerungs- und Spätauslöschungsblöcken für die SL-Pressen signifikant länger. Die Pressen des TL waren innerhalb eines Blocks zuverlässig schneller als die des SL. *p <0.05, **p <0.01 vs frühe ext.

Als nächstes haben wir die durchschnittlichen Latenzen für den SL untersuchtP und TLP in jeder Phase basierend auf den oben genannten Kriterien. Eine zweifache ANOVA mit wiederholten Messungen, bei der die Antwortlatenz der verschiedenen Hebel (SL, TL) in verschiedenen Phasen der Aufgabe (Kette, frühes Aussterben, verzögertes Aussterben, spätes Drücken) verglichen wurde, zeigte einen signifikanten Haupteffekt des Hebels (F (1,4) = 45.7, p = 0.003), was auf wesentlich schnellere Antworten auf den TL als auf den SL zurückzuführen ist (Abb.. 5 B), im Einklang mit der Leistung bei typischen verstärkten Sitzungen und einem signifikanten Haupteffekt der Extinktionsphase (F (3,12) = 14.5, p <0.001). Für den SL, SLP Die Reaktionen während des frühen Aussterbens waren ähnlich wie bei der verstärkten Kettensitzung (Tukey: p = 1.0), wird jedoch durch die Verzögerung erheblich verlangsamt (p = 0.02 vs. Early) und Late Press (p = 0.003 vs. frühe) Phasen. Die Latenzzeiten der Presse auf dem SL waren jedoch zwischen Verzögerung und Spätphase ähnlich (p = 0.89). Bei TL-Pressen waren die Reaktionslatenzverschiebungen subtiler, wobei die Late-Phase deutlich langsamer war als die frühe (p = 0.04). Ein linearer Kontrast machte jedoch den größten Varianzanteil bei der TL-Latenzverschiebung aus (F (1,4) = 11.08, p = 0.03; 86% der Haupteffektvarianz), während für den SL der Vergleich der Kette und der frühen gegenüber den Verzögerungs- und Spätphasen den größten Anteil der Effektvarianz ausmachten (F (1,4) = 15.42, p = 0.02; 97% der Haupteffektvarianz).

Extinktion: Ergebnis entfällt differenziert die DA-Signalisierung von Core und Shell

Die ereignisbezogene DA-Signalisierung in der NAc verschob sich, als die Ratte die verhaltensmäßig definierten Extinktionsphasen durchlief. Die Art und Weise, in der die DA-Kodierung durch Extinktion beeinflusst wurde, variierte auffallend zwischen Kern und Hülle (Abb.. 6).

Abbildung 6. 

DA-Veröffentlichung im Kern ( A - C ) und Schale ( D - F ) während des Aussterbens. A , Ausrichtung auf den SLO im Kern zeigte sich eine kontinuierliche Abnahme der Kern-DA-Freisetzung gegenüber den iterativen Extinktionsversuchen (blaue Linien) im Vergleich zu belohnten Kettensitzungen (schwarze Linie). BvCore DA-Freigabe für operante Antworten und Belohnung während des verstärkten Kettenplans (schwarz) und des frühen Aussterbens (blau) an den TL angepasstP Veranstaltung. Der graue Balken zeigt den Bereich der maximalen und minimalen DA-Konzentration während des Basiszeitraums. C , Peak-DA relativ zum SLP, TLPund Belohnung im verstärkten Zeitplan und frühes Aussterben. D , Ausrichtung auf den SLO In der Schale (rote Linien) zeigten sich mehr diskrete Abnahmen in der phasischen DA-Freisetzung als Ergebnis der iterativen Extinktionsversuche im Vergleich zu belohnten Kettensitzungen (schwarze Linie). E DA-Signalisierung an der TL ausgerichtetP in der Schale im frühen Aussterben (rot) und im verstärkten Kettenplan (schwarz). F , Peak DA in der Schale war bei SL unverändertP, zeigte jedoch bei TL signifikante AbnahmenP und belohnen. *p <0.05, **p <0.01, Kette gegen frühes Aussterben; †p <0.05, Auslassung geringer als die Grundlinie.

Wir haben zuerst die DA-Signalisierung im Kern während der Extinktion untersucht. Relativ zum SLO, DA nahm signifikant und linear über die verschiedenen Extinktionsphasen relativ zu der belohnten Kettensitzung ab (Interaktion: Phase × Cue; SL)O gegen Grundlinie; F (4,157) = 33.19, p <0.0001; Abb.. 6 A. Post hoc paarweise Vergleiche zeigten, dass der DA-Spitzenwert gegenüber dem SL liegtO schnell zwischen den Ketten- und frühen Aussterben-Phasen abgenommen (Tukey: p <0.0001) und erneut zwischen frühem Aussterben und spätem Aussterben (p <0.0001). DA während des Auslöschens der Verzögerung unterschied sich jedoch nicht von dem Block der späten Presse (p = 0.64) und Peak DA unterschieden sich nicht in der späten Phase, je nachdem, ob die Ratte geantwortet hat oder nicht (Late Press vs. Late No Press, p = 0.99). Außerdem DA-Freigabe während des SLO war signifikant größer als der Ausgangswert in der Kette (p <0.0001), frühes Aussterben (p <0.0001) und Verzögerung des Aussterbens (p <0.001) Phasen, jedoch nicht in der späten Presse oder in der späten Phase ohne Presse (beide) p > 0.5). Diese paarweisen Befunde stützten einen signifikanten negativen linearen Trend (F (1,157) = 94.77, p <0.0001), was einen Großteil (71%) der Effektvarianz ausmachte.

Als nächstes ist ein Kennzeichen von PE-Signalen im Gehirn das Vorhandensein von negativen Vorhersagefehlern zum Zeitpunkt einer unterlassenen erwarteten Belohnung (Schultz et al., 1997). Wir rechneten damit, dass diese Signale zu Beginn des Aussterbens am stärksten sein werden, wenn die Testperson die volle Erwartung hatte, dass die Belohnung geliefert wird. Im Kern (Abb.. 6 B), eine Zweiwege-ANOVA zeigte eine signifikante Wechselwirkung zwischen Ereignis × Phase (Kette gegen frühes Aussterben; F (3,57) = 3.24, p = 0.029). Genauer gesagt, obwohl die DA-Freisetzung relativ zum vorhergehenden SL liegtP war im frühen Aussterben gegenüber der verstärkten Kettensitzung signifikant reduziert (Tukey: p = 0.019), DA-Freigabe an den TLP war nicht betroffen (p = 0.41). Kritisch zeigte sich bei der Kern-DA ein negativer Vorhersagefehler während des Aussterbens (Abb.. 6 B) so, dass die DA-Freigabe während der erwarteten, aber ausgelassenen Belohnung deutlich niedriger war als während der verstärkten Sitzung (p = 0.003). In der Tat unterschied sich die Spitzen-DA-Freisetzung für die Belohnung während der verstärkten Kettensitzung nicht von den Ausgangswerten (p = 0.99), verschob sie sich während der Belohnungsversäumnisse auf deutlich weniger als die Basiswerte (p = 0.03). Daher zeigten DA-Signale im Kern während des frühen Aussterbens sowohl dynamische Verschiebungen in der Freisetzung zu prädiktiven SL-Stimuli und -Aktionen, als auch keine Änderung relativ zu einem TL-Hinweis und einen negativen Vorhersagefehler, um die Auslassung zu belohnen.

Die Hülle zeigte ein anderes Muster der DA-Freisetzung als das SLO Stichwort (Abb.. 6 D). Hier wurde ein subjektgemittelter Cue-evozierter DA für den SL erzeugtO dynamisch über Phasen hinweg geändert (Interaktion: Phase × Cue; F (2,24) = 7.95, p <0.0005), aber im Gegensatz zum Kern änderte sich die Schalen-DA nicht zwischen der Kettenphase und dem frühen Aussterben (p = 0.74), aber DA Signalisierung an den SLO war während der Verzögerungsauslöschungsphase gegenüber der verstärkten Kettenphase signifikant verringert (p = 0.041) und die frühe Extinktionsphase (p = 0.02), zeitgleich mit der Motivationsänderung des Verhaltens der Ratten (Abb.. 5). Die DA-Signalisierung nahm zwischen der Verzögerungsphase und der späten Phase (Late Press, p = 0.03; spät keine presse, p = 0.004), aber es gab keinen Unterschied in den DA-Pegeln zwischen den späten Phasen (press vs. no press, p = 0.43). Wie im Kern, DA-Veröffentlichung während der SLO lag signifikant über dem Basiswert während der Kette, der frühen Extinktionsphase und der Delay-Extinktionsphase (Tukey: alle) p <0.001), aber keine der späten Phasen unterschied sich signifikant vom Ausgangswert. Somit verfolgte die Kern-DA-Freisetzung schnell und kontinuierlich Änderungen in der Vorhersage für den prädiktivsten Hinweis, während Muster der DA-Freisetzung für denselben Hinweis in der Hülle stattdessen Änderungen im Motivationszustand zwischen den Extinktionsphasen verfolgten.

Bei der Pressung und Belohnungssignalisierung unterschied sich die Shell-DA-Freisetzung von dem Muster im Kern (Abb.. 6 E,F). Eine bidirektionale ANOVA, bei der die DA in einzelnen Studien nach Stimulustyp (BL, SLP, TLP, Belohnung) und Extinktionsphase (Kette, frühe Extinktion) fanden eine signifikante Wechselwirkung zwischen Stimulus × Extinktion (F (3,108) = 11.5, p <0.0001; Abb.. 6 D). Im Gegensatz zum Kern gab es bei der Peak-Shell-DA-Veröffentlichung keinen Unterschied zum SLP früh im Aussterben (p = 0.44). Stattdessen verursachte die Extinktion eine signifikante Abnahme der DA-Freisetzung für beide TLP (p = 0.01) und zum Zeitpunkt der Belohnungsunterlassung relativ zum Belohnungserhalt (p <0.0001) relativ zur angepassten Zeit während des verstärkten Kettenplans. Während der belohnten Kettensitzung war der DA signifikant über dem Ausgangswert erhöht (p <0.0001), aber während des Auslassens der Belohnung war DA numerisch größer als, aber statistisch nicht verschieden von der Basislinie (p = 0.07). Im Gegensatz zum Kern fanden wir daher nur begrenzte Beweise für frühzeitige Auslöschungsvorhersagefehler und stattdessen eine Abnahme der DA-Freisetzung gegenüber der TL-Presse (aber nicht der SL-Presse) sowie die Eliminierung der DA-Freisetzung zu dem im verstärkten Zeitplan festgestellten Erfolg.

Diskussion

Phasische DA-Freisetzungsmuster verfolgten Stimuli, die sich in den NAc-Subregionen auf eine Weise unterschieden, die mit den Theorien der DA-Funktion übereinstimmt. In einer gut gelernten Kettenzeitplanaufgabe erreichte der DA im NAc-Kern selektiv den höchsten prädiktiven Hinweis und verfolgte linear die Änderungen des Vorhersagewerts und die Fehler während der Auslöschung. Im Gegensatz dazu verfolgte die phasische DA-Freisetzung in der NAc-Schale alle hervorstechenden Reize, wenn die Aufgabe belohnt wurde, und sowohl innerhalb der Sitzung als auch während des Aussterbens zeigten sich Signaländerungen, die mit den Motivationsverschiebungen übereinstimmen. Daher schlagen wir vor, dass diese DA-Signale dem Tier während des Verhaltens gleichzeitig zur Verfügung stehen, sodass sowohl prädiktive als auch motivationale Informationen zur Verfügung stehen, um das Lernen und Handeln zu steuern.

Kern-DA-Release verfolgt Vorhersagefehler

Im Kern stieg die DA zum Zeitpunkt der SL-Cue-Präsentation phasisch an und sank für vollständig vorhergesagte spätere Ereignisse (z. B. TL, Belohnung) auf den Ausgangswert ab, ähnlich den vorherigen Befunden (Roitman et al., 2004; Cacciapaglia et al., 2012). Dieses Aktivitätsmuster stimmt mit Fehlervorhersagemodellen überein, die besagen, dass maximal vorhersagende Signale die höchste DA-Freisetzung (dh Vorhersage) auslösen sollten, während genau vorausgesagte Ereignisse, die folgen, minimale DA-Freisetzung (dh Vorhersagefehler) auslösen sollten. Da der TL und die Belohnung vom SL genau vorhergesagt wurden, erzeugten sie bei ihrer Lieferung wenig Fehler und verursachten wenig fehlerrelevante DA-Freigaben (Schultz et al., 1997; Schultz und Dickinson, 2000).

Unser Labor und andere haben gezeigt, dass DA-Signale im Kern auf Unterschiede im vorhergesagten Wert reagieren und durch subjektive Faktoren wie Risikopräferenz und Verzögerungen bei der Verstärkung moduliert werden (Day et al., 2010; Gan et al., 2010; Sugam et al., 2012; Saddoris et al., 2013, 2015). Beispielsweise skalierte bei Ratten, die eine riskante Entscheidungsaufgabe ausführten, die Kern-DA mit Hinweisen, die die bevorzugte Option der Ratte vorhersagten, und fiel schnell unter die Grundlinie, wenn die erwarteten Belohnungen weggelassen wurden, was auf einen negativen Vorhersagefehler hinweist (Sugam et al., 2012). Ebenso verfolgte der Kern-DA sowohl den Wert der vorhergesagten Ergebnisse als auch dynamisch verschoben auf der Grundlage des aktualisierten vorhergesagten Cue-Werts während der Auslöschung. In der Tat, DA-Freigabe für die SLO Es unterschied sich nicht von der Grundlinie zu dem Zeitpunkt, zu dem die Ratte anfing, die Reaktionen während des Aussterbens wegzulassen, unabhängig davon, ob eine Reaktion erfolgte oder nicht, was darauf hindeutet, dass DA den erwarteten Wert der Reaktion signalisierte und nicht die Motivation, zu drücken. Darüber hinaus lösten Belohnungsausfälle zu Beginn der Auslöschung robuste Pausen bei der DA-Veröffentlichung aus, die mit einer negativen Vorhersagefehlersignalisierung übereinstimmen.

Shell DA verfolgt motivierend auffällige Reize

Die DA-Freisetzung in der Schale verfolgte diskret alle auffälligen Reize (SLO, TLO, R). Diese Muster konnten nicht durch eine langsamere Wiederaufnahmekinetik erklärt werden, sondern scheinen die Echtzeit-Codierung von kontingenten Ereignissen zu reflektieren (Pan et al., 2005) und erworbene Incentive-Salience (Berridge und Robinson, 1998; Berridge, 2012; Wassum et al., 2012). DA-Veröffentlichungsereignisse kodierten also sowohl prädiktive Hinweise als auch Belohnungen in der Shell, aber nur prädiktive Hinweise im Kern (Cacciapaglia et al., 2012).

Wir fanden Beweise für diese motivierende Komponente der Shell-DA-Signalisierung. Erstens wurde das DA-Signal in der Schale auf Stimuli zwischen Beginn und Ende der Sitzung verringert, was im Kern nicht zu sehen war. Eine Erklärung ist, dass die Ratten am Ende der Sitzung einfach satt waren (per Definition hatten sie mehr Futter gegessen als zu Beginn der Sitzung), und so spiegelten Hinweise auf das Futter den verminderten Motivationszustand des Tieres wider . Im Gegensatz dazu sagten die Hinweise immer noch genau die Abgabe des Saccharosepellets voraus, so dass die PE-Typ-Codierung im Kern von dieser Motivationsverschiebung relativ weniger betroffen war.

Zweitens, während des Auslöschens, DA-Freigabe in der Schale an den SLO blieb stabil, während die Ratte die Aufgabe auf dem gleichen Motivationsniveau ausführte (wie durch die Reaktionsverzögerung und -genauigkeit angezeigt), nahm jedoch signifikant ab, nachdem die Motivation der Ratten im Verlauf des Aussterbens abnahm (dh die Reaktionsverzögerung). Im Gegensatz dazu sahen wir während der TL-Stimuli eine rasche Abnahme der phasischen DA-Freisetzung. IS-Modelle sagen voraus, dass Hinweise, die die Unsicherheit verringern, zu mehr Motivation und Anreizkraft führen sollten (Zhang et al. 2009; Smith et al., 2011), der hier auf den TL ausgerichtet ist, da er die bevorstehende Belohnungsbereitstellung maximal vorhersagt. Intra-NAc-Shell-Infusionen von Amphetamin potenzieren selektiv die Codierung von Signalen, die am nächsten zur Belohnungsabgabe in einer verketteten Pavlov-Aufgabe liegen, haben jedoch weniger Einfluss auf den ersten Cue in der Sequenz (Smith et al., 2011). Daher war die DA-Kodierung des TL besonders empfindlich für den vorhergesagten Verlust der Belohnungsabgabe beim Aussterben. Überraschenderweise führte die Auslassung von Belohnungen nicht dazu, dass die DA-Veröffentlichung unter dem Baseline-Wert lag. Dies deutet darauf hin, dass Shell-DA weniger wahrscheinlich einen negativen Vorhersagefehler als der Kern codiert. Insgesamt unterscheidet sich dieses Signalmuster innerhalb der NAc-Hülle deutlich vom Kern und deutet auf eine IS-Codierung hin.

Zur Unterstützung wurde die NAc-Shell in eine Vielzahl von motivationsorientierten Verhaltensweisen verwickelt. Salzappetit, bei dem eine salzige Lösung normalerweise aversiv ist, kann sich als lohnend erweisen, wenn das Tier salzfrei ist. In beiden Fällen ist das vorhergesagte Ergebnis (Salz) das gleiche, aber die Motivation, dieses Ergebnis zu erzielen, unterscheidet sich zwischen normalen und salzarmen Tieren (Tindell et al., 2009). Die neuronale Kodierung von NAc für die Salzlösung wird in der Schale basierend auf dem Salzmotivationsgrad moduliert, während Kernneuronen keine zustandsabhängigen Unterschiede aufweisen (Loriaux et al., 2011). In ähnlicher Weise verstärken Mikroinjektionen von Amphetaminen innerhalb der NAc-Schale die Motivationskraft des Drückens des Hebels in Anwesenheit eines Hinweises während des Pavlovian-zu-Instrumental-Transfers (PIT) ebenso wie die Erfahrung des chronischen Vortransfers mit Kokain (Wyvell und Berridge, 2000; Saddoris et al., 2011; Le Blanc et al., 2013). Tatsächlich erhöht die Erfahrung mit selbst verabreichtem Kokain, die das PIT-Verhalten potenziert, auch die Neuralcodierung der NAc-Schale im Vergleich zum Kern bevorzugt (Saddoris et al., 2011).

Dieses Muster von IS und PE in der Schale und im Kern scheint sowohl die appetitiven als auch die aversiven Bedingungen zu verfolgen. Bei der pavlovianischen Angstkonditionierung nimmt die phasische DA in der NAc-Schale für ausgeprägte aversive Signale zu, wohingegen die Kern-DA-Freisetzung Abnahmen und Pausen in der Freisetzung verzeichnete, was auf eine PE-Typ-Vorhersage eines negativen Ergebnisses hinweist (Badrinarayan et al., 2012). Somit können auch negative (aber herausragende) Ereignisse mit einem IS-Typ-Modell innerhalb der Shell berücksichtigt werden, während die Kern-DA-Veröffentlichung stark mit Vorhersagen über den Ergebniswert gekoppelt ist.

Komplexität von PE- und IS-Signalen bei der Konditionierung

Ein Nachteil ist jedoch, dass Tiere, die bevorzugt mit vorhersagenden Hinweisen interagieren ("Sign Tracker"), im NAc-Kern im Vergleich zu denjenigen, die sofort in den Food-Cup gelangen, eine stärkere DA-Freisetzung aufweisen ("Goal Tracker"; Flagel et al., 2011). Dieses verstärkte Vorzeichen-Tracking wird als unterstützend für den IS beschrieben, da der Cue zu einem herausragenden Stimulus geworden ist, der als Motivationsmagnet wirken kann und mit ähnlichen Befunden im Kern übereinstimmt (Aragona et al., 2009; Peciña und Berridge, 2013; Wassum et al., 2013; Ostlund et al., 2014). Dies scheint im Widerspruch zu unserer Zuordnung von PE zum Kern und IS zur Schale zu stehen.

Es ist wichtig anzumerken, dass die jeweiligen Rollen des DA-Signals in Core und Shell wahrscheinlich komplex sind. Zum Beispiel haben nur wenige der oben genannten Studien die Rolle von Schale und Kern bei diesen Aufgaben unabhängig untersucht, so dass eine gesteigerte DA im Kern der Schilderfassungstiere einfach einen allgemeinen Anstieg der DA-Anreizsignale im mesolimbischen Weg widerspiegeln kann. Des Weiteren befürworten wir keine absolute Spaltung; Wir haben ein DA-Release für die TL gefundenO im Kern, obwohl DA zum SLO in der Schale trotz der Motivation während des Aussterbens bestanden, was darauf hindeutet, dass Merkmale des IS im Kern und PE in der Schale vorhanden sein könnten (wenn auch auf niedrigeren Ebenen und / oder weniger auf die Aufgabendynamik ansprechen). Wir schlagen vielmehr vor, dass Core und Shell eine kritische Ausrichtung auf Codierungsmuster vom PE- und IS-Typ darstellen, was der abgestuften Zusammensetzung der striatalen Anatomie entspricht (Haber, 2014).

Auswirkungen auf die Sucht

Modellbasierte Unterschiede in der DA-Signalisierung von Core und Shell haben wichtige Auswirkungen auf das natürliche Belohnungslernen. Zum Beispiel können Drogenmissbrauch zwar anfänglich lohnend sein, jedoch können Drogen-assoziierte Reize im Laufe der Zeit Gefühle von heftigem aversivem Verlangen hervorrufen, was zu einem negativen affektiven Zustand führt, der die Drogensucht antreibt (Koob und Le Moal, 1997). Längerer Abstinenz von Medikamenten erhöht die Wirkung von medikamentenassoziierten Reizen, auch wenn dies als Inkubation von Verlangen bekannt ist (Grimm et al., 2001; Hollander und Carelli, 2005; Pickens et al., 2011). Das vorhergesagte Ergebnis (Medikament) ist sowohl im unmittelbaren als auch im abstinenten Zustand unverändert, aber die Motivation, den Drogenkonsum bei den abstinenten Probanden wieder aufzunehmen, nimmt stark zu. Dies deutet auf eine signifikante Änderung der Anreizwirkung dieser Stimuli hin und würde vorhersagen, dass abstinenzbedingte Änderungen bevorzugt in der Schale zu sehen sind. In ähnlicher Weise verfolgen Änderungen der DA-Signalübertragung den aversiven Zustand des Tieres in der Schale, jedoch nicht den Kern, wenn Ratten, die sich selbst verabreichen, Ratten mit Kokain-Vorhersage vorgestellt werden, die einen aversiven Motivationszustand induzierenWheeler et al., 2011). Zusammengenommen unterstützen diese Ergebnisse, dass die DA-Beiträge von Core und Shell zum Lernen und zur Motivation sowohl bei natürlichen als auch bei medikamentösen Belohnungen konsistent sind.

Fußnoten

  • Juni 18, 2015 erhalten.
  • Revision erhielt Juli 8, 2015.
  • Akzeptiert Juli 15, 2015.
  • Diese Arbeit wurde von den nationalen Instituten für Drogenkonsumzuschüsse DA028156 und DA035322 für MPS und DA017318 und DA034021 für RMC und DA010900 für RMW unterstützt. Wir danken Dr. Elizabeth West für Kommentare zu einem früheren Entwurf dieser Arbeit.

  • Die Autoren erklären keine konkurrierenden finanziellen Interessen.

  • Die Korrespondenz sollte an Dr. Michael Saddoris, Abteilung für Psychologie und Neurowissenschaften, der University of Colorado Boulder, Münzinger, UCB 345, Boulder, CO 80309-0345 gerichtet werden. [E-Mail geschützt]

Bibliographie

    1. Aragona BJ,
    2. Tag JJ,
    3. Roitman MF,
    4. Cleaveland NA,
    5. Wightman RM,
    6. Carelli RM

    (2009) Regionale Spezifität bei der Entwicklung von phasischen Dopamin-Transmissionsmustern während des Erwerbs einer Queue-Kokain-Assoziation bei Ratten in Echtzeit. Eur J Neurosci 30: 1889 – 1899.

    1. Badrinarayan A,
    2. Wescott SA,
    3. Vander Weele CM,
    4. Saunders BT,
    5. Couturier BE,
    6. Maren S,
    7. Aragona BJ

    (2012) Aversive Stimuli modulieren die Dopaminübertragungsdynamik in Echtzeit innerhalb des Kerns und der Hülle des Kerns differentiell. J Neurosci 32: 15779 – 15790.

    1. Berridge KC

    (2012) Vom Vorhersagefehler zum Anreiz: Die mesolimbische Berechnung der Belohnungsmotivation. Eur J Neurosci 35: 1124 – 1143.

    1. Berridge KC,
    2. Robinson TE

    (1998) Welche Rolle spielt Dopamin bei der Belohnung: hedonische Wirkung, Belohnungslernen oder Anreizsymmetrie? Gehirnres. Rev. 28: 309 – 369.

    1. Bromberg-Martin ES,
    2. Matsumoto M,
    3. Hikosaka O

    (2010) Dopamin bei der Motivationskontrolle: belohnend, aversiv und alarmierend. Neuron 68: 815 – 834.

    1. Budygin EA,
    2. John CE,
    3. Mateo Y,
    4. Jones SR

    (2002) Mangelnde Wirkung von Kokain auf die Dopamin-Clearance im Kern und der Hülle des Nucleus accumbens von Dopamin-Transporter-Knock-out-Mäusen. J Neurosci 22: RC222.

    1. Cacciapaglia F,
    2. Saddoris MP,
    3. Wightman RM,
    4. Carelli RM

    (2012) Die differentielle Dopaminfreisetzungsdynamik im Nucleus Accumbens Core und Shell verfolgt verschiedene Aspekte des zielgerichteten Verhaltens von Saccharose. Neuropharmacology 62: 2050 – 2056.

    1. Cohen JY,
    2. Haesler S,
    3. Vong L,
    4. Lowell BB,
    5. Uchida N

    (2012) Neuron-spezifische Signale für Belohnung und Bestrafung im ventralen Segmentbereich. Natur 482: 85 – 88.

    1. Tag JJ,
    2. Jones JL,
    3. Wightman RM,
    4. Carelli RM

    (2010) Phasischer Nukleus Accumbens Dopamin-Freisetzung codiert Aufwand und Verzögerungen. Biol Psychiatry 68: 306 – 309.

    1. Flagel SB,
    2. Clark JJ,
    3. Robinson TE,
    4. Mayo L,
    5. Czuj A,
    6. Willuhn ich,
    7. Akers CA,
    8. Clinton SM,
    9. Phillips PE,
    10. Akil H

    (2011) Eine selektive Rolle für Dopamin beim Stimulus-Reward-Lernen. Natur 469: 53 – 57.

    1. Gan JO,
    2. Walton ME,
    3. Phillips PE

    (2010) Dissoziierbare Kosten und Nutzen-Kodierung zukünftiger Belohnungen durch mesolimbisches Dopamin. Nat Neurosci 13: 25 – 27.

    1. Grimm JW,
    2. Hope BT,
    3. Weise RA,
    4. Shah Y

    (2001) Neuroadaptation: Inkubation von Kokain-Verlangen nach Entzug. Natur 412: 141 – 142.

    1. Haber SN

    (2014) Der Ort von Dopamin im Corticium-Basalganglien-Kreislauf. Neuroscience 282C: 248 – 257.

    1. Heien ML,
    2. Khan AS,
    3. Ariansen JL,
    4. Cheer JF,
    5. Phillips PE,
    6. Wassum KM,
    7. Wächter RM

    (2005) Echtzeitmessung von Dopaminfluktuationen nach Kokain im Gehirn verhaltener Ratten. Proc Natl Acad Sci USA 102: 10023 – 10028.

    1. Hollander JA,
    2. Carelli RM

    (2005) Der Verzicht auf die Kokain-Selbstverwaltung erhöht die neuronale Kodierung von zielgerichtetem Verhalten in den Accumbens. Neuropsychopharmakologie 30: 1464 – 1474.

    1. Keithley RB,
    2. Carelli RM,
    3. Wächter RM

    (2010) Rangschätzung und multivariate Analyse von in vivo zyklische voltammetrische Daten mit schnellem Scan. Anal Chem 82: 5541 – 5551.

    1. Koob GF,
    2. Le Moal M

    (1997) Drogenmissbrauch: hedonische homöostatische Dysregulation. Wissenschaft 278: 52 – 58.

    1. LeBlanc KH,
    2. Maidment NT,
    3. Ostlund SB

    (2013) Wiederholte Kokain-Exposition erleichtert die Expression von Anreizmotivation und führt bei Ratten zu einer gewohnheitsmäßigen Kontrolle. PloS Eins 8: e61355.

    1. Loriaux AL,
    2. Roitman JD,
    3. Roitman MF

    (2011) Der Nucleus accumbens shell, aber nicht der Kern, verfolgt den motivationalen Wert von Salz. J Neurophysiol 106: 1537 – 1544.

    1. Olmstead MC,
    2. Parkinson JA,
    3. Miles FJ,
    4. Everitt BJ,
    5. Dickinson A

    (2000) Kokainsuche durch Ratten: Regulation, Verstärkung und Aktivierung. Psychopharmakologie 152: 123 – 131.

    1. Ostlund SB,
    2. LeBlanc KH,
    3. Kosheleff AR,
    4. Wassum KM,
    5. Maidment NT

    (2014) Phasische mesolimbische Dopamin-Signale kodieren die Erleichterung der durch wiederholte Kokain-Exposition hervorgerufenen Anreizmotivation. Neuropsychopharmakologie 39: 2441 – 2449.

    1. Owesson-White CA,
    2. Ariansen J,
    3. Stuber GD,
    4. Cleaveland NA,
    5. Cheer JF,
    6. Wightman RM,
    7. Carelli RM

    (2009) Die neuronale Kodierung von Kokainsuchendem Verhalten fällt mit der Freisetzung von Dopamin im Kern und in der Hülle des Accumbens zusammen. Eur J Neurosci 30: 1117 – 1127.

    1. Pan WX,
    2. Schmidt R,
    3. Wickens JR,
    4. Hyland BI

    (2005) Dopamin-Zellen reagieren auf vorhergesagte Ereignisse während der klassischen Konditionierung: Nachweis der Eignungsspuren im Belohnungslernnetzwerk. J Neurosci 25: 6235 – 6242.

    1. Peciña S,
    2. Berridge KC

    (2013) Dopamin- oder Opioid-Stimulation von Nucleus Accumbens verstärken auf ähnliche Weise das durch Cue ausgelöste "Wünschen" als Belohnung: Der gesamte Kern und die mediale Hülle werden als Substrate für die PIT-Verstärkung abgebildet. Eur J Neurosci 37: 1529 – 1540.

    1. Pickens CL,
    2. Airavaara M,
    3. Theberge F,
    4. Fanous S,
    5. Hope BT,
    6. Shah Y

    (2011) Neurobiologie der Inkubation von Drogensucht. Trends Neurosci 34: 411 – 420.

    1. Redish AD

    (2004) Sucht als Rechenprozess, der schief gelaufen ist. Wissenschaft 306: 1944 – 1947.

    1. Robinson TE,
    2. Berridge KC

    (2008) Review: Die Anreizsensibilisierungstheorie der Abhängigkeit: einige aktuelle Probleme. Philos Trans R Soc Lond B Biol Sci 363: 3137 – 3146.

    1. Roitman MF,
    2. Stuber GD,
    3. Phillips PE,
    4. Wightman RM,
    5. Carelli RM

    (2004) Dopamin arbeitet als sekundärer Modulator der Nahrungssuche. J Neurosci 24: 1265 – 1271.

    1. Saddoris MP,
    2. Gallagher M,
    3. Schönbaum G

    (2005) Die schnelle assoziative Kodierung in basolateralen Amygdala hängt von den Verbindungen mit dem orbitofrontalen Kortex ab. Neuron 46: 321 – 331.

    1. Saddoris MP,
    2. Stamatakis A,
    3. Carelli RM

    (2011) Neuronale Korrelate des Pavlovian-zu-Instrumental-Transfers in der Nucleus accumbens-Schale werden nach Kokain-Selbstverabreichung selektiv potenziert. Eur J Neurosci 33: 2274 – 2287.

    1. Saddoris MP,
    2. Sugam JA,
    3. Cacciapaglia F,
    4. Carelli RM

    (2013) Schnelle Dopamin-Dynamik in Accumbens Core und Shell: Lernen und Handeln. Front Biosci (Elite Ed) 5: 273 – 288.

    1. Saddoris MP,
    2. Sugam JA,
    3. Stuber GD,
    4. Witten IB,
    5. Deisseroth K,
    6. Carelli RM

    (2015) Mesolimbic Dopamin verfolgt diskrete Aspekte wertorientierter Entscheidungen dynamisch und ist kausal damit verknüpft. Biol Psychiatry 77: 903 – 911.

    1. Schönbaum G,
    2. Setlow B,
    3. Saddoris MP,
    4. Gallagher M

    (2003) Die Kodierung des vorhergesagten Ergebnisses und des ermittelten Wertes im orbitofrontalen Kortex während der Stichprobenauswahl hängt von der Eingabe der basolateralen Amygdala ab. Neuron 39: 855 – 867.

    1. Schultz W,
    2. Dickinson A

    (2000) Neuronale Codierung von Vorhersagefehlern. Annu Rev Neurosci 23: 473 – 500.

    1. Schultz W,
    2. Dayan P,
    3. Montague PR

    (1997) Ein neuronales Substrat der Vorhersage und Belohnung. Wissenschaft 275: 1593 – 1599.

    1. Smith KS,
    2. Berridge KC,
    3. Aldridge JW

    (2011) Entflechten der Freude von Anreizen und Lernsignalen in Gehirnbelohnungsschaltkreisen. Proc Natl Acad Sci USA 108: E255 – E264.

    1. Sugam JA,
    2. Tag JJ,
    3. Wightman RM,
    4. Carelli RM

    (2012) Phasischer Nukleus accumbens Dopamin kodiert risikobasiertes Entscheidungsverhalten. Biol Psychiatry 71: 199 – 205.

    1. Tindell AJ,
    2. Smith KS,
    3. Berridge KC,
    4. Aldridge JW

    (2009) Dynamische Berechnung von Incentive-Erkenntnissen: "wollen", was nie "gemocht" wurde. J Neurosci 29: 12220 – 12228.

    1. Tobler PN,
    2. Dickinson A,
    3. Schultz

    (2003) Kodierung der vorhergesagten Belohnungsunterlassung durch Dopamin-Neuronen in einem konditionierten Hemmungsparadigma. J Neurosci 23: 10402 – 10410.

    1. Waelti P,
    2. Dickinson A,
    3. Schultz

    (2001) Dopamin-Antworten entsprechen den grundlegenden Annahmen der formalen Lerntheorie. Natur 412: 43 – 48.

    1. Wassum KM,
    2. Ostlund SB,
    3. Maidment NT

    (2012) Die phasische mesolimbische Dopamin-Signalisierung geht voraus und prognostiziert die Ausführung einer selbstinitiierten Action-Sequenz-Task. Biol Psychiatry 71: 846 – 854.

    1. Wassum KM,
    2. Ostlund SB,
    3. Loewinger GC,
    4. Maidment NT

    (2013) Phasische mesolimbische Dopamin-Freisetzung verfolgt Belohnungssuche während der Übertragung des Pavlovian-Instrumental-Transfers. Biol Psychiatry 73: 747 – 755.

    1. Wheeler RA,
    2. Aragona BJ,
    3. Fuhrmann KA,
    4. Jones JL,
    5. Tag JJ,
    6. Cacciapaglia F,
    7. Wightman RM,
    8. Carelli RM

    (2011) Kokain-Hinweise steuern kontextabhängige Verschiebungen in der Belohnungsverarbeitung und im emotionalen Zustand. Biol Psychiatry 69: 1067 – 1074.

    1. Wyvell CL,
    2. Berridge KC

    (2000) Intra-Accumbens-Amphetamin erhöht den konditionierten Anreiz für die Saccharoselohnbelohnung: Erhöhung des Belohnungswunsches ohne gesteigertes „Gefallen“ oder Verstärkung der Reaktion. J Neurosci 20: 8122 – 8130.

    1. Yorgason JT,
    2. España RA,
    3. Jones SR

    (2011) Demon Voltammetrie- und Analysesoftware: Analyse von Kokain-induzierten Veränderungen der Dopamin-Signalgebung unter Verwendung mehrerer kinetischer Maßnahmen. J Neurosci Methoden 202: 158 – 164.

    1. Zhang J,
    2. Berridge KC,
    3. Tindell AJ,
    4. Smith KS,
    5. Aldridge JW

    (2009) Ein neuronales Rechenmodell für Anreize. PLoS Comput Biol 5: e1000437.

  •