Differentiell dopaminfrisättningsdynamik i Nucleus Accumbens Core och Shell avslöjar kompletterande signaler för felprognos och incitamentmotivation (2015)

  1. Regina M. Carelli 2

+Visa Affiliations

Författarbidrag: MPS och FC utformade forskning; MPS och FC utförde forskning; MPS och FC analyserade data; MPS, RMW och RMC skrev papperet.

Abstrakt

Mesolimbic dopamin (DA) frisätts phasically under appetitiva beteenden, men det finns substantiell oenighet om det specifika syftet med dessa DA-signaler. Exempelvis föreslår prediktionsfel (PE) -modeller en roll att lära, medan incitamentsalience (IS) -modeller hävdar att DA-signalerna stimulerar med värde och därigenom stimulerar motiverat beteende. Emellertid, inom kärnan accumbens (NAc) mönster av DA release kan påfallande skilja sig mellan subregioner, och som sådan är det möjligt att dessa mönster bidrar olika till aspekter av PE och IS. För att bedöma detta mätte vi DA-frisättning i subregioner av NAc under en beteendemässig uppgift som spatiotemporalt separerade sekventiella målreglerade stimuli. Elektrokemiska metoder användes för att mäta subkondens NAc-dopaminfrisättning i kärnan och skalet under ett vällärdt instrumentalt kedjeplan där råttor utbildades för att trycka på en hävarm (söker SL) för att få tillgång till en andra hävstång (TL) kopplad till matleverans och igen under utrotning. I kärnan var phasic DA-utsläpp störst efter initial SL-presentation, men minimal för de efterföljande TL- och belöningshändelserna. Däremot visade fasiskt skal DA en robust frisättning vid alla uppgiftshändelser. Signaleringen minskade mellan början och slutet av sessioner i skalet, men inte kärnan. Under utrotning visade topp DA-frisättning i kärnan en graderad minskning för SL och pauser i frisättning under utelämnad förväntade belöningar, medan skalets DA-frisättning minskade huvudsakligen under TL. Dessa frisättningsdynamik föreslår parallella DA-signaler som kan stödja olika teorier om aptitligt beteende.

BETYDNINGSBESKRIVNING Dopamin signalering i hjärnan är viktig för en mängd olika kognitiva funktioner, såsom lärande och motivation. Typiskt antas det att en enda dopamin-signal är tillräcklig för att stödja dessa kognitiva funktioner, men konkurrerande teorier är oense om hur dopamin bidrar till belöningsbaserade beteenden. Här har vi funnit att realtidsdopaminfrisättning inom kärnans accumbens (ett primärt mål för dopaminneuroner i mittenhjärnan) varierar slående mellan kärn- och skalsubregioner. I kärnan överensstämmer dopamindynamik med inlärningsbaserade teorier (som felsökningsprognosfel) medan dopamin i skalet överensstämmer med motivationsbaserade teorier (t.ex. incitamentsalience). Dessa fynd visar att dopamin spelar flera och komplementära roller baserat på diskreta kretsar som hjälper djuren att optimera givande beteenden.

Beskrivning

Att förstå rollen som dopamin (DA) -signalering i förhållande till lärande, beteende och missbruk är en central fråga i beteendemessig neurovetenskap. Samtida teorier stämmer överens med den anatomiska organisationen av det mesolimbiska DA-systemet, där en relativt liten population av DAergic neuroner i det ventrala tegmentala området (VTA) skickar collaterals i hela hjärnan för att i stor utsträckning modulera kretsar för lärande och handling. Nya bevis tyder emellertid på att DA-signalering kan vara mer heterogen än vad som tidigare bedömts. Fasisk DA-frisättning efter belönings-prediktiva signaler vågar till exempel med det förväntade subjektiva belöningsvärdet i kärnan accumbens (NAc) kärnan, men inte skalet (Day et al., 2010; Sugam et al., 2012). Däremot är motivationsskift i hedonisk behandling av läkemedelspreaktiva smakämnen lokaliserade till fasförändringar i DA-frisättning i NAc-skalet, men inte kärna (Wheeler et al., 2011). Vidare har vi och andra visat att DA-frigöring under lärdagande uppgifter kodade stimuli annorlunda mellan kärna och skal (Aragona et al., 2009; Owesson-White et al., 2009; Badrinarayan et al., 2012; Cacciapaglia et al., 2012). Istället för en global DA-signal, tyder dessa resultat på att DA kan differentieras och diskret anpassas till specifika målregioner för att stödja plasticitet inom definierade kretsar relaterade till inlärning, motivation och handling.

Emellertid är de exakta funktionerna hos dessa heterogena DA-signaler inte väl förstådda. En inflytelserik modell har föreslagit att DA ger en undervisningssignal för att generera associativa förväntningar om framtida resultat och om dessa förutsägelser är korrekta [förutsägelsesfel (PE)]. DA neuroner visar denna typ av kodning (Schultz et al., 1997; Schultz och Dickinson, 2000; Waelti et al., 2001; Tobler et al., 2003), även om nya fynd bekräftar att väsentligen alla optogenetiskt identifierade DA-neuroner i VTA-show-PE-signaleringen (Cohen et al., 2012). Däremot antyder incentive salience (IS) modeller att DA verkar för att ge stimuli med värderade förstärkare, vilket skapar motivationsdrivning för dessa resultat (Berridge och Robinson, 1998; Robinson och Berridge, 2008; Zhang et al., 2009; Berridge, 2012). Även om liknande, PE och IS-modeller gör starkt divergerande förutsägelser för DA-funktionen med hänsyn till dess nödvändighet i lärande, motivation och narkotikamissbruk (Redish, 2004; Tindell et al., 2009; Bromberg-Martin et al., 2010; Berridge, 2012).

I enkla konditioneringsuppgifter är det svårt att veta vilken fasisk DA-frisättning som kodar (dvs. förutsätter det belöning eller cue salience?). Genom att spatiotemporalt isolera prediktiva och framträdande stimuli inom samma uppgift är det emellertid möjligt att analysera specifika funktioner för lärande och åtgärder för att isolera komponenter, såsom initial prediktion, konsumtionella beteenden, motivation och till och med utrotning. För att ta itu med detta använde vi en funktionell kedjelägesuppgift där pressar på en spak [sökarm (SL)] gav tillträde till pressar på en andra hävstång (TL) och pressar på TL resulterade i matleverans. Vidare differentierade vi, med hjälp av snabbskanning, cyklisk voltammetri (FSCV) för att mäta realtids DA-frisättningsmönster i antingen NAc-kärnan eller skalet i välutbildade råttor, vilka uppgiftsselektiva egenskaper hos DA-kodning skilde sig över NAc-subregioner. Slutligen undersökte vi hur dessa signaler förändrades dynamiskt när aspekter av motivation (hungernivå) och prediktering (utrotning) förändrades. Vi observerade differentialmönster av DA-frisättning i kärnan och skalet som var starkt överensstämmande med PE respektive IS-modeller, och stöder generellt tanken på flera mesolimbiska DA-signaler som kan stödja kompletterande men distinkta aspekter av målriktat beteende.

Material och metoder

Djur.

Tolv manliga Sprague-Dawley-råttor som väger 280-330 g användes som ämnen. Råttor var individuellt inrymda med en 12 h ljus / mörk cykel och lätt mat begränsad till inte mindre än 90% fri matningsvikt (10-15 g Purina laboratorium chow varje dag, förutom ~2.7 g sackaros förbrukad under dagliga sessioner ). Livsmedelsrestriktioner var på plats under beteendeprövningens gång, förutom under återhämtningsperioden efter kirurgi, när mat gavs ad libitum. Alla förfaranden utfördes i enlighet med University of North Carolina vid Chapel Hill Institutionella Animal Care and Use Committee.

Behavioral utbildning: kedjan schema.

Testkammare innehöll två infällbara hävstångar med ett ljusljus över varje hävarm och en matbehållare placerad lika avstånd mellan hävstången som tidigare beskrivits (Cacciapaglia et al., 2012). För varje ämne benämndes en spak (t ex vänster) TL och den andra spaken (t.ex. höger) som SL under hela testperioden. Sidan av TL och SL motverkades över ämnen.

Råttor utbildades först för att erhålla sackarospellets (45 mg, Purina) från matbehållarbehållaren. Under en enda pretraining-session levererades 50-pellets slumpmässigt ungefär en gång per 30 s. Råttor utbildades sedan för att själv administrera sackarospellets under enskilda dagliga sessioner. För att forma instrumental respons blev djuren först utbildade för att trycka på TL. Varje försök under formning började med belysningen av en ljuskedja direkt ovanför TL i kombination med förlängningen av TL i testkammaren [ta ut spaken (TLO)]. Varje hävstångspress [TLP; fast förhållande 1 (FR1)] inom 15 s av förlängning resulterade i leveransen av en enda sackarospellett (45 mg) i behållaren, retraktionen av TL och terminering av cue-ljuset. Om djur misslyckades med att trycka på TL inom 15 s, togs armen tillbaka, kuggljuset släcktes och provningen räknades som en utelämning. Försök separerades med ett variabelt intertrialintervall med ett genomsnitt av 15 s (intervall: 5-25 s; formningsdagarna 1 och 2) och ökades sedan till ett genomsnitt av 45 s på formningsdagarna 3-4 (intervall: 30-60 s).

Efter inrättandet av en stabil svar på TL (dvs inte mer än 2 omissionsfel i en session) infördes kedjeplaneringen (Fig 1 A), anpassad från Olmstead et al. (2000). Försök under kedjans schema sessioner började med förlängningen av SL och samtidig belysning av kolljuset direkt ovanför det (SLO). Varje SLP (FR1) resulterade i retraktionen av SL och släckning av cue, följt av presentation av TLO (hävarmförlängning, kuggljus). Som ovan resulterade TL-pressar i retraktionen av TL, släckning av köljuset och tillförseln av en sackarospellett till matkoppen. Försök separerades med ett intervallintervall för 45 s (intervall: 30-60 s), och varje session bestod av 30-försök. För dag 1 i kedjeplanet var det ingen fördröjning mellan retraktionen av SL och förlängning av TL. På efterföljande dagar introducerades ett variabelt intervall (VI) av 3-5 s mellan retraktionen av SL-pressen och förlängningen av TL. Dessutom infördes en VI 1-3 s mellan TL-press och leveransen av sackarosförstärkningen. Variabla förseningar användes under träning (dvs. alla sessioner före FSCV-inspelningar) för att eliminera förmågan för råttor att förutsäga att händelserna levereras. Råttor utbildades för 5 d på detta kedjeschema eller tills de visade stabil prestanda av två på varandra följande sessioner utan att försummas på antingen SL eller TL, varefter de kirurgiskt förbereddes för voltammetrisk inspelning.

Beteendeutbildning: utrotning.

Efter den sista inspelningssessionen genomgick en delmängd av djur utrotning (kärninspelningar: n = 3; skalinspelningar: n = 7). Under utrotning, SLO presentationer indikerade början på en ny försöksperiod. Försök var identiska med de i testperioden där SL-presser resulterade i presentationer av TLO 4 s senare, men pressar på TL förstärktes inte. Utbrytning sessioner fortsatte tills råttor slutade svara på SL för 10 på varandra följande försök (Fig 1 B).

Tidigare studier (Schoenbaum et al., 2003; Saddoris et al., 2005) har visat att neurala korrelater av limbisk aktivitet är mycket känsliga för förändringar i lärande och motivationstillstånd, och därmed använde vi respons latensmarkörer för att definiera block för varje ämne (Fig 1 B). Det första blocket var tidig utrotning, i vilken respons latens för en SLP svaret liknade den belönade sessionen. Nästa, den första SLP respons latens som var minst 2 SD längre än under den tidigare belönade kedjesessionen markerade början av Delay Extinction. Slutligen var alla försök som följde det första utelämnade svaret i det sena utrotningsblocket och grupperade genom att råttan utelämnade en SLP svar (senast ingen tryckning) eller återupptagen svarande (sen tryckning). Allt utrotningsbeteende jämfördes med det omedelbart föregående förstärkta kedjeplanet.

Kirurgiska ingrepp.

Efter beteendestudier förbereddes djuren kirurgiskt för voltammetriska inspelningar som tidigare beskrivits (Cacciapaglia et al., 2012). I korthet bedövades råttor med en intramuskulär injektion av blandningen av ketaminhydroklorid (100 mg / kg, im) och xylazinhydroklorid (20 mg / kg). En styrkanyl (Bioanalytical Systems) implanterades ovanför antingen NAc-skalet (+ 1.7 mm AP) eller kärnan (+ 0.8 mm AP, + 1.3 mm ML) och en bipolär stimulerande elektrod (Plast One) placerades i VTA (-1.3 mm AP, + 5.2 mm ML och -1.0 DV). En annan styrkanyl för referens Ag / AgCl-elektroden placerades i den kontralaterala halvklotet. Komponenterna fästes i skallen med skruvar och kranioplastisk cement.

Voltammetrisk inspelning.

FSCV-inspelningstekniker som användes här var som beskrivits i detalj tidigare (Cacciapaglia et al., 2012; Sugam et al., 2012). I korthet fick råttor efter kirurgi återhämta sig till sin kroppsvikt (minst 5 d av återhämtning). Experimentets dag, en mikrofiber av kolfiber sänktes i NAc-skalet eller kärnan med en lokalt konstruerad mikrodrivare (Chemistry Department Electronic Facility, University of North Carolina, Chapel Hill, NC) efter att ha placerat en Ag / AgCl referenselektrod i den kontralaterala halvklotet. Kolfiber-mikroelektroden hölls vid -0.4 V mot Ag / AgCl-referenselektroden. Periodiskt erhölls ett cykliskt voltammogram (100 ms intervaller) genom att applicera en triangulär vågform som körde potentialen till 1.3 V och tillbaka till -0.4 V. Före början av varje inspelningssession erhöll vi elektriskt framkallade DA-frisättningshändelser genom att driva bipolärstimulerande elektroden i VTA och spelade in den resulterande DA-frisättningen i NAc. Om en stimulering misslyckades med att framkalla DA-frisättning sänktes elektroden till en ny plats och processen upprepades. När en elektrisk stimulering framgångsrikt gav upphov till DA-frisättning i NAc skapades en träningssats av framkallad DA-frisättning med hjälp av en kombination av stimulerande frekvenser (mellan 10 och 60 Hz) och antal bifasiska pulser (från 4 till 25) från den bipolära VTA-elektroden. I en delmängd av inspelningar skapades en extra träningssats efter slutet av beteendessessionen för att säkerställa elektrodstabilitet över sessionen. I en delmängd av råttor (n = 9), efter inspelning av en hel session med 30 försök, sänktes elektroden ytterligare ~ 300 μm tills en annan släppplats hittades, vid vilken tidpunkt en annan inspelning togs för en annan session med 30 försök. Analys av FSCV-data (HDCV-analys) använde kemometrisk huvudkomponentanalys för att extrahera strömförändringar på grund av DA med användning av varje ämnes elektriskt stimulerade träningssats från den relaterade inspelningssessionen som samlades in innan testning, som tidigare beskrivits (Heien et al., 2005; Keithley et al., 2010). För varje region (kärna och skal) justerades ett genomsnittligt DA-koncentrationsspår till varje beteendehändelse och jämfördes med den genomsnittliga DA-koncentrationen över en 5 s-baslinje omedelbart före SLO start med en tvåvägs blandad modell ANOVA (faktorer: händelse, region) om ämnesmedelvärden.

För utrotningssessioner var DA spåren också anpassade till beteendehändelserna. Men eftersom många SLO Presentationer följdes inte av några presser i utrotning, två olika analyser användes. För det första anpassades DA spåren till SLO och grupperas genom utrotningsfasen (se Fig 6) och analyserades med hjälp av tvåvägsrepeterade åtgärder med användning av extinktionsfas och stimulanshändelse som faktorer. För den andra analysen var endast försök där råttan pressade TLP användes och topp DA-koncentrationer (dvs. maximal DA-frisättning inom 300 ms efter händelsen) erhölls för båda TLP och belöning, och likaså analyseras med en tvåvägs upprepade åtgärder ANOVA med användning av utrotningsfas och uppgiftstimulus som faktorer. Allt post hoc parvisa jämförelser gjordes med hjälp av Tukeys HSD, korrigerad för ojämlik N när det passar. Alla statistiska analyser utfördes med Prism 4.0 för Windows (GraphPad Software) eller Statistica for Windows (StatSoft).

Histologi.

Efter varje experiment bedövades råttor djupt anestetiserat med en blandning av ketamin (100 mg / kg) / xylazin (20 mg / kg). En volframelektrod som hölls i samma mikromanipulator som användes under försöket sänktes till det experimentella inspelningsstället och en liten elektrolytisk lesion gjordes (50-500 μA, 5 s) för att markera elektrodspetsens position. Flera skador som gjordes när flera inspelningar hade gjorts. Varje hjärna avlägsnades, fixerades i 4% formaldehyd och frystes sedan till -80C innan den skivades i 40 μm koronalsektioner med en kryostat. Sektioner monterades på objektglas, betraktas med ljusfältmikroskopi och digitalt avbildad (Fig 1 C).

Jämförelse mellan stimulerad och händelseframkallad DA-frisättning i kärna och skal.

Det var möjligt att skillnaderna mellan kärna och skal-DA-frisättning för beteendehändelser berodde inte på skillnader i frisättningsdynamik utan snarare på skillnader i kinetiken för DA-clearance mellan regionerna. Exempelvis är striatal DA-frisättnings- och upptagningsdynamiken långsammare i skalet än kärnan på grund av en lägre densitet hos dopamintransportören i skalet (Jones et al., 1996; Budygin et al., 2002). Som sådan är skillnader mellan kärna och skal vid senare händelser (t.ex. TLO, belöning) kan förklaras av kvarvarande DA i den synaptiska regionen i skalet.

För att ta itu med denna oro jämförde vi DA-frisättnings- och upptagningsmönster som framkallats av beteendehändelser (dvs. SLO) under kedjans schemauppgift till DA framkallad av en kort explosion av elektrisk stimulering av VTA-afferenter. Ursprungligen genomfördes elektrisk stimulering (2 ms bifasiska pulser) av VTA-fibrer över ett brett spektrum av stimuleringsfrekvenser (10–60 Hz) och pulstal (4–25 pulser) för att erhålla ett fullständigt spektrum av frisättningsdynamik för att bygga en kemometrisk träningssats. Som sådant var ett stort antal elektriska stimuleringar väsentligt större (t.ex. 2000 nm) än vad som ses i naturligt förekommande transienter (vanligtvis 40-150 nm). Vid extremt stora koncentrationer av DA-frisättning är det möjligt att DA-transportören kan bli mättad, vilket leder till långsammare clearance kinetik än vad som skulle ses i det normala området. För att ta itu med detta direkt, valde vi endast elektriska stimulerings "försök" där den maximala DA-frisättningen var <200 nm. På samma sätt valde vi endast beteendeförsök där den maximala DA-frisättningen anpassades till SLO var åtminstone 100 nm. För varje ämne var alla berättigade försök i genomsnitt för analys. Med hjälp av denna mätning erhöll vi 23 elektriska stimulanser och 15 cue-framkallade sessioner i kärnan, och 14 elektriska stimulanser och 11 cue-framkallade sessioner i skalet.

Jämförelser av cue-versus elektriskt framkallade DA-utsläpp gjordes med användning av flera mätvärden. Först uppstod topp DA från beteendehändelserna hos SLO (dvs den största DA-koncentrationen inom 1.5 s SLO start), TLO (största DA-koncentrationen mellan 4 och 5.5 s efter SLO start) och belöning (största DA-koncentration mellan 6.5-8 s efter SLO start) för cue händelser, och vid motsvarande tidpunkter för elektriskt stimulerade händelser (dvs samma tidspunkter, men efter stimuleringsstart snarare än SLO början). Därefter granskades clearance-dynamiken med hjälp av tidigare publicerade mätvärden (Yorgason et al., 2011). Närmare bestämt tittade vi på latens till halveringstid (koncentration halva toppkoncentrationen) efter topp, T 20 (tiden för 20% förfallna från topp) och T 80 (tid för 80% sönderfall från topp). Dessa värden jämfördes med användning av en blandad modell ANOVA med användning av region (kärna, skal), stimuleringstyp (SLO inriktad, elektriskt stimulerad) som mellan-subjektfaktorer och antingen DA-koncentration vid varje händelse-typ (baslinje, SLO, TLO, och belöning) eller förfallsmål (latenser att toppa, T 20, halveringstid och T 80, respektive) som upprepade åtgärder. Post hoc jämförelser gjordes med hjälp av Tukeys HSD för ojämlikhet N.

Resultat

Förstärkt kedjans schema beteende

Råttor lärde sig snabbt kedjans schema uppgift. Vid den sista prekirurgiska sessionen fullbordade råttor i genomsnitt 99.8% av försöken exakt. Under dessa sessioner tog råttor i genomsnitt 783 ± 253 ms för att trycka på följande SLO, och 588 ± 298 ms för att trycka efter TLO, en skillnad som var nästan signifikant, t (17) = 1.77, p = 0.085 På postkirurgiska inspelningsdagar gjorde råttor emellertid nästan inga försummelser (99.5%), men visade signifikant snabbare responslatenser för TLP (999 ± 64 ms) än SLP (444 ± 39 ms), t (29) = 7.48, p <0.0001. Det är viktigt att det under inspelningsdagarna inte fanns några skillnader i svarets latens för djur som registrerats i skalet mot kärnan, t (29) = 0.78, p = 0.48. Således var råttor i båda grupperna (kärna och skal) lika kompetenta för att slutföra kedjans schema när uppgiften förstärktes.

Differential DA-frisättning i NAc-kärna och skal under förstärkt kedjeplan

Därefter använde vi FSCV för att få realtid DA inspelningar från antingen NAc-kärnan (n = 13) eller skal (n = 12) under prestanda på det vällärdade kedjeplanet (Fig 1 C). Vid råttor där flera inspelningar togs, sänktes elektrodspetsen åtminstone 300 μm mellan sessioner för att säkerställa att 100 μm kolfiberelektrodspetsen var helt i färsk vävnad för varje inspelning. I överensstämmelse med båda PE och IS modeller, fann vi robust fasisk DA-frisättning som började med början av SL och cue light (SLO) i både kärna och skal. Exempel på denna signalering från representativa inspelningssessioner (i genomsnitt över 30-försök) visas för kärnan (Fig 2 A) och skal (Fig 2 B), med färgplottar från ett enskilt djur. DA-signalering skiljer sig påtagligt mellan delregioner. Över alla råttor, i kärnan (Fig 2 C-E, svarta spår), toppade DA snabbt vid början av den mest prediktiva cue (SLO start) och sedan snabbt avböjt till baslinjen vid tidpunkten för TLP. I kontrast, i skalet (Fig 2 C-E, gråspår) var snabba ökningar av DA-koncentrationen sammanfallande med SLO presentation och förblivit förhöjd för andra motivationally framträdande stimuli med diskreta toppar vid TLO och belöna leverans innan du återvänder till baslinjen vid slutet av försöket.

Figur 1. 

A , Schematisk av uppgiftsdesign. Under kedjans schema utsträcktes en hävarm (SL) in i provkammaren samtidigt som ett ljusljus upplystes ovanför hävarmen (SLO). SLP släckte ljuset och drog in spaken. Efter en fördröjning förlängdes den andra hävarmen i kammaren (TL) och därtill hörande kuggljus upplyst (TLO). Efter en press på TL (TLP) råttor fick matförstärkning efter en fördröjning (R). B , Utrotningsbeteende hos djur med FSCV-inspelningar i kärnan eller skalet. Beteende och analys i utrotning grupperades efter block baserat på råttans beteende. Försök i den omedelbara föregående kedjeuppgiften användes för att jämföra händelser i utrotning. Tidig utrotning var alla prövningar fram till det första signifikanta fördröjningssvaret på SL, medan fördröjningsutrotning var alla prövningar mellan den första fördröjda SLP och den första utelämnda pressen efter SLO presentation. Inom det sena utrotningsblocket gjordes skillnader mellan huruvida ämnet gjorde en press eller utelämnat ett svar. C , Histologi av elektrodplaceringar i kärnan (svarta cirklar) och medialskal (gråcirklar).

Figur 2. 

Prestanda i det kedjiga schemat gav olika DA-frisättningsdynamik inom NAc. Dynamik för dopaminfrisättning i kärnan ( A ) och skal ( B ) av NAc inriktad till tiden för SL-förlängning i kammaren (SLO). Färgbilden visar var och en medeltal från ett representativt ämne i kärnan respektive skalet. Genomsnittlig tid (▴) för TL-förlängningen (TLO) och belöning (R) och intervall (± 2 SD) i förhållande till SLO visas längst ner. C - E , Överliggande ämne betyder DA-utsläpp över alla inspelningar i kärna (svart) och skal (grå) i förhållande till ( C ) SLO, ( D ) SLP, och förlängningen av TLO 4 s senare, och ( E ) TLP, och belöningen (R) matpelleten levereras 2.5 s efter tryck. Streckad linje visar SEM av medelvärdet för varje region. Nedersta raden ( F - H ) visar genomsnittlig topp DA-frisättning för varje beteendehändelse. *p <0.05 mot baslinjen; †p <0.05 kärna kontra skal.

Vi kvantifierade dessa observationer genom att medelvärda alla inspelningar som tagits i antingen kärnan eller skalet, anpassade till var och en av beteendehändelserna i kedjeplanen (Fig 2 C-H). I FSCV-inspelningssessionerna är tiden mellan SLP och TLO fixerades (4 s) som var tiden mellan TLP och belöning leverans (2.5 s) för att möjliggöra bättre anpassning av uppgift stimuli för DA analys. Således anpassar sig till SLO, SLP/ TLO, och TLP/ belöna tillåten anpassning av alla beteendemarkörer och tillåten analys av topp DA-frisättning i förhållande till dessa händelser.

En tvåvägs ANOVA-jämförande topp (max DA-koncentration inom 300 ms följande händelse) DA-koncentrationer över region (kärna, skal) och händelse (baslinje, SLO, SLP, TLO, TLP, belöning) indikerade att skalet släppte mer DA totalt än kärnan, F (1,24) = 13.63, p <0.002. Viktigt är att en betydande interaktion mellan region × händelse, F (5,120) = 9.88, p <0.0001, avslöjade att DA-signalering i kärnan och skalet svarade differentiellt på beteendemässiga händelser (Fig 2 F-H). Specifikt ökade kärna DA-frisättningen väsentligt vid SLO, i förhållande till baslinjen (p <0.0001) och förblev över baslinjen vid SL-tidpunktenP (p <0.0001), dock betydligt under SLO (p <0.05). Det fanns dock inga skillnader i topp DA i kärnan jämfört med baslinjen för antingen TL-händelse (TLO vs baslinjen, p = 0.59; TLP vs baslinjen, p = 1.0), och ingen skillnad från baslinjen vid tidpunkten för belönings kvitto (p =

Däremot uppvisade topp DA-koncentrationer i skalet signifikant DA-frisättning för alla händelser. Alla händelser var förknippade med större DA-frisättning än baslinjen (alla jämförelser jämfört med BL, p <0.0002), medan ingen av händelserna skilde sig markant från varandra (alla parvis SLO, SLP, TLO, TLP, och belöning jämförelser, p > 0.96).

Direkt jämförande kärna och skal fann vi viktiga skillnader i DA-signalering mellan regioner. Även om det inte fanns några skillnader i DA-frisättning under antingen baslinjen (p = 1.0) eller SL-händelserna (SLO, p = 1.0; SLP, p = 0.22), skalet DA var signifikant förhöjt jämfört med kärnan för båda TL-händelserna (TLO, p <0.01; TLP, p <0.001) och belöning (p <0.0005; Fig 3 D-F).

Figur 3. 

Förändringar i DA-signalering mellan början av sessionen (tidig, första 5-försök i kedjan) jämfört med slutet av sessionen (sena, sista 5-försök). A , Genomsnittliga DA-koncentrationer i NAc-kärnan från medelvärdet för varje försöks första fem försök (ljusblå) och de senaste fem försöken (lila). B I kärnan var topp DA-signalering inom ämnet oändad mellan början av sessionen och slutet. C , Genomsnittliga DA-koncentrationer i NAc-skalet från medelvärdet för varje försöks första fem försök (röd) och de senaste fem försöken (orange). D , Shell DA visade en signifikant in-subjects minskning vid både SLP och TLP indikatorer och belöning (**p <0.01), medan minskningen vid SLO cue var nästan signifikant (#p = 0.073). Felstavar visar SE av skillnaden (tidigt mot sent).

Regionspecifika förändringar i DA-utsläpp mellan början och slutet av sessionen

Därefter jämförde vi DA-frigöring i kärnan och skalet under den förstärkta kedjeplaneringsuppgiften vid början av sessionen (första 5-försöken) mot slutet av sessionen (sista 5-försök; Fig 3). Detta var viktigt att testa för att säkerställa att elektroden var stabil under hela sessionen (det vill säga att elektroden inte förlorade känsligheten över tiden) och också för att bedöma huruvida DA spårar några subtila förändringar i motiverande tillstånd (till exempel på grund av effekter av minskad hunger efter att ha konsumerat maten) efter presentation av de olika stimuli.

I kärnan (Fig 3 A), en tvåvägs ANOVA indikerade en signifikant huvudverkan av händelsen (BL, SLO, SLP, TLO, TLP, Rew; F (5,65) = 35.03, p <0.0001), men ingen effekt av sessionens fas (tidigt mot sent; F (1,13) = 3.55, p = 0.08), eller interaktion mellan händelse × sessionsfas (F (5,65) = 0.82, p = Post hoc jämförelser mellan tidiga och sena block visade att topp DA-frisättning i förhållande till beteendehändelserna i kärnan var densamma mellan början och slutet av sessionen (Tukey: alla tidiga vs sena parvisa jämförelser för BL, SLO, SLP, TLO, TLP, och belöna, p > 0.50; Fig 3 B).

Fasisk DA-frisättning till uppgiftstimuli minskade emellertid generellt över sessionen i skalet (Fig 3 C,D), med signifikanta huvudeffekter av händelsen (F (5,55) = 13.52, p <0.0001), session fas (F (1,11) = 6.95, p = 0.02), och en växelverkan mellan händelse och sessionsfas (F (5,55) = 3.74, p = 0.006). Som i kärnan, post hoc tester indikerade ingen skillnad vid BL, men signifikanta minskningar i topp DA-frisättning till SLP, TLP, och belöning (Tukey: allt p <0.0005), en trend mot betydelse vid SLO kö (p = 0.060), men ingen skillnad vid TLO kö (p = 0.36). Således begränsades förändringar i skal (men inte kärnan) främst till motiverade åtgärder och belönar konsumtion med differentiella (om än blygsamma) effekter. Dessa övergångsförskjutningar i DA-frisättning berodde inte på generaliserade förändringar i elektrodkänslighet utan i stället föreslår att stimulerings- och skalspecifika förändringar i DA-frisättningsmönster indikerar information om den förändrade betydelsen av uppgiftsstimuli över upprepade försök. Med tanke på att djur hade konsumerat minst 25 pellets i genomsnitt vid varje inspelningssession (dvs. 1144 mg eller 7.6% av vikten av råttornas dagliga livsmedelsbegränsade regim), tyder dessa resultat på att ökad intag av maten lyckades reducera det motiverade hungerstillståndet hos djuret, vilket manifesterades i förändringar i skalet men inte kärnan under sessionens gång.

Cue-framkallad mot elektriskt stimulerad DA-dynamik i kärna och skal

Ett tillvägagångssätt för dessa resultat kan vara att kärnan och skalet har olika DA-frigöringsdynamik på grund av att DA transporteras lägre densitet i skalet jämfört med kärnan (Jones et al., 1996; Budygin et al., 2002). Det är sålunda möjligt att skalet DA ses vid TL och belöna händelser beror på återstående DA-frisättning vid SL-tidenO, men kan inte rensas från synaptisk överflöde så effektivt som i kärnan. För att hantera detta jämförde vi elektriskt stimulerad DA-frisättning vid samma elektrodplats som under kedjans schematupptagningar för att se om elektriskt stimulerad dynamik matchade cue-framkallad dynamik i kärnan och skalet (Fig 4 A). Vi förutspådde att om den långsammare clearancekinetiken i skalet var ansvarig för skillnaderna i efterföljande händelsessignalering (t ex TLO) mellan kärnan och skalet, då bör elektriskt stimulerad och cue-framkallad frisättning i deras respektive delregioner följa nästan identiska mönster för frisättning och frigöring. I motsats härtill skulle signifikanta avvikelser från elektriska stimuleringar föreslå att DA-frisättningen i det området spårar uppgiftsrelaterade händelser på ett sätt som inte kan förklaras av enbart synaptisk clearance-dynamik.

Figur 4. 

Jämförelse av elektriskt stimulerad mot cue-framkallad DA-signalering i NAc-kärnan och skalet. A , Genomsnittlig koncentration av DA inriktad på antingen SLO cue eller elektrisk stimulering av VTA-fiberstart. Tidpunkten för starten av TLO cue och belöning uppskattades på ett antal svarstider för de resultat som följer SLO (genomsnittlig svarstid anges med triangel; bredd indikerar ± 95% konfidensintervall). B , Jämförelse av genomsnittlig baslinje (BL) DA koncentrationer till topp DA koncentration inom 1 s av SLO eller elektrisk stimulering (Stim / SLO) och inom intervallet 95% konfidensintervall för de tider som motsvarar TLO eller belöna epoker. C , Latens till toppkoncentration efter SLO eller elektrisk stimulering (Peak Lat) och efterföljande sönderfall (clearance) efter frisättning i kärnan och skalet. T20 och t80 är de gånger då signalen har sönderfallit 20% och 80% bort från topp, medan halveringstiden är latentföljdspetsen till uppnådd halv-toppkoncentration. *p <0.0001, elektrisk stimulering / SLO mot baslinjen; †p <0.0001, skal: Cue större [DA] än alla andra stimuleringstyper; ‡ p <0.0001, skal: Cue större latens för att förfalla från topp än alla andra stimuleringstyper. Felstaplar visar SE för skillnaden (cue vs electric).

Sammantaget fann vi att kärnan och skalet skilde sig skarpt i deras förhållande mellan cue-framkallad och elektriskt framkallad DA-frisättning (Fig 4 B). Om man tittar på toppkoncentrationer vid uppgiftshändelser var det signifikanta skillnader i DA-koncentrationer som en växelverkan mellan region (kärna / skal) × stimuleringstyp (elektrisk mot cue) × händelse (BL, SLO, TLO, Rew; F (3,174) = 12.31, p <0.0001). I kärnan var maximala DA-koncentrationer för cue-framkallade och elektriskt stimulerade spår nästan identiska; det fanns inga statistiska skillnader mellan dessa stimuleringstyper vid baslinjen, SLO, TLO, eller belöna epok (Tukey: allt p > 0.80). Däremot visade skalet ett annat dynamikmönster mellan elektriskt och cue-framkallat DA-frigöringsmönster. Även om det inte fanns någon skillnad i koncentration vid baslinjen eller SLO (Tukey: båda p > 0.98), var DA betydligt större för TLO och belöna epoker i de cued försöken jämfört med de elektriska stimulanserna (båda p <0.0001).

På samma sätt visade hastigheten för frisättning och efterföljande clearance från synaps ett liknande mönster (Fig 4 C). Tittar på clearance-värden som en funktion av sönderfall från topp, var det en signifikant växelverkan mellan region × stimuleringstyp × sönderfallsparametern (topptid, T20, halveringstid, T80; F (3,174) = 80.23, p <0.00001). Som ovan skiljer sig kärnavståndet och förfallsdynamiken inte mellan kö-framkallade och elektriskt framkallade stimuleringstyper. Latens till topp, T 20, halveringstid och T 80 var alla statistiskt lika oavsett stimuleringstyp (elektrisk vs cue; allt p > 0.95). Däremot uppvisade DA-nivåer i skalet signifikant försenad förfall till baslinjen efter SLO presentationer i förhållande till elektriskt stimulerade försök. Medan latens att toppa och T 20 liknade mellan cue-framkallade och elektriskt framkallade stimuleringar (p > 0.98), latens till halveringstid (p <0.0001) och T 80 (p <0.0001) fördröjdes signifikant i de cued-studierna i förhållande till den elektriska stimuleringen. Sammantaget visar dessa resultat att inneboende skillnader i clearance kinetik i skalet och kärnan är otillräckliga för att förklara skillnader i DA-signalering under beteendeprestanda.

Utrotningsbeteende

Råttor visade utrotningsbeteende under sessioner när matbelöningen utelämnades genom att gradvis öka latensen för att trycka på de olika spakarna under utrotningsperioden. Vi genererade beteendefinierade faser baserat på dessa latensförskjutningar i förhållande till presslatens på SL och TL under den omedelbart föregående förstärkta kedjesessionen. Den tidiga fasen definierades som försöken där latenser var desamma som under den förstärkta sessionen. När råttorna tryckte spaken betydligt långsammare (dvs> 2 SD) än normalt kallades detta fördröjningsfasen som varade från det första fördröjda svaret tills ämnet utelämnade ett svar. Alla försök efter denna första utelämnande benämndes sen fas baserat på om råttan pressade (sen press) eller utelämnade ett svar (sent ingen press).

Först bedömde vi antalet försök som utfördes innan råttorna uppvisade ett latent skifte från tidig till fördröjningsfas, såväl som antalet försök till den första utelämnade försöket (dvs skift till sen fas) för respektive SL och TL (Fig 5 A). Råttor saktade svara på TL betydligt innan de gjorde det för SL, parade t testa: t (7) = 2.49, p = 0.04, vilket tyder på att TL (kanske på grund av sitt omedelbara förhållande till belöningen) var mer känsligt för beloppets utelämning än SL. I motsats därtill var antalet försök innan det första utelämnandet var nästan identiskt för både SL och TL-hävstångarna (p > 0.9), vilket kanske indikerar att utelämnade svar endast släpptes när förutsägelsen av belöning exakt hade uppdaterats till noll vid försökets början. I enlighet med detta hittade vi sällan försök där djur utförde en SLP men utelämnade en efterföljande TLP svar (endast 4 / 140 totala senfasförsök, 2.9%), vilket tyder på att råttor nästan uteslutande utförde antingen hela kedjesekvensen eller alls inte. Som sådan var utelämnanden troligen mer kopplade till information som finns tillgänglig på SL än TL.

Figur 5. 

Extinktionsbeteende hos djur med FSCV-inspelningar i kärnan eller skalet. A Antalet försök före råttor visade först en signifikant ökning av svarsfördröjningen för att skifta från den tidiga till fördröjningsfasen av utrotning (vänster) och responsutsläpp (höger) för SL (ljusgrå) och TL (mörkgrå). Råttor visade en latensväxling för TL i betydligt färre försök än SL, men antalet försök innan en försök utelämnades var densamma mellan att söka och ta svar. *p <0.05 SL kontra TL. B , Respons latens att svara på SL (vänster) och TL (höger) över utrotningsfaser. Respons latens ökade över block, och var signifikant längre i fördröjningen och sena utrotningsblock för SL-pressarna. Press på TL var tillförlitligt snabbare än de på SL inom varje block. *p <0.05, **p <0.01 mot tidigt Ext.

Därefter undersökte vi genomsnittliga latenser för SLP och TLP i varje fas baserat på ovanstående kriterier. En tvåvägs upprepade åtgärder ANOVA, som jämförde latentiteten hos de olika hävstångarna (SL, TL) under olika faser av uppgiften (kedja, tidig utrotning, fördröjning av utlösning, sen press) visade en signifikant huvudverkan av hävarmen (F (1,4) = 45.7, p = 0.003), vilket berodde på betydligt snabbare svar på TL än SL (Fig 5 B), i överensstämmelse med prestanda under typiska förstärkta sessioner och en signifikant huvudverkan av utrotningsfasen (F (3,12) = 14.5, p <0.001). För SL, SLP svar under tidig utrotning liknade dem under den förstärkta kedjesessionen (Tukey: p = 1.0), men avsevärt avtagit av fördröjningen (p = 0.02 vs tidigt) och sen press (p = 0.003 vs tidiga) faser. Presstryckningar på SL var emellertid likartade mellan fördröjningen och senfasen (p = 0.89). För TL-presser var svarsförskjutningshastigheten mer subtil, med senfasen betydligt långsammare än den tidiga fasen (p = 0.04). En linjär kontrast svarade emellertid för den största andelen av variation i TL-latensskiftet (F (1,4) = 11.08, p = 0.03; 86% av huvudeffektsvariationen) medan för kontrasten SL en kontrast som jämförde kedjan och tidigt mot fördröjningen och sena faser stod för den största andelen av effektvarianansen (F (1,4) = 15.42, p = 0.02; 97% av huvudeffektsvariationen).

Extinction: utelämnat resultat ökar differentiellt kärn- och skal DA signalering

Händelsesrelaterad DA-signalering i NAc skiftades när råttan utvecklades genom de beteendedefinierade faserna av utrotning. Det sätt på vilket DA-kodning påverkades av utrotning varierade påfallande mellan kärna och skal (Fig 6).

Figur 6. 

DA-frigöring i kärnan ( A - C ) och skal ( D - F ) under utrotning. A , Anpassning till SLO i kärnan avslöjade en kontinuerlig minskning av den centrala DA-frisättningen till cue över iterativa utrotningsförsök (blåa linjer) i förhållande till belönade kedjesessioner (svart linje). BvCore DA-utsläpp till operant svar och belöning under det förstärkta kedjeplanet (svart) och tidig utrotning (blå) inriktad på TLP händelse. Gråstången visar intervallet av maximala och minimala koncentrationer av DA under baslinjen. C , Peak DA relativt SLP, TLP, och belöning i det förstärkta schemat och tidig utrotning. D , Anpassning till SLO i skalet (röda linjer) avslöjade mer diskreta minskningar i fasisk DA-frisättning till cue över iterativa utrotningsförsök i förhållande till belönade kedjesessioner (svart linje). E , DA-signalering inriktad på TLP i skalet i tidig utrotning (röd) och det förstärkta kedjan schemat (svart). F Peak DA i skalet var oförändrat vid SLP, men visade signifikanta minskningar vid TLP och belöning. *p <0.05, **p <0.01, kedja kontra tidig utrotning; †p <0.05, utelämnande mindre än baslinjen.

Vi undersökte först DA signalering i kärnan under utrotning. I förhållande till SLO, DA minskade signifikant och linjärt över de olika utrotningsfaserna i förhållande till den belönade kedjesessionen (interaktion: fas × cue; SLO vs baslinjen; F (4,157) = 33.19, p <0.0001; Fig 6 A. Post hoc parvisa jämförelser visade att topp DA till SLO snabbt minskat mellan kedjan och de tidiga utrotningsfaserna (Tukey: p <0.0001) och igen mellan tidig utrotning och sen utrotning (p <0.0001). DA under fördröjningsutrotningen var dock inte annorlunda än i senpressblocket (p = 0.64) och topp DA var inte olika i den sena fasen baserat på huruvida råttan gjorde ett svar eller inte (sen press vs sen ingen press, p = 0.99). Vidare släpps DA under SLO var signifikant större än baslinjen i kedjan (p <0.0001), tidig utrotning (p <0.0001) och fördröjning av utrotning (p <0.001) faser, men inte i sen press eller sent inga pressfaser (båda p > 0.5). Dessa parvisa resultat stödde en signifikant negativ linjär trend (F (1,157) = 94.77, p <0.0001), som stod för en majoritet (71%) av effektvariansen.

Därefter är ett kännetecken för PE-signaler i hjärnan närvaron av negativa förutsägelsesfel vid tidpunkten för en utelämnad förväntad belöning (Schultz et al., 1997). Vi förväntade oss att dessa signaler skulle vara starkast tidiga i utrotning när ämnet hade full förväntan om att belöningen skulle levereras. I kärnan (Fig 6 B), en tvåvägs ANOVA indikerade en signifikant interaktion av händelse × fas (kedja vs tidig utrotning; F (3,57) = 3.24, p = 0.029). Specifikt, även om topp DA-frisättning i förhållande till föregående SLP reducerades avsevärt vid tidig utrotning i förhållande till den förstärkta kedjesessionen, (Tukey: p = 0.019), DA släpps till TLP var opåverkad (p = 0.41). Kritiskt visade kärna DA att det var ett negativt prediktionsfel vid utrotning (Fig 6 B) så att DA-frisläppande under tiden för den förväntade men utelämnade belöningen var signifikant lägre än under den förstärkta sessionen (p = 0.003). Faktum är att topp DA-frisättning till belöningen inte var annorlunda än baslinjen under den förstärkta kedjesessionen (p = 0.99), skiftade den till betydligt mindre än baslinjen under beloppet utelämnanden (p = 0.03). Sålunda visade DA signaler i kärnan under tidig utrotning både dynamiska skift i frisättning till prediktiva SL-stimuli och åtgärder, ingen förändring i förhållande till en TL-cue och ett negativt prediktionsfel för att belöna utelämnandet.

Skalet visade ett annat mönster av DA-frisättning i förhållande till SLO kö (Fig 6 D). Här, underordnad genomsnittlig cue-framkallade DA till SLO dynamiskt förändrad över faser, (interaktion: fas × cue; F (2,24) = 7.95, p <0.0005), men till skillnad från kärnan ändrades inte shell DA mellan kedjefasen och tidig utrotning, (p = 0.74), men DA signalerar till SLO minskades signifikant under fördröjningsdödningsfasen relativt både den förstärkta kedjefasen (p = 0.041) och den tidiga utrotningsfasen (p = 0.02), sammanfaller med råttornas motivationsförändring i beteende (Fig 5). DA-signaleringen minskade signifikant igen mellan fördröjningsfasen och sena faser (sen press, p = 0.03; sen ingen press, p = 0.004), men det fanns ingen skillnad i DA nivåer mellan de sena faserna (tryck mot ingen press, p = 0.43). Som i kärnan släpper DA ut under SLO var signifikant över baslinjen under kedjan, tidig utrotning och fördröjning av utrotningsfaser (Tukey: all p <0.001), men ingen av de sena faserna skilde sig signifikant från baslinjen. Således släpper kärn-DA snabbt och kontinuerligt förändringar i förutsägelse för den mest förutsägbara signalen, medan DA-mönster släpps för samma kö i skalet istället spårade förändringar i motiverande tillstånd mellan utrotningsfaser.

När man tittar på trycknings- och belöningssignaler skiljer sig skalet DA-utgåvan från mönstret i kärnan (Fig 6 E,F). En tvåvägs ANOVA undersöker DA på individuella försök med stimulustyp (BL, SLP, TLP, belöning) och utrotningsfas (kedja, tidig utrotning) fann en signifikant växelverkan mellan stimulans × utrotning (F (3,108) = 11.5, p <0.0001; Fig 6 D). Till skillnad från kärnan var det ingen skillnad i toppskal DA release till SLP tidigt i utrotning (p = 0.44). I stället inducerade utrotning en signifikant minskning av DA-frisättning till både TLP (p = 0.01) och vid tidpunkten för beloppets förlust i förhållande till belöningsavgift (p <0.0001) relativt den matchade tiden under det förstärkta kedjeschemat. Under den belönade kedjesessionen höjdes DA betydligt över baslinjen (p <0.0001), men under utelämnande av belöningar var DA numeriskt större än, men inte statistiskt annorlunda från baslinjen (p = 0.07). Således fann vi, i motsats till kärnan, begränsade bevis för tidiga utdödesprognosfel, och i stället en minskning av DA-frisättning i förhållande till TL (men inte SL) -pressen såväl som eliminering av DA-frisättning vid belöningen som ses under det förstärkta schemat.

Diskussion

Phasic DA-frisättningsmönster spårade stimuli som påfallande skilde sig mellan NAc-subregioner på ett sätt som överensstämde med kontrasterande teorier om DA-funktionen. I en väl inlärd kedjeplanuppgift toppade DA i NAc-kärnan selektivt vid den mest prediktiva cue och linjärt spårade förändringar i prediktionsvärde och fel vid utrotning. Däremot spårade fasisk DA-frisättning i NAc-skalet alla framträdande stimuli när uppgiften belönades, och både inom session och vid utrotning visade förändringar i signalering i överensstämmelse med motivationskift. Som sådan föreslår vi att dessa DA-signaler samtidigt är tillgängliga för djuret under beteende, vilket möjliggör både prediktiv och motiverande information för att vägleda lärande och handling.

Core DA release spår förutsägelse fel

I kärnan ökade DA phasically vid tidpunkten för SL cue-presentation och avböjde till baslinjen för fullt förutsagda senare händelser (t.ex. TL, belöning), som liknar tidigare resultat (Roitman et al., 2004; Cacciapaglia et al., 2012). Detta mönster av aktivitet överensstämmer med felprognosmodeller, som anger att maximalt prediktiva signaler bör framkalla den högsta DA-frisättningen (dvs prediktion), medan noggrant förutsagda händelser som följer bör framkalla minimal DA-frisläppning (dvs prediktionsfel). Således som TL och belöning förutspåddes exakt av SL, genererade de lite fel vid deras leverans och framkallade lite felrelaterat DA-frisläppande (Schultz et al., 1997; Schultz och Dickinson, 2000).

Vårt laboratorium och andra har visat att DA-signaler i kärnan är känsliga för skillnader i förutsagt värde och moduleras av subjektiva faktorer som riskpreferens och fördröjningar till förstärkning (Day et al., 2010; Gan et al., 2010; Sugam et al., 2012; Saddoris et al., 2013, 2015). Till exempel, hos råttor som utför en riskfylld beslutsuppgift, skalades kärnan DA med ledtrådar som förutspådde råttans föredragna alternativ och sjönk snabbt under baslinjen när förväntade belöningar utelämnades, vilket indikerar ett negativt förutsägelsefel (Sugam et al., 2012). På samma sätt spårade kärna DA både värdet av förutsagda resultat och flyttades dynamiskt baserat på det uppdaterade förutsagda cue-värdet vid utrotning. Faktum är att DA släpps till SLO var inte annorlunda än utgångspunkten när råttan började utelämna svar vid utrotning, oavsett huruvida ett svar gjordes, vilket tyder på att DA signalerade det förväntade värdet av att svara, snarare än motivationen att trycka. Vidare framkallade belöningsutelämnanden tidigt i utrotning robusta pauser i DA-utgåvan, vilket överensstämde med negativ prediktionsfelsignalering.

Shell DA spårar motivationellt framträdande stimuli

DA-frisättning i skalet diskret spårade alla framträdande stimuli (SLO, TLO, R). Dessa mönster kunde inte förklaras av långsammare återupptagskinetik och verkar istället reflektera realtidskodning av kontingenthändelser (Pan et al., 2005) och förvärvat incitamentsalience (Berridge och Robinson, 1998; Berridge, 2012; Wassum et al., 2012). Sålunda frigör DA händelser som kodas både för prediktiva signaler och belöningar i skalet, men endast prediktiva signaler i kärnan (Cacciapaglia et al., 2012).

Vi hittade bevis för denna motivativa komponent av skal DA signalering. Först minskade DA-signalering i skalet till stimuli mellan början och slutet av sessionerna, vilket inte sågs i kärnan. En förklaring är att råttor i slutet av sessionen var helt enkelt mer sated (per definition hade de ätit mer mat än vid början av sessionen), och som sådana speglade indikatorer som förutsägde maten att det minskade motivationstillståndet hos djuret . Däremot förutspådde signalerna fortfarande noggrant leveransen av sackarospelleten, så PE-typkodningen i kärnan var relativt mindre påverkad av denna motivationsskift.

För det andra, under utrotning släpper DA i skalet till SLO förblev stabil medan råttan utförde uppgiften på samma motiveringsnivå (vilket indikeras av svarslatens och noggrannhet), men minskade signifikant efter att råttornas motivation minskade (dvs. svarslatens) under utrotningsförloppet. Däremot såg vi snabba minskningar av fas DA-frisättning under TL-stimuli. IS-modeller förutspår att ledtrådar som minskar osäkerheten bör skapa större motivation och incitament.Zhang et al., 2009; Smith et al., 2011), som här är förspänd mot TL, eftersom det är maximalt förutsägbart för övergående belöningsavgift. Faktum är att intra-NAc-skalinfusioner av amfetamin potentiellt förstärker kodningen av signaler som är mest proximala till belöningsleveransen i en kedjad pavlovianuppgift, men har mindre effekt på den första koden i sekvensen (Smith et al., 2011). Sålunda var DA-kodning av TL särskilt känslig för den förutsagda förlusten av belöningsavgivning vid utrotning. Överraskande resulterade inte belöningsutelämnanden i att DA släpptes under baslinjen, vilket tyder på att skal DA var mindre benägna att koda ett negativt prediktionsfel än kärnan. Sammantaget skiljer sig detta mönster av signalering i NAc-skalet tydligt från kärnan och tyder på kodning av IS-typ.

Som stöd har NAc-skalet blivit implicerat i en mängd motivationsdrivna beteenden. Exempelvis kan salt aptit, där en salt lösning normalt är aversiv, vara givande om djuret är saltberövat. I båda fallen är det förutspådda resultatet (salt) detsamma, men motivationen att få det resultatet skiljer sig från de normala och saltberövade djuren (Tindell et al., 2009). NAc-neuralkodning för den salta lösningen moduleras i skalet baserat på graden av saltmotivering, medan kärnneuroner misslyckades med att visa tillståndsbaserade skillnader (Loriaux et al., 2011). På samma sätt potentierar intrafetaminskelmikroinfusioner av amfetamin kraftigt den motiverande kraften i spaken som pressar i närvaro av en cue under pavlovian-to-instrument transfer (PIT), liksom den kroniska pretransferupplevelsen med kokain (Wyvell och Berridge, 2000; Saddoris et al., 2011; LeBlanc et al., 2013). Erfarenheten av självadministrerad kokain som förstärker PIT-beteendet ökar också företrädesvis NAc-skalets neurala kodning relativt kärnan (Saddoris et al., 2011).

Detta mönster av IS och PE i skalet och kärnan verkar spåra både appetitiva och aversiva förhållanden. I pavlovian rädslan konditioneras Phasic DA i NAc-skalet för tydliga aversiva signaler, medan kärna DA-frigöringssåg minskar och pausar i frisättning som indikerar PE-typ förutsägelse av ett negativt utfall (Badrinarayan et al., 2012). Således kan även negativa (men uppenbara) händelser redovisas med en IS-typmodell i skalet, medan kärna DA-frigöringen förblir starkt kopplad till förutsägelser av utfallsvärde.

Komplexiteten av PE och IS-signalering i konditionering

Ett tillvägagångssätt är att vid pavlovian-konditionering visar djur som föredrar interaktion med prediktiva signaler ("sign trackers") en förbättrad DA-frisättning i NAc-kärnan jämfört med de som omedelbart går till matkoppen ("målspårare"; Flagel et al., 2011). Denna ökade teckenuppföljning beskrivs som stödjande IS, eftersom koden har blivit en framträdande stimulans som kan fungera som en motiverande "magnet" och överensstämmer med liknande resultat i kärnan (Aragona et al., 2009; Peciña och Berridge, 2013; Wassum et al., 2013; Ostlund et al., 2014). Detta verkar vara i strid med vår uppgift av PE förspänd till kärnan och IS till skalet.

Det är viktigt att notera att de respektive rollerna i DA-signalen i kärnan och skalet är sannolikt komplexa. Till exempel har få av de ovannämnda studierna självständigt undersökt rollen som skal och kärna i dessa uppgifter, så ökad DA i kärnan i djur som registrerar spårning kan helt enkelt återspegla en generaliserad ökning av incitament DA-signaler i mesolimbicvägen. Vidare förespråkar vi inte en absolut uppdelning; Vi hittade några DA-släpp till TLO i kärnan, även om DA till SLO i skalet kvarstod trots förändringar i motivation under utrotning, vilket tyder på att funktioner hos IS kan vara närvarande i kärnan och PE i skalet (även vid lägre nivåer och / eller mindre mottagliga för arbetsdynamiken). Vi föreslår snarare att kärna och skal representerar en kritisk förspänning mot PE- och IS-typkodningsmönster, vilket överensstämmer med den mer gradvisa sammansättningen av striatalanatomi (Haber, 2014).

Inverkan på missbruk

Modellbaserade skillnader i kärna och skal DA-signalering har viktiga konsekvenser utöver det naturliga belöningssättet. Till exempel, även om droger av missbruk i början är givande, kan läkemedelsrelaterade stimuli med tiden ge upphov till känslor av intensivt aversivt begär, vilket innebär ett negativt affektivt tillstånd som driver läkemedelssökande (Koob och Le Moal, 1997). Långvarig avhållsamhet från droger ökar effekten av läkemedelsrelaterade stimuli även om en process som kallas inkubation av begär (Grimm et al., 2001; Hollander och Carelli, 2005; Pickens et al., 2011). Det förutspådda utfallet (läkemedel) är oförändrat i både det omedelbara och avstämda tillståndet, men det finns en djup ökning av motivationen att återuppta läkemedelsintag hos de avstående. Detta föreslår en signifikant förändring av dessa stimuli incitament uppmärksamhet och skulle förutsäga att abstinensrelaterade förändringar företrädesvis bör ses i skalet. När råttor som ger läkemedel själv administreras presenteras med kokain-förutsägbara signaler som inducerar ett motbjudande motiverande tillstånd, spårar förändringar i DA-signalering djurets aversiva tillstånd i skalet men inte kärnan (Wheeler et al., 2011). Sammantaget stöder dessa resultat den kärnan och skalet DA-bidrag till inlärning och motivation är konsekventa över både natur- och drogbelöningar.

fotnoter

  • Mottagen juni 18, 2015.
  • Revisionen fick juli 8, 2015.
  • Godkänd juli 15, 2015.
  • Detta arbete stöddes av National Institutes on Drug Abuse Grants DA028156 och DA035322 till MPS och DA017318 och DA034021 till RMC, och DA010900 till RMW Vi tackar Dr Elizabeth West för kommentarer till ett tidigare utkast till detta arbete.

  • Författarna förklarar inga konkurrerande ekonomiska intressen.

  • Korrespondens bör adresseras till Dr Michael Saddoris, Institutionen för psykologi och neurovetenskap, University of Colorado Boulder, Muenzinger, UCB 345, Boulder, CO 80309-0345. [e-postskyddad]

Referensprojekt

    1. Aragona BJ,
    2. Dag JJ,
    3. Roitman MF,
    4. Cleaveland NA,
    5. Wightman RM,
    6. Carelli RM

    (2009) Regional specificitet i realtidsutveckling av fasiska dopaminöverföringsmönster vid förvärv av en cue-kokainförening hos råttor. Eur J Neurosci 30: 1889-1899.

    1. Badrinarayan A,
    2. Wescott SA,
    3. Vander Weele CM,
    4. Saunders BT,
    5. Couturier BE,
    6. Maren S,
    7. Aragona BJ

    (2012) Aversive stimuli modulerar differensiellt realtidsdopaminöverföringsdynamiken inom kärnan accumbens kärna och skal. J Neurosci 32: 15779-15790.

    1. Berridge KC

    (2012) Från prediktionsfel till incitamentsalience: mesolimbisk beräkning av belöningsmotivering. Eur J Neurosci 35: 1124-1143.

    1. Berridge KC,
    2. Robinson TE

    (1998) Vad är dopaminens roll i belöning: hedonisk inverkan, belöningsbelöning eller incitamentsalience? Brain Res Rev 28: 309-369.

    1. Bromberg-Martin ES,
    2. Matsumoto M,
    3. Hikosaka O

    (2010) Dopamin i motiverande kontroll: givande, aversiv och varning. Neuron 68: 815-834.

    1. Budygin EA,
    2. John CE,
    3. Mateo Y,
    4. Jones SR

    (2002) Brist på kokaineffekt på dopaminutrymme i kärnan och skalet hos kärnans accumbens av dopamintransportör-uttäppta möss. J Neurosci 22: RC222.

    1. Cacciapaglia F,
    2. Saddoris MP,
    3. Wightman RM,
    4. Carelli RM

    (2012) Differentiell dopaminfrisättningsdynamik i kärnan accumbens kärna och skal spåra distinkta aspekter av målriktat beteende för sackaros. Neuro 62: 2050-2056.

    1. Cohen JY,
    2. Haesler S,
    3. Vong L,
    4. Lowell BB,
    5. Uchida N

    (2012) Neuron-typspecifika signaler för belöning och straff i det ventrala tegmentalområdet. Natur 482: 85-88.

    1. Dag JJ,
    2. Jones JL,
    3. Wightman RM,
    4. Carelli RM

    (2010) Phasic nucleus accumbens dopaminfrisättning kodar ansträngnings- och fördröjningsrelaterade kostnader. Biolpsykiatri 68: 306-309.

    1. Flagel SB,
    2. Clark JJ,
    3. Robinson TE,
    4. Mayo L,
    5. Czuj A,
    6. Willuhn jag,
    7. Akers CA,
    8. Clinton SM,
    9. Phillips PE,
    10. Akil H

    (2011) En selektiv roll för dopamin i stimulus-belöning lärande. Natur 469: 53-57.

    1. Gan JO,
    2. Walton ME,
    3. Phillips PE

    (2010) Dissocierbar kostnad och nytta kodning av framtida belöningar av mesolimbic dopamin. Nat Neurosci 13: 25-27.

    1. Grimm JW,
    2. Hoppas BT,
    3. Wise RA,
    4. Shaham Y

    (2001) Neuroadaptation: inkubation av kokainbehov efter tillbakadragande. Natur 412: 141-142.

    1. Haber SN

    (2014) Dopaminplatsen i cortico-basal ganglia kretsen. Neuroscience 282C: 248-257.

    1. Heien ML,
    2. Khan AS,
    3. Ariansen JL,
    4. Heja JF,
    5. Phillips PE,
    6. Wassum KM,
    7. Wightman RM

    (2005) Realtidsmätning av dopaminfluktuationer efter kokain i hjärnan hos beteende råttor. Proc Natl Acad Sci USA 102: 10023-10028.

    1. Hollander JA,
    2. Carelli RM

    (2005) Avhållande från kokain självadministration ökar nervkodningen av målriktade beteenden i accumbens. Neuropsychopharmacology 30: 1464-1474.

    1. Keithley RB,
    2. Carelli RM,
    3. Wightman RM

    (2010) Rankestimering och den multivariata analysen av in vivo- snabb-skanning cyklisk voltammetrisk data. Anal Chem 82: 5541-5551.

    1. Koob GF,
    2. Le Moal M

    (1997) Drogmissbruk: hedonisk homeostatisk dysregulering. Vetenskap 278: 52-58.

    1. LeBlanc KH,
    2. Maidment NT,
    3. Ostlund SB

    (2013) Upprepad kokainexponering underlättar uttrycket av incitamentmotivation och inducerar vanlig kontroll hos råttor. PloS One 8: e61355.

    1. Loriaux AL,
    2. Roitman JD,
    3. Roitman MF

    (2011) Nucleus accumbens skal, men inte kärna, spår motivationsvärdet av salt. J Neurophysiol 106: 1537-1544.

    1. Olmstead MC,
    2. Parkinson JA,
    3. Miles FJ,
    4. Everitt BJ,
    5. Dickinson A

    (2000) Kokain-sökande av råttor: Reglering, förstärkning och aktivering. Psychopharmacology 152: 123-131.

    1. Ostlund SB,
    2. LeBlanc KH,
    3. Kosheleff AR,
    4. Wassum KM,
    5. Maidment NT

    (2014) Phasic mesolimbic dopamin signalering kodar för underlättande av incitament motivation producerad av upprepad kokain exponering. Neuropsychopharmacology 39: 2441-2449.

    1. Owesson-White CA,
    2. Ariansen J,
    3. Stuber GD,
    4. Cleaveland NA,
    5. Heja JF,
    6. Wightman RM,
    7. Carelli RM

    (2009) Neural kodning av kokain-sökande beteende är sammantaget med fasisk dopaminfrisättning i accumbens kärnan och skalet. Eur J Neurosci 30: 1117-1127.

    1. Pan WX,
    2. Schmidt R,
    3. Wickens JR,
    4. Hyland BI

    (2005) Dopaminceller svarar på förutspådda händelser under klassisk konditionering: Bevis för behörighetsspår i belöningssystemet. J Neurosci 25: 6235-6242.

    1. Peciña S,
    2. Berridge KC

    (2013) Dopamin eller opioidstimulering av kärnan accumbens förstärker också cue-triggered "wanting" för belöning: hela kärnan och medialskalet mappas som substrat för PIT-förbättring. Eur J Neurosci 37: 1529-1540.

    1. Pickens CL,
    2. Airavaara M,
    3. Theberge F,
    4. Fanous S,
    5. Hoppas BT,
    6. Shaham Y

    (2011) Neurobiologi av inkubation av läkemedelsbehov. Trender Neurosci 34: 411-420.

    1. Redish AD

    (2004) Addiction som en beräkningsprocess gått fel. Vetenskap 306: 1944-1947.

    1. Robinson TE,
    2. Berridge KC

    (2008) Recension: Incitament sensibiliseringsteori av missbruk: några aktuella problem. Philos Trans R Soc Lond B Biol Sci 363: 3137-3146.

    1. Roitman MF,
    2. Stuber GD,
    3. Phillips PE,
    4. Wightman RM,
    5. Carelli RM

    (2004) Dopamin fungerar som en sekundärmodulator för matssökande. J Neurosci 24: 1265-1271.

    1. Saddoris MP,
    2. Gallagher M,
    3. Schoenbaum G

    (2005) Snabb associativ kodning i basolateral amygdala beror på anslutningar med orbitofrontal cortex. Neuron 46: 321-331.

    1. Saddoris MP,
    2. Stamatakis A,
    3. Carelli RM

    (2011) Neurala korrelater av Pavlovian-till-instrumentöverföring i kärnan accumbens skalet selekteras selektivt efter kokain självadministration. Eur J Neurosci 33: 2274-2287.

    1. Saddoris MP,
    2. Sugam JA,
    3. Cacciapaglia F,
    4. Carelli RM

    (2013) Rapid dopamindynamik i accumbenskärnan och skalet: lärande och handling. Front Biosci (Elite Ed) 5: 273-288.

    1. Saddoris MP,
    2. Sugam JA,
    3. Stuber GD,
    4. Witten IB,
    5. Deisseroth K,
    6. Carelli RM

    (2015) Mesolimbic dynamiska spår, och är orsakssamband med diskreta aspekter av värdebaserat beslutsfattande. Biolpsykiatri 77: 903-911.

    1. Schoenbaum G,
    2. Setlow B,
    3. Saddoris MP,
    4. Gallagher M

    (2003) Kodning förutspått resultat och förvärvat värde i orbitofrontal cortex vid cue-provtagning beror på inmatning från basolateral amygdala. Neuron 39: 855-867.

    1. Schultz W,
    2. Dickinson A

    (2000) Neuronal kodning av prediktionsfel. Annu Rev Neurosci 23: 473-500.

    1. Schultz W,
    2. Dayan P,
    3. Montague PR

    (1997) Ett neuralt substrat av förutsägelse och belöning. Vetenskap 275: 1593-1599.

    1. Smith KS,
    2. Berridge KC,
    3. Aldridge JW

    (2011) Disentangling nöje från incitament salience och lärande signaler i hjärnan belöning kretsar. Proc Natl Acad Sci USA 108: E255-E264.

    1. Sugam JA,
    2. Dag JJ,
    3. Wightman RM,
    4. Carelli RM

    (2012) Phasic-kärnan accumbens dopamin kodar för riskbaserat beslutsbeteende. Biolpsykiatri 71: 199-205.

    1. Tindell AJ,
    2. Smith KS,
    3. Berridge KC,
    4. Aldridge JW

    (2009) Dynamisk beräkning av incitamentsalience: "vill ha" det som aldrig var "likt". J Neurosci 29: 12220-12228.

    1. Tobler PN,
    2. Dickinson A,
    3. Schultz W

    (2003) Kodning av förutsagt belöningsutelämning av dopaminneuroner i ett konditionerat inhiberingsparadigm. J Neurosci 23: 10402-10410.

    1. Waelti P,
    2. Dickinson A,
    3. Schultz W

    (2001) Dopaminreaktionerna överensstämmer med grundläggande antaganden om formell inlärningsteori. Natur 412: 43-48.

    1. Wassum KM,
    2. Ostlund SB,
    3. Maidment NT

    (2012) Phasic mesolimbic dopamin signalering föregår och förutspår prestanda av en självinitierad åtgärdssekvensuppgift. Biolpsykiatri 71: 846-854.

    1. Wassum KM,
    2. Ostlund SB,
    3. Loewinger GC,
    4. Maidment NT

    (2013) Phasic mesolimbic dopaminfrigöringsspår belöning som söker under uttryck av pavlovian-till-instrumentöverföring. Biolpsykiatri 73: 747-755.

    1. Wheeler RA,
    2. Aragona BJ,
    3. Fuhrmann KA,
    4. Jones JL,
    5. Dag JJ,
    6. Cacciapaglia F,
    7. Wightman RM,
    8. Carelli RM

    (2011) Cocaine-signaler driver motsatta kontextberoende skift i belöningsbehandling och emotionellt tillstånd. Biolpsykiatri 69: 1067-1074.

    1. Wyvell CL,
    2. Berridge KC

    (2000) Intraaccumbens amfetamin ökar den konditionerade incitamentsalienceen av sackarosbelöning: förbättring av belöningen "vill" utan förbättrad "smak" eller responsförstärkning. J Neurosci 20: 8122-8130.

    1. Yorgason JT,
    2. España RA,
    3. Jones SR

    (2011) Demonspektametri och analysprogramvara: Analys av kokaininducerad förändring i dopamin-signalering med användning av flera kinetiska åtgärder. J Neurosci Metoder 202: 158-164.

    1. Zhang J,
    2. Berridge KC,
    3. Tindell AJ,
    4. Smith KS,
    5. Aldridge JW

    (2009) En neural beräkningsmodell av incitamentsalience. PLoS Comput Biol 5: e1000437.

  •