Diferenciální dynamika uvolňování dopaminu v jádře Accumbens jádra a Shell odhalit doplňkové signály pro chybu předpověď a motivace pobídky (2015)

  1. Regina M. Carelli 2

+Zobrazit affiliations

Příspěvky autora: Výzkum navržený MPS a FC; MPS a FC provedli výzkum; MPS a FC analyzovaná data; Příspěvek napsal MPS, RMW a RMC.

Abstraktní

Mezolimbický dopamin (DA) se během chutného chování postupně uvolňuje, i když existuje značná neshoda ohledně konkrétního účelu těchto signálů DA. Například modely predikční chyby (PE) naznačují roli učení, zatímco modely motivační salience (IS) tvrdí, že signál DA posiluje podněty hodnotou a stimuluje tak motivované chování. Avšak v rámci nucleus accumbens (NAc) se vzory DA uvolňování mohou nápadně lišit mezi podoblastmi, a jako takové je možné, že tyto vzorce odlišně přispívají k aspektům PE a IS. Abychom to mohli posoudit, měřili jsme uvolňování DA v podoblastech NAc během behaviorálního úkolu, který prostorově oddělil sekvenční cílové stimuly. Elektrochemické metody byly použity k měření uvolňování dopaminu NAc v sekundách a v jádru během dobře naučeného instrumentálního řetězce, ve kterém byly krysy vyškoleny, aby stiskly jednu páku (vyhledávání; SL), aby získaly přístup k druhé páce (odběr; TL) spojené s dodávka jídla a znovu během vyhynutí. V jádru bylo phasic DA vydání největší po úvodní SL prezentaci, ale minimální pro následující TL a odměnové události. Naopak phasic shell DA vykazoval robustní vydání ve všech událostech úkolu. Signalizace se snížila mezi začátkem a koncem relací ve skořápce, ale ne jádrem. Během zániku špičkové uvolňování DA v jádru ukázalo postupné snižování SL a pozastavení uvolňování během vynechaných očekávaných odměn, zatímco uvolňování DA shellu klesalo převážně během TL. Tato dynamika uvolňování naznačuje paralelní DA signály schopné podporovat odlišné teorie chuti k jídlu.

VÝSLOVNÝ PROHLÁŠENÍ Dopaminová signalizace v mozku je důležitá pro celou řadu kognitivních funkcí, jako je učení a motivace. Obvykle se předpokládá, že jediný dopaminový signál je dostatečný pro podporu těchto kognitivních funkcí, ačkoli konkurenční teorie nesouhlasí s tím, jak dopamin přispívá k chování založenému na odměnách. Zde jsme zjistili, že uvolňování dopaminu v reálném čase uvnitř jádra accumbens (primární cíl neuronů dopaminu midbrain) se nápadně liší mezi podoblastmi jádra a skořápky. V jádru je dynamika dopaminu v souladu s teoriemi založenými na učení (jako je chyba predikce odměny), zatímco ve skořápce je dopamin v souladu s teoriemi založenými na motivaci (např. Motivační výběžky). Tato zjištění ukazují, že dopamin hraje mnohočetné a doplňkové role založené na diskrétních obvodech, které pomáhají zvířatům optimalizovat odměňující chování.

Úvod

Pochopení úlohy signalizace dopaminu (DA) ve vztahu k učení, chování a závislosti je ústředním tématem behaviorální neurovědy. Současné teorie jsou v souladu s anatomickou organizací mezolimbického DA systému, kde relativně malá populace DAergických neuronů ve ventrální tegmentální oblasti (VTA) posílá kolaterály skrz mozek do široce modulovaných obvodů pro učení a činnost. Nedávné důkazy však naznačují, že signalizace DA může být heterogennější, než se dříve uvažovalo. Například phasic DA uvolňuje po stupnicích prediktivní odměny prediktivní s očekávanou hodnotou subjektivní odměny v jádru nucleus accumbens (NAc), ale nikoli shell (Day a kol., 2010; Sugam a kol., 2012). Naproti tomu jsou motivační posuny v hedonickém zpracování léků na predikci léčiv lokalizovány k fázovým změnám v uvolňování DA ve skořápce NAc, ale nikoli v jádru (Wheeler a kol., 2011). Dále jsme my a další ukázali, že uvolnění DA během naučených úkolů kódovalo stimuly odlišně mezi jádrem a shellem (Aragona a kol., 2009; Owesson-White a spol., 2009; Badrinarayan a kol., 2012; Cacciapaglia a kol., 2012). Namísto globálního signálu DA pak tato zjištění naznačují, že DA může být diferencovaně a diskrétně naladěna na konkrétní cílové regiony, aby podpořila plasticitu v rámci definovaných obvodů souvisejících s učením, motivací a akcí.

Přesné funkce těchto heterogenních signálů DA však nejsou dobře známy. Jeden vlivný model předpokládal, že DA poskytuje výukový signál pro generování asociativních očekávání budoucích výsledků a toho, zda jsou tyto předpovědi přesné [chyba predikce (PE)]. DA neurony zobrazují tento typ kódování (Schultz a kol., 1997; Schultz a Dickinson, 2000; Waelti a kol., 2001; Tobler a kol., 2003), ačkoli nedávná zjištění potvrzují, že v podstatě všechny optogeneticky identifikované DA neurony ve VTA vykazují signalizaci typu PE (Cohen a kol., 2012). Na rozdíl od toho modely motivační salience (IS) naznačují, že DA jedná tak, aby stimulovala stimuly oceňovanými posilovači, což vytváří motivační pohon pro tyto výsledky (Berridge a Robinson, 1998; Robinson a Berridge, 2008; Zhang a kol., 2009; Berridge, 2012). Ačkoli jsou podobné, modely PE a IS dělají silně odlišné předpovědi pro funkci DA s ohledem na její nezbytnost v učení, motivaci a drogové závislosti (Redish, 2004; Tindell a kol., 2009; Bromberg-Martin a kol., 2010; Berridge, 2012).

V jednoduchých úkolech kondicionování je obtížné vědět, jaké fázové DA vydání je kódování (tj. Předpovídá odměnu nebo cue salience?). Prostorově izolováním prediktivních a výrazných podnětů v rámci téhož úkolu je však možné analyzovat specifické rysy učení a činnosti, aby se izolovaly složky, jako je počáteční predikce, konzumní chování, motivace a dokonce vyhynutí. Abychom to vyřešili, použili jsme pomocnou plánovací řetězovou úlohu, kdy lisy na jedné páce [páka pro vyhledávání (SL)] umožnily přístup k lisům na druhé pákové páce (TL) a lisy na TL vyústily v dodání potravin. Dále, pomocí rychlé skenovací cyklické voltametrie (FSCV) k měření vzorů uvolňování DA v reálném čase v jádru nebo skořápce NAc u dobře vyškolených krys, jsme rozlišili, jak se liší selektivní funkce DA kódování napříč NAc podoblastmi. Nakonec jsme zkoumali, jak se tyto signály dynamicky posunuly, když se změnily aspekty motivace (hlad po hladu) a predikce (zánik). Pozorovali jsme rozdílné vzorce uvolňování DA v jádru a ve skořápce, které byly vysoce konzistentní s PE a IS modely, a obecně podporovaly myšlenku více mezolimbických DA signálů, které mohou podporovat komplementární, ale odlišné aspekty chování zaměřeného na cíl.

Materiály a metody

Zvířata.

Jako jedinců bylo použito dvanáct samců krys Sprague-Dawley vážících 280 – 330 g. Krysy byly individuálně ustájeny s cyklem 12 h světlo / tma a lehce jídlo omezeno na nejmenší hmotnost 90% volného krmiva (10 – 15 g laboratorní potravy Purina každý den, kromě ∼2.7 g sacharózy spotřebované během denních relací). ). Po celou dobu behaviorálního testování bylo zavedeno omezení potravin, s výjimkou období po zotavení po operaci, kdy byla potravina podávána podle libosti. Všechny postupy byly provedeny v souladu s University of North Carolina v Ústavním výboru pro péči o zvířata a jejich použití v Chapel Hill.

Behaviorální výcvik: řetězový rozvrh.

Zkušební komory obsahovaly dvě zatahovací páky se startovacím světlem nad každou pákou a nádobu na potraviny umístěné ve stejné vzdálenosti mezi pákami, jak bylo popsáno výše (Cacciapaglia a kol., 2012). Pro každý subjekt byla jedna páka (např. Vlevo) označena jako TL a druhá páka (např. Vpravo) jako SL po dobu trvání všech testovacích relací. Strana TL a SL byla vyvážena napříč subjekty.

Krysy byly nejprve vyškoleny k získání sacharózových pelet (45 mg, Purina) z nádoby na jídlo. Během jednoho předběžného tréninku byly pelety 50 dodávány náhodně přibližně jednou za 30. Krysy byly poté trénovány, aby samy podávaly sacharosové pelety během jednotlivých denních sezení. Aby se vytvořila instrumentální odezva, zvířata byla nejprve vyškolena k lisování TL. Každá zkouška během tvarování začala osvětlením světelného tága přímo nad TL spojeným s rozšířením TL do testovací komory [vytažení páky ven (TLO)]. Každou páku stiskněte [TLP; pevný poměr 1 (FR1)] v rámci 15 s prodloužení vedl k dodání jediné sacharosové pelety (45 mg) do nádoby, zatažení TL a ukončení startovacího světla. Pokud zvířata v 15ech nestlačila TL, byla páka zatažena, světlo zhaslo a pokus byl započítán jako opomenutí. Zkoušky byly odděleny variabilním intertriálním intervalem s průměrem 15 s (rozsah: 5 – 25 s; dny tvarování 1 a 2), a poté zvýšeny na průměr 45 v dny tvarování 3 – 4 (rozsah: 30 – 60 s).

Po vytvoření stabilní reakce na TL (tj. Ne více než 2 opomenutých chyb v relaci) byl zaveden řetězový plán (Obr. 1 A), převzato z Olmstead et al. (2000). Zkoušky během řetězových sezení začaly rozšířením SL a současným osvětlením tága přímo nad ním (SLO). Každá SLP (FR1) mělo za následek stažení SL a zhasnutí tága, následovalo předložení TLO (prodloužení páky, podsvícení). Jak bylo uvedeno výše, TL lisy vedly k zatažení TL, zhasnutí cue světla a dodání sacharosové pelety do potravinového kelímku. Zkoušky byly odděleny proměnným intervalovým intervalem 45 (rozsah: 30 – 60 s) a každá relace sestávala z pokusů 30. Pro den 1 řetězového rozvrhu neexistovalo žádné zpoždění mezi zatažením SL a prodloužením TL. V následujících dnech byl mezi zatažením SL lisu a rozšířením TL zaveden variabilní interval (VI) 3 – 5 s. Kromě toho byly zavedeny VI 1 – 3 s mezi TL lisem a dodáním sacharosové výztuže. Během tréninku (tj. Všechny relace před záznamem FSCV) byla použita různá zpoždění, aby se krysám eliminovala schopnost předvídat čas dodání událostí. Krysy byly vyškoleny pro 5 d podle tohoto řetězce, nebo dokud neprokázaly stabilní výkon dvou po sobě jdoucích sezení bez opomenutí na SL nebo TL, poté byly chirurgicky připraveny pro voltametrický záznam.

Behaviorální výcvik: zánik.

Po posledním záznamu došlo k zániku podmnožiny zvířat (základní záznamy: n = 3; shellové nahrávky: n = 7). Během zániku, SLO prezentace naznačily začátek nové zkoušky. Zkoušky byly totožné s těmi na testovací relaci, kde SL lisy vedly k prezentaci TLO 4 s později, ale lisy na TL nebyly posíleny. Extinkční relace pokračovala, dokud krysy přestaly reagovat na SL pro 10 po sobě jdoucích studiích (Obr. 1 B).

Předchozí studie (Schoenbaum a kol., 2003; Saddoris a kol., 2005) ukázali, že nervové koreláty limbické aktivity jsou vysoce citlivé na změny v učení a motivačním stavu, a proto jsme zde použili markery latence odpovědi k definování bloků pro každý předmět (Obr. 1 B). Prvním blokem bylo včasné vyhynutí, ve kterém latence odpovědi na SLP odpověď byla podobná odměněné relaci. Dále první SLP latence odezvy, která byla alespoň 2 SD delší než během dříve odměněné řetězové relace, označila začátek Delay Extinction. Nakonec všechny pokusy, které následovaly po první vynechané odpovědi, byly v pozdním extinkčním bloku a byly seskupeny podle toho, zda krysa vynechala SLP odpověď (pozdní bez stisknutí) nebo obnovená odpověď (pozdní tisk). Veškeré vyhynulé chování bylo porovnáno s bezprostředně předcházejícím plánem zesíleného řetězce.

Chirurgické postupy.

Po tréninku chování byla zvířata chirurgicky připravena na voltametrické záznamy, jak bylo popsáno výše (Cacciapaglia a kol., 2012). Stručně, krysy byly anestetizovány intramuskulární injekcí směsi ketamin hydrochloridu (100 mg / kg, im) a xylazin hydrochloridu (20 mg / kg). Vodicí kanyla (Bioanalytické systémy) byla implantována nad NAc shell (+ 1.7 mm AP, + 0.8 mm ML) nebo jádro (+ 1.3 mm AP, + 1.3 mm ML) a bipolární stimulační elektroda (Plastics One) byla umístěna do VTA (- 5.2 mm AP, + 1.0 mm ML a - 7.8 DV). Další vodicí kanyla pro referenční elektrodu Ag / AgCl byla umístěna do kontralaterální hemisféry. Komponenty byly připevněny k lebce šrouby a kranioplastickým cementem.

Voltametrické nahrávání.

Zde používané techniky záznamu FSCV byly popsány dříve (Cacciapaglia a kol., 2012; Sugam a kol., 2012). Stručně, po chirurgickém zákroku bylo potkanům umožněno zotavit se na jejich tělesnou hmotnost před operací (alespoň 5 d zotavení). V den experimentu byla mikroelektroda z uhlíkových vláken snížena do NAc obalu nebo jádra s lokálně konstruovaným mikrodrivem (Chemistry Department Electronic Facility, University of North Carolina, Chapel Hill, NC), poté, co byla umístěna referenční elektroda Ag / AgCl do kontralaterální hemisféra. Mikroelektroda z uhlíkových vláken byla držena na -0.4 V versus Ag / AgCl referenční elektroda. Periodicky byl získáván cyklický voltammogram (intervaly 100 ms) aplikací trojúhelníkového tvaru vlny, který řídil potenciál na 1.3 V a zpět na –0.4 V. Před začátkem každé záznamové relace jsme získali elektricky vyvolané události uvolnění DA řízením bipolární stimulace elektrodou ve VTA a zaznamenal výsledné uvolnění DA v NAc. Pokud stimulace nebyla úspěšná při vyvolávání uvolňování DA, elektroda byla snížena na nové místo a proces byl opakován. Jakmile elektrická stimulace úspěšně vyvolala uvolnění DA v NAc, byla vytvořena tréninková sada vyvolaného DA uvolnění pomocí kombinace stimulačních frekvencí (mezi 10 a 60 Hz) a počtu bifázických pulzů (od 4 do 25) z bipolární VTA elektrody. V podskupině záznamů byla po ukončení relace chování vytvořena další tréninková sada, aby byla zajištěna stabilita elektrody během relace. V podskupině potkanů ​​(n = 9), po zaznamenání celé relace 30 pokusů byla elektroda snížena o dalších ~ 300 μm, dokud nebylo nalezeno jiné uvolňovací místo, přičemž v tomto okamžiku byl proveden další záznam pro další relaci 30 pokusů. Analýza dat FSCV (analýza HDCV) použila chemometrickou analýzu hlavních složek k extrakci změn proudu v důsledku DA pomocí elektricky stimulované tréninkové sady každého subjektu ze související relace záznamu shromážděné před testováním, jak bylo popsáno výše (Heien a kol., 2005; Keithley a kol., 2010). Pro každou oblast (jádro a skořepinu) byla průměrná stopa DA koncentrace porovnána s každou behaviorální událostí a porovnána s průměrnou koncentrací DA nad základní linií 5 bezprostředně před SLO nástup pomocí dvousměrného smíšeného modelu ANOVA (faktory: událost, region) na průměrech subjektu.

U extinkčních relací byly stopy DA rovněž sladěny s behaviorálními událostmi. Nicméně, protože mnoho SLO po prezentacích nebyly následovány žádné tisky v zániku, byly použity dvě různé analýzy. Pro první byly stopy DA zarovnány k SLO a seskupené podle fáze zániku (viz Obr. 6) a analyzovány pomocí obousměrných opakovaných měření s použitím extinkční fáze a stimulační události jako faktorů. Pro druhou analýzu, pouze pokusy, ve kterých krysa stiskla TLP byly použity a maximální DA koncentrace (tj. maximální DA uvolnění v 300 ms po události) byly získány pro obě TLP a odměnu, a také analyzován pomocí obousměrné ANOVA s opakovaným měřením pomocí zánikové fáze a stimulu úkolu jako faktorů. Všechno post hoc párová srovnání byla provedena pomocí Tukeyova HSD, korigovaná na nerovné N pokud je to vhodné. Všechny statistické analýzy byly provedeny za použití Prism 4.0 pro Windows (GraphPad Software) nebo Statistica pro Windows (StatSoft).

Histologie.

Po každém experimentu byly krysy hluboce anestetizovány směsí ketaminu (100 mg / kg) / xylazin (20 mg / kg) (im). Wolframová elektroda umístěná ve stejném mikromanipulátoru použitém během experimentu byla snížena na místo experimentálního záznamu a byla provedena malá elektrolytická léze (50 – 500 μA, 5 s) pro označení polohy hrotu elektrody. Více lézí bylo provedeno, když bylo provedeno více záznamů. Každý mozek byl odstraněn, fixován v 4% formaldehydu a poté zmrazen na -80C, než byl nakrájen na 40 μm koronální řezy kryostatem. Řezy byly namontovány na sklíčka, prohlíženy mikroskopií se světlým polem a digitálně zobrazovány (Obr. 1 C).

Srovnání stimulovaného a událostem vyvolaného DA uvolnění v jádru a shellu.

Bylo možné, že rozdíly pozorované mezi DA a jádrovým a shell DA pro behaviorální události nebyly způsobeny rozdíly v dynamice uvolňování, ale spíše rozdíly v kinetice DA clearance mezi regiony. Například striatální DA uvolňování a absorpční dynamika je ve skořápce pomalejší než jádro kvůli nižší hustotě dopaminového transportéru ve skořápce (Jones a kol., 1996; Budygin a kol., 2002). Jako takové, rozdíly mezi jádrem a shellem při pozdějších událostech (např. TLO, odměnu) lze vysvětlit přetrváváním zbytkového DA v synaptické oblasti ve skořápce.

K vyřešení tohoto problému jsme porovnali vzorce uvolňování a přijímání DA vyvolané behaviorálními událostmi (tj. SLO) během úlohy plánu řetězce do DA vyvolané krátkým výbuchem elektrické stimulace aferentů VTA. Původně byla elektrická stimulace (2 ms dvoufázové pulsy) vláken VTA prováděna napříč širokou škálou stimulačních frekvencí (10–60 Hz) a počty pulzů (4–25 pulzů), aby se získalo celé spektrum dynamiky uvolňování pro účely budování chemometrická tréninková sada. Velký počet elektrických stimulací byl podstatně větší (např. 2000 40 nm), než jaký lze pozorovat u přirozeně se vyskytujících přechodných jevů (obvykle 150–200 nm). Při extrémně vysokých koncentracích uvolňování DA je možné, že DA transportér může být nasycen, což vede k pomalejší kinetice clearance, než by bylo vidět v normálním rozmezí. Abychom to řešili přímo, vybrali jsme pouze „stimulační“ pokusy s elektrickou stimulací, ve kterých bylo maximální uvolnění DA <XNUMX nm. Podobně jsme vybrali pouze behaviorální testy, kde vrchol DA uvolnění byl v souladu s SLO byla alespoň 100 nm. Pro každý subjekt byly všechny způsobilé pokusy zprůměrovány pro analýzu. Pomocí této metriky jsme získali 23 elektrické stimulace a 15 relace vyvolané cue v jádru a 14 elektrické stimulace a 11 relace vyvolané cue ve skořápce.

Srovnání cue versus elektricky vyvolaného uvolnění DA bylo provedeno pomocí několika metrik. Nejprve byl vrchol DA odvozen od behaviorálních událostí v SLO (tj. největší koncentrace DA v 1.5 s SLO začátek), TLO (největší koncentrace DA mezi 4 a 5.5 s po SLO nástup) a odměna (největší koncentrace DA mezi 6.5 – 8 s následující SLO začátek) pro cue události a v odpovídajících časových bodech pro elektricky stimulované události (tj. stejné časové body, ale po nástupu stimulace spíše než SLO počátek). Dále byla zkoumána dynamika clearance pomocí dříve publikovaných metrik (Yorgason a kol., 2011). Konkrétně jsme se podívali na latenci k poločasu (polovina koncentrace maximální koncentrace) následující vrchol, T 20 (čas pro 20% rozpad od vrcholu) a T 80 (čas pro 80% rozpad od vrcholu). Tyto hodnoty byly porovnány pomocí smíšeného modelu ANOVA pomocí oblasti (jádro, skořápka), stimulačního typu (SLO zarovnané, elektricky stimulované) jako faktory mezi subjekty a buď koncentrace DA u každého typu události (základní linie, SLO, TLOa odměnu) nebo míru rozpadu (latence k vrcholu, T 20, poločas rozpadu a T 80, respektive) jako opakovaná opatření. Post hoc srovnání byla provedena za použití Tukey's HSD pro nerovné N.

výsledky

Posílené chování řetězce

Krysy se rychle naučily úkolu řetězení. Na závěrečném předsmluvním zasedání krysy v průměru dokonale dokončily 99.8% pokusů. Během těchto relací trvalo krysy v průměru 783 ± 253 ms, aby stiskly následující SLOa 588 ± 298 ms pro stisknutí po TLO, rozdíl, který byl téměř významný, t (17) = 1.77, p = 0.085 Avšak v posturgických dnech záznamu krysy opět neučinily téměř žádné opomenutí (99.5%), ale vykazovaly výrazně rychlejší latence odezvy pro TLP (999 ± 64 ms) než SLP (444 ± 39 ms), t (29) = 7.48, p <0.0001. Důležité je, že ve dnech záznamu nebyly žádné rozdíly v latenci odezvy u zvířat zaznamenaných ve skořápce oproti jádru, t (29) = 0.78, p = 0.48. Krysy v obou skupinách (jádro a skořápka) byly tedy stejně kompetentní k dokončení řetězce, když byl úkol posílen.

Diferenciální uvolňování DA v jádru a skořápce NAc během rozvrženého řetězce

Dále jsme pomocí FSCV získali DA nahrávky v reálném čase z jádra NAc (n = 13) nebo shell (n = 12) během výkonu podle dobře naučeného plánu řetězu (Obr. 1 C). U potkanů, kde bylo provedeno více záznamů, byl hrot elektrody mezi jednotlivými relacemi snížen alespoň 300 μm, aby se zajistilo, že hrot elektrody 100 μm z uhlíkových vláken byl pro každou nahrávku zcela v čerstvé tkáni. V souladu s oběma PE a IS modely, našli jsme robustní phasic DA vydání, které začalo s nástupem SL a cue light (SLO) v jádru i ve skořápce. Příklady této signalizace z reprezentativních záznamových relací (průměrované napříč testy 30) jsou uvedeny pro jádro (Obr. 2 A) a shell (Obr. 2 B), s barevnými grafy od jednotlivého zvířete. Signalizace DA se mezi podoblastmi nápadně lišila. Přes všechny krysy, v jádru (Obr. 2 C-E, černé stopy), DA vrcholila rychle na začátku nejvíce prediktivního narážky (SLO začátek) a poté rychle klesl na výchozí hodnotu v době TLP. Naproti tomu ve skořápce (Obr. 2 C-E, šedé stopy), rychlé zvýšení koncentrace DA bylo shodné s SLO prezentace a zůstala zvýšená pro další motivačně významné stimuly s diskrétními vrcholy v TLO a odměnu za doručení před návratem na základní úroveň na konci zkoušky.

Obrázek 1. 

A , Schéma návrhu úkolu. Během rozvrhu řetězu byla jedna páka (SL) vysunuta do zkušební komory současně s tím, jak bylo nad pákou osvětleno startovací světlo (SL)O). SLP zhaslo světlo a zatáhlo páku. Po zpoždění byla druhá páka v komoře (TL) prodloužena a rozsvíceno související světloO). Po stisknutí tlačítka TL (TLP) krysy dostaly potravu zesílení po zpoždění (R). B „Chování při vyhynutí u zvířat se záznamy FSCV v jádru nebo skořápce. Chování a analýza při vyhynutí byly seskupeny do bloků na základě chování krysy. Pokusy v bezprostředně předcházejícím řetězovém úkolu byly použity k porovnání událostí při vyhynutí. Předčasné vyhynutí byly všechny pokusy až do prvního významného zpoždění reakce na SL, zatímco zpoždění vyhynutí byly všechny pokusy mezi prvním zpožděným SLP a první vynechaný stisk po SLO prezentace. V rámci pozdního vymizení se rozlišovalo, zda subjekt provedl tisk nebo opomněl odpověď. C , Histologie umístění elektrod uvnitř jádra (černé kruhy) a středního pláště (šedé kruhy).

Obrázek 2. 

Výkon zřetězeného harmonogramu vedl k různé dynamice uvolňování DA v rámci NAc. Dynamika uvolňování dopaminu v jádru ( A ) a shell ( B ) NAc zarovnáno s časem prodloužení SL do komory (SLO). Barevné grafy ukazují průměry od reprezentativního subjektu v jádru a skořápce. Průměrná doba (▴) rozšíření TL (TLO) a odměna (R) a rozmezí (± 2 SD) vzhledem k SLO jsou zobrazeny dole. C - E , Průběžné průměrné uvolnění DA napříč všemi nahrávkami v jádru (černé) a skořápce (šedé) vzhledem k ( C ) SLO, ( D ) SLP, a rozšíření TLO 4 s později, a ( E ) TLPa odměna (R) potravinová peleta dodala 2.5 s po tisku. Čárkovaná čára ukazuje SEM průměru pro každou oblast. Spodní řádek ( F - H ) ukazuje průměrné maximální DA uvolnění pro každou událost chování. *p <0.05 proti výchozí hodnotě; †p <0.05 jádro versus skořápka.

Kvantifikovali jsme tato pozorování zprůměrováním všech záznamů pořízených v jádru nebo skořápce, zarovnáno s každou z behaviorálních událostí v řetězovém plánu (Obr. 2 C – H). V záznamových relacích FSCV je doba mezi SLP a TLO byla opravena (4 s) stejně jako doba mezi TLP a odměňování (2.5), aby bylo možné lépe sladit stimuly úkolů pro analýzu DA. Zarovnání na SLO, SLP/ TLOa TLP/ odměna umožnila zarovnání všech behaviorálních markerů a povolenou analýzu maximálního uvolnění DA vzhledem k těmto událostem.

Obousměrná ANOVA porovnávající pík (maximální DA koncentrace v 300 ms po události) DA koncentrace v regionu (jádro, skořápka) a událost (základní linie, SLO, SLP, TLO, TLP, odměna) uvedla, že prostředí uvolnilo celkově více DA než jádro, F (1,24) = 13.63, p <0.002. Důležité je, že významná interakce regionu × událost, F (5,120) = 9.88, p <0.0001, odhalilo, že DA signalizace v jádru a skořápce odlišně reagovala na události chování (Obr. 2 F – H). Konkrétně se uvolňování jádra DA významně zvýšilo v SLO, vzhledem k základní linii (p <0.0001) a v době SL zůstal nad základní hodnotouP (p <0.0001), i když výrazně nižší než u SLO (p <0.05). Nebyly však zjištěny žádné rozdíly v maximu DA v jádru ve srovnání s výchozí hodnotou pro žádnou událost TL (TLO vs základní hodnota, p = 0.59; TLP vs základní hodnota, p = 1.0) a žádný rozdíl od výchozí hodnoty v době přijetí odměny (p = 1.0).

Naopak maximální koncentrace DA ve skořápce vykazovaly významné uvolňování DA pro všechny události. Všechny události byly spojeny s vyšším uvolňováním DA než ve výchozím stavu (všechna srovnání vs BL, p <0.0002), zatímco žádná z událostí se od sebe významně nelišila (všechny párové SLO, SLP, TLO, TLPa srovnávání odměn, p > 0.96).

Přímým porovnáním jádra a shellu jsme našli důležité rozdíly v signalizaci DA mezi regiony. Ačkoli nedošlo k žádným rozdílům v uvolnění DA během obou výchozích hodnot (p = 1.0) nebo SL události (SLO, p = 1.0; SLP, p = 0.22), shell DA byl významně zvýšen ve srovnání s jádrem pro obě TL události (TLO, p <0.01; TLP, p <0.001) a odměna (p <0.0005; Obr. 3 D-F).

Obrázek 3. 

Změny v signalizaci DA mezi začátkem relace (brzy; první studie 5 v řetězovém plánu) versus konec relace (pozdní; poslední studie 5). A Průměrné koncentrace DA v jádru NAc z průměrů prvních pěti pokusů každého jednotlivce (světle modrá) a posledních pěti pokusů (fialová). B „V jádru se signalizace DA DA v rámci subjektů mezi začátkem relace a koncem nezměnila. C , Průměrné koncentrace DA ve skořápce NAc z průměrů prvních pěti pokusů každého pacienta (červená) a posledních pěti pokusů (oranžová). D Shell DA vykázal významný pokles u obou subjektů na obou SLP a TLP narážky a odměny (**p <0.01), zatímco pokles na SLO narážka byla téměř významná (#p = 0.073). Chybové sloupce ukazují SE rozdílu (brzy vs pozdě).

Regionální změny v DA vydání mezi začátkem a koncem relace

Dále jsme porovnávali uvolnění DA v jádru a shellu během úlohy s posíleným řetězovým plánem na začátku relace (první studie 5) versus konec relace (poslední studie 5; Obr. 3). To bylo důležité testovat, aby se zajistilo, že elektroda byla stabilní během relace (tj. Aby elektroda neztratila citlivost v průběhu času), a také posoudit, zda DA sleduje nějaké jemné změny v motivačním stavu (například kvůli jakýmkoli účinkům) sníženého hladu po konzumaci potravy) po prezentaci různých podnětů.

V jádru (Obr. 3 A), obousměrná ANOVA naznačila významný hlavní účinek události (BL, SLO, SLP, TLO, TLP, Rew; F (5,65) = 35.03, p <0.0001), ale žádný vliv na fázi relace (brzy vs. pozdě; F (1,13) = 3.55, p = 0.08) nebo interakce mezi událostí × fází relace (F (5,65) = 0.82, p = 0.54). Post hoc srovnání mezi časnými a pozdními bloky ukázala, že maximální uvolňování DA vzhledem k behaviorálním událostem v jádru zůstalo stejné mezi začátkem a koncem relace (Tukey: všechna časná a pozdní párová srovnání pro BL, SLO, SLP, TLO, TLPa odměnu, p > 0.50; Obr. 3 B).

Fázické uvolňování DA do podnětů k úkolům se však během relace ve skořápce obecně snížilo (Obr. 3 C,D), s významnými hlavními účinky události (F (5,55) = 13.52, p <0.0001), fáze relace (F (1,11) = 6.95, p = 0.02) a interakce mezi událostí a fází relace (F (5,55) = 3.74, p = 0.006). Stejně jako v jádru post hoc testy neukázaly žádný rozdíl v BL, ale významné snížení v uvolnění DA DA do SLP, TLPa odměnu (Tukey: všechny p <0.0005), trend směrem k významnosti u SLO tága (p = 0.060), ale žádný rozdíl v TLO tága (p = 0.36). Změny v shellu (ale ne v jádru) se tedy omezily primárně na motivované akce a odměňování spotřeby pomocí různých (i když skromných) startovacích efektů. Tyto posuny uvolňování DA napříč relacemi nebyly způsobeny generalizovanými změnami citlivosti elektrod, ale místo toho naznačují, že změny specifické pro stimulace a prostředí ve vzorcích uvolňování DA naznačují informace o změněném významu stimulů úkolů v opakovaných studiích. Vzhledem k tomu, že zvířata na konci každého záznamu průměrně spotřebovala alespoň 25 pelet (tj. 1144 mg, tj. 7.6% hmotnosti denního režimu krmení omezeného na potkany), tato zjištění naznačují, že zvýšené požití potravy úspěšně snížil motivovaný stav hladu u zvířete, což se projevilo změnami ulity, ale ne jádrem v průběhu relace.

Cue-evokoval versus elektricky stimulovaná dynamika DA v jádru a skořápce

Jednou z výzev k těmto zjištěním může být to, že jádro a plášť mají odlišnou dynamiku clearancí DA kvůli nižší hustotě transportéru DA ve skořápce ve srovnání s jádrem (Jones a kol., 1996; Budygin a kol., 2002). Je tedy možné, že prostředí DA pozorované při TL a událostech odměny je způsobeno zbytkovým uvolněním DA v době SLO, ale nelze jej vyčistit od synaptického přetečení tak efektivně jako v jádru. Abychom to vyřešili, porovnali jsme elektricky stimulované uvolňování DA ve stejném místě elektrody jako při nahrávání plánů řetězce, abychom zjistili, zda elektricky stimulovaná dynamika odpovídala dynamice vyvolané narážkami v jádru a skořepině (Obr. 4 A). Předpovídali jsme, že pokud pomalejší kinetika clearance ve skořápce byla zodpovědná za rozdíly v následné signalizaci události (např. TLO) mezi jádrem a skořepinou, pak by mělo elektricky stimulované a cue-evokované uvolňování v jejich příslušných podoblastech následovat téměř identické vzorce uvolňování a vůle. Naopak významné odchylky od elektrických stimulací by naznačovaly, že uvolnění DA v této oblasti sleduje události související s úkoly způsobem, který nelze vysvětlit pouze dynamikou synaptické clearance.

Obrázek 4. 

Porovnání elektricky stimulované versus podněcované DA signalizace v jádru a skořápce NAc. A Průměrná koncentrace DA byla vyrovnána buď s SLO narážka nebo elektrická stimulace počátku VTA vlákna. Načasování počátku TLO cue a odměna byly odhadnuty na základě doby odezvy pro ty výstupy po SLO (průměrná doba odezvy označená trojúhelníkem; šířka označuje ± 95% interval spolehlivosti). B Srovnání průměrných výchozích (BL) koncentrací DA s maximální koncentrací DA v 1 s SLO nebo elektrická stimulace (Stim / SLO) a uvnitř intervalu spolehlivosti 95% pro časy odpovídající TLO nebo odměnit epochy. C , Latence k maximální koncentraci po SLO nebo elektrická stimulace (Peak Lat) a následný rozpad (vůle) po uvolnění v jádru a skořápce. T20 a T80 jsou časy, ve kterých signál rozkládal 20% a 80% od vrcholu, v tomto pořadí, zatímco poločas je latence následující po vrcholu k dosažení poloviny maximální koncentrace. *p <0.0001, elektrická stimulace / SLO versus základní hodnota; †p <0.0001, Shell: Cue větší [DA] než všechny ostatní typy stimulace; ‡ p <0.0001, Shell: Cue větší latence k rozpadu z vrcholu než všechny ostatní typy stimulace. Chybové pruhy ukazují SE rozdílu (startovací vs. elektrický).

Celkově jsme zjistili, že jádro a skořápka se výrazně lišily ve vztahu mezi uvolněním DA a elektricky vyvolaným DA (Obr. 4 B). Při pohledu na maximální koncentrace při událostech úkolu došlo k významným rozdílům v koncentracích DA jako interakce regionu (jádro / skořepina) × typu stimulace (elektrický versus narážka) × událost (BL, SLO, TLO, Rew; F (3,174) = 12.31, p <0.0001). V jádru byly vrcholové koncentrace DA pro stopy vyvolané signálem a elektricky stimulované téměř identické; na začátku nebyly žádné statistické rozdíly mezi těmito typy stimulaceO, TLO, nebo odměnit epochy (Tukey: všechny p > 0.80). Naproti tomu shell vykazoval odlišný vzor dynamiky mezi elektricky a cue evokovanými vzory uvolnění DA. Ačkoli nebyl žádný rozdíl v koncentraci na počátku nebo na SLO (Tukey: obojí p > 0.98), DA byl významně vyšší pro TLO a odměnit epochy v cued pokusech ve srovnání s elektrickými stimulacemi (obojí p <0.0001).

Podobně rychlost uvolňování a následné odstranění ze synapse vykazovala podobný vzorec (Obr. 4 C). Při pohledu na rychlost clearance jako funkci rozpadu od vrcholu došlo k významné interakci mezi regionem × typem stimulace × parametrem rozpadu (doba píku, T20, poločas, T80; F (3,174) = 80.23, p <0.00001). Jak je uvedeno výše, vůle jádra a dynamika rozpadu se nelišily mezi typy stimulace vyvolanými cue a elektricky vyvolanými. Latence k vrcholu, T 20, poločas rozpadu a T 80 všechny byly statisticky podobné bez ohledu na typ stimulace (elektrické vs cue; všechny p > 0.95). Naproti tomu hladiny DA v plášti vykazovaly významně zpožděný rozpad na základní hodnotu po SLO prezentace týkající se elektricky stimulovaných pokusů. Zatímco latence k vrcholu a T 20 byly podobné stimulacím vyvolaným a elektricky vyvolaným stimulacím (p > 0.98), latence do poločasu (p <0.0001) a T 80 (p <0.0001) byly významně zpožděny v pokusech s cuedem vzhledem k elektrické stimulaci. Společně tato zjištění ukazují, že vnitřní rozdíly v kinetice clearance v plášti a jádru jsou nedostatečné k vysvětlení rozdílů v DA signalizaci během chování chování.

Zánikové chování

Potkani vykazovali chování při vyhynutí během relací, kdy byla vynechána odměna za jídlo, a to postupným zvyšováním latence při stlačení různých pák v průběhu relace vyhynutí. Generovali jsme behaviorálně definované fáze na základě těchto posunů latence ve srovnání s latencí tisku na SL a TL během bezprostředně předcházející relace zesíleného řetězce. Počáteční fáze byla definována jako pokusy, kde latence byly stejné jako během posílené relace. Když krysy stiskly páku výrazně pomaleji (tj.> 2 SD) než obvykle, bylo to nazýváno fází zpoždění, která trvala od první zpožděné odpovědi, dokud subjekt nevynechal odpověď. Všechny pokusy po tomto prvním vynechání byly nazvány pozdní fází na základě toho, zda potkan lisoval (pozdní tisk) nebo vynechal odpověď (pozdní žádný tisk).

Nejprve jsme vyhodnotili počet pokusů provedených před tím, než krysy projevily latenční posun z časné fáze do fáze zpoždění, a také počet pokusů do první vynechané studie (tj. Posun do pozdní fáze) pro SL a TL, respektive (Obr. 5 A). Krysy zpomalily reakci na TL podstatně předtím, než tak učinily pro SL, spárovány t test: t (7) = 2.49, p = 0.04, což naznačuje, že TL (snad na základě jejího bezprostředního vztahu s odměnou) byla citlivější na vynechání odměny než SL. Naproti tomu počet pokusů před provedením prvního opomenutí byl téměř stejný pro páky SL i TL (p > 0.9), což možná naznačuje, že vynechané odpovědi byly vydány pouze tehdy, když se předpověď odměny přesně aktualizovala na nulu na začátku studie. V souladu s tím jsme zřídka našli pokusy, kde zvířata prováděla SLP ale vynechal následující TLP odpověď (pouze celkové studie 4 / 140 celkem v pozdních fázích; 2.9%), což naznačuje, že krysy téměř výlučně prováděly buď celou řetězovou sekvenci, nebo vůbec ne. Jako takové byly opomenutí pravděpodobně více spojeny s informacemi dostupnými v SL než TL.

Obrázek 5. 

Zánikové chování u zvířat s nahrávkami FSCV v jádru nebo skořápce. A „Počet pokusů před potkany poprvé prokázal významné zvýšení latence odezvy, aby se posunul z časné do zpožděné fáze vymírání (vlevo) a vynechání odpovědi (vpravo) pro SL (světle šedá) a TL (tmavě šedá). Krysy vykazovaly latenciční posun pro TL ve výrazně menším počtu pokusů než SL, ačkoli počet pokusů před vynecháním pokusu byl stejný mezi hledáním a přijímáním odpovědí. *p <0.05 SL oproti TL. B , Zpoždění odezvy pro odpověď na SL (vlevo) a TL (vpravo) napříč fázemi zániku. Latence odezvy vzrostla napříč bloky a byla významně delší v blocích zpoždění a extinkce u lisů SL. Lisy na TL byly spolehlivě rychlejší než lisy na SL v každém bloku. *p <0.05, **p <0.01 vs rané Ext.

Dále jsme zkoumali průměrnou latenci SLP a TLP v každé fázi na základě výše uvedených kritérií. Dvousměrná ANOVA s opakovaným měřením porovnávající latenci odezvy na různých pákách (SL, TL) během různých fází úkolu (řetěz, předčasné vymírání, zpožděné vymírání, pozdní tisk) vykázala významný hlavní účinek páky (F (1,4) = 45.7, p = 0.003), což bylo způsobeno výrazně rychlejšími odpověďmi na TL než SL (Obr. 5 B), konzistentní s výkonem během typických zesílených relací a významným hlavním účinkem extinkční fáze (F (3,12) = 14.5, p <0.001). Pro SL, SLP odpovědi během časného vymírání byly podobné těm, které byly během relace zesíleného řetězce (Tukey: p = 1.0), ale výrazně zpomaleno zpožděním (p = 0.02 vs brzy) a pozdní tisk (p = 0.003 vs. časné) fáze. Avšak latence tisku na SL byly podobné mezi zpožděním a pozdní fází (p = 0.89). U TL lisů byly posuny latence odezvy jemnější, přičemž pozdní fáze byla výrazně pomalejší než časná fáze (p = 0.04). Lineární kontrast však představoval největší podíl rozptylu v latenčním posunu TL (F (1,4) = 11.08, p = 0.03; 86% rozptylu hlavních účinků), zatímco u SL se největší rozdíl rozptylu účinku projevil kontrastem porovnávajícím řetězec a časné versus zpoždění a pozdní fáze (F (1,4) = 15.42, p = 0.02; 97% rozptylu hlavních účinků).

Zánik: vynechaný výsledek odlišně zvyšuje DA a signalizaci jádra a shellu

Signalizace DA související s událostí v NAc se posunula, když krysa postupovala skrze behaviorálně definované fáze zániku. Způsob, jakým bylo kódování DA ovlivněno zánikem, se mezi jádrem a shellem nápadně lišil (Obr. 6).

Obrázek 6. 

Vydání DA v jádru ( A - C ) a shell ( D - F ) během zániku. A , Srovnání se SLO v jádru odhalil neustálé snižování uvolňování jádra DA do cue v průběhu iteračních extinkčních pokusů (modré čáry) ve srovnání s odměňovanými řetězovými relacemi (černá čára). BvCore DA uvolňuje operativní reakce a odměnu během posílených řetězových plánů (černá) a časného vymírání (modrá) zarovnaných s TLP událost. Šedý sloupec ukazuje rozsah maximální a minimální koncentrace DA během základního období. C , Vrchol DA vzhledem k SLP, TLP, a odměnu v posíleném rozvrhu a předčasném zániku D , Srovnání se SLO ve skořápce (červené čáry) odhalily více diskrétní poklesy fázového DA uvolňování do tága přes iterační extinkční pokusy ve vztahu k odměněným řetězovým sezením (černá čára). E , DA signalizace zarovnána s TLP ve skořápce v časném zániku (červená) a posílený plán řetězu (černý). F , Vrchol DA ve skořápce se v SL nezměnilP, ale u TL došlo k významnému poklesuP a odměnu. *p <0.05, **p <0.01, řetěz versus časný zánik; †p <0.05, opomenutí menší než výchozí hodnota.

Během zániku jsme nejprve zkoumali signalizaci DA v jádru. Relativní k SLO, DA se významně a lineárně snížilo v různých fázích vyhynutí vzhledem k odměněnému řetězovému sezení, (interakce: fáze × narážka; SL)O vs základní hodnota; F (4,157) = 33.19, p <0.0001; Obr. 6 A. Post hoc párové srovnání ukázalo, že vrchol DA k SLO rychle klesal mezi řetězcem a časnou extinkcí (Tukey: p <0.0001) a opět mezi časným a pozdním zánikem (p <0.0001). DA se však během zpoždění zpoždění nelišila od pozdního tiskového bloku (p = 0.64) a maximální DA se nelišily v pozdní fázi na základě toho, zda krysa odpověděla nebo ne (pozdní tisk vs pozdní bez lisu, p = 0.99). Dále se DA uvolňuje během SLO byl významně větší než základní hodnota v řetězci (p <0.0001), předčasný zánik (p <0.0001) a zpoždění zániku (p <0.001) fáze, ale ne ve fázi pozdního tisku nebo pozdní bez tisku (obě p > 0.5). Tato párová zjištění podpořila významný negativní lineární trend (F (1,157) = 94.77, p <0.0001), což představovalo většinu (71%) rozptylu účinků.

Dále, jeden punc PE signálů v mozku je přítomnost negativních chyb predikce v době vynechané očekávané odměny (Schultz a kol., 1997). Předpokládali jsme, že tyto signály budou nejsilnější na počátku zániku, když subjekt plně očekával, že odměna bude doručena. V jádru (Obr. 6 B), obousměrná ANOVA naznačila významnou interakci události x fáze (řetězec vs. včasné vymírání; F (3,57) = 3.24, p = 0.029). Konkrétně, i když maximální DA uvolňování vzhledem k předchozímu SLP byla významně snížena v časném vymizení vzhledem k relaci zesíleného řetězce, (Tukey: p = 0.019), uvolnění DA do TLP nebyl ovlivněn (p = 0.41). Kriticky, jádro DA vykázalo důkaz o negativní predikční chybě během zániku (Obr. 6 B) tak, že uvolnění DA v době očekávané, ale vynechané odměny bylo výrazně nižší než během posílené relace (p = 0.003). Ve skutečnosti, zatímco maximální uvolnění DA k odměně se nelišilo od základní hodnoty během posílené Relace Relace (p = 0.99), během vynechání odměny se posunula na výrazně méně než základní úroveň (p = 0.03). Takže signály DA v jádru během časného vymírání vykazovaly jak dynamické posuny ve uvolňování prediktivních stimulací a akcích SL, žádné změny ve vztahu k TL narážce, tak negativní chyba predikce pro odměnu za opomenutí.

Shell vykazoval odlišný vzorec uvolňování DA vzhledem k SLO tága (Obr. 6 D). Zde, průměrně vedené tágo evokované DA, SLO dynamicky se mění napříč fázemi (interakce: fáze × narážka; F (2,24) = 7.95, p <0.0005), ale na rozdíl od jádra se shell DA mezi fází řetězce a předčasným zánikem nezměnil, (p = 0.74), ale DA signalizuje SLO byl významně snížen během fáze extinkce zpoždění vzhledem k oběma fázím zesíleného řetězce (p = 0.041) a počáteční fáze zániku (p = 0.02), shodný s motivačním posunem chování potkanů ​​(Obr. 5). Signalizace DA se opět výrazně snížila mezi fází zpoždění a pozdními fázemi (pozdní tisk, p = 0.03; pozdě žádný tisk, p = 0.004), ale nebyl rozdíl v hladinách DA mezi pozdními fázemi (tisk versus žádný lis, p = 0.43). Stejně jako v jádru se DA uvolňuje během SLO byla signifikantně nad základní hodnotou během řetězce, časného vymření a zpoždění extinkce (Tukey: všechny p <0.001), ale ani jedna z pozdních fází se významně nelišila od výchozí hodnoty. Uvolnění jádra DA tedy rychle a nepřetržitě sledovalo změny v predikci pro nejpředvídatelnější narážku, zatímco vzory uvolňování DA pro stejnou narážku v shellu místo toho sledovaly změny v motivačním stavu mezi fázemi zániku.

Když se podíváme na lisování a signalizaci odměny, uvolnění shellu DA se lišilo od vzoru v jádru (Obr. 6 E,F). Obousměrná ANOVA zkoumá DA na jednotlivých pokusech podle typu stimulu (BL, SLP, TLP, odměna) a extinkční fáze (řetězec, časná extinkce) našla významnou interakci mezi podnětem × extinkcí (F (3,108) = 11.5, p <0.0001; Obr. 6 D). Na rozdíl od jádra nebyl žádný rozdíl v uvolnění DA s vrcholem shellu do SLP brzy v zániku (p = 0.44). Namísto toho vyhynutí vyvolalo významné snížení uvolňování DA k oběma TLP (p = 0.01) a v době opomenutí odměny vzhledem k přijetí odměny (p <0.0001) ve vztahu k odpovídající době během posíleného plánu řetězu. Během relace Chained Rewards byl DA významně zvýšen nad výchozí hodnotu (p <0.0001), ale během vynechání odměny byl DA numericky větší než, ale statisticky se nelišil od výchozí hodnoty (p = 0.07). Na rozdíl od jádra jsme tedy našli omezené důkazy pro chyby predikce časného vymření a namísto toho snížení uvolnění DA vzhledem k tisku TL (ale nikoli SL), jakož i odstranění uvolnění DA při odměně pozorované během posíleného plánu.

Diskuse

Vzorky fázového uvolňování DA sledovaly podněty, které se nápadně lišily mezi podoblastmi NAc způsobem konzistentním s kontrastními teoriemi funkce DA. V dobře naučené úloze řetězového plánu DA v jádru NAc selektivně vrcholil v nejpředvídavějším podnětu a lineárně sledoval změny hodnoty predikce a chyb během zániku. Naproti tomu fázové uvolňování DA ve skořápce NAc sledovalo všechny hlavní podněty, když byl úkol odměněn, a to jak v relaci, tak při zániku, zobrazovaly změny v signalizaci konzistentní se změnami v motivaci. Jako takový navrhujeme, aby tyto signály DA byly současně dostupné zvířeti během chování, což umožňuje prediktivním i motivačním informacím vést učení a jednání.

Uvolnění jádra DA sleduje chybu predikce

V jádru se DA v době prezentace SL cue postupně zvyšovalo a klesalo na základní úroveň pro plně předpovídané pozdější události (např. TL, odměna), podobné předchozím nálezům (Roitman a kol., 2004; Cacciapaglia a kol., 2012). Tento model aktivity je konzistentní s modely predikce chyb, které uvádějí, že maximálně prediktivní podněty by měly vyvolávat nejvyšší DA vydání (tj. Predikce), zatímco přesně predikované události, které následují, by měly vyvolat minimální DA vydání (tj. Predikční chyba). Jak tedy TL a odměna byly přesně předpovězeny SL, vygenerovaly malou chybu při jejich doručení a vyvolaly malé vydání DA související s chybami (Schultz a kol., 1997; Schultz a Dickinson, 2000).

Naše laboratoř a další ukázaly, že signály DA v jádru jsou citlivé na rozdíly v předpovídané hodnotě a jsou modulovány subjektivními faktory, jako je preference rizika a zpoždění zesílení (Day a kol., 2010; Gan a kol., 2010; Sugam a kol., 2012; Saddoris a kol., 2013, 2015). Například u potkanů ​​provádějících riskantní rozhodovací úlohu bylo základní DA škálováno podněty, které předpovídaly preferovanou možnost krysy, a rychle klesly pod základní linii, když byly vynechány očekávané odměny, což svědčí o negativní chybě predikce (Sugam a kol., 2012). Podobně zde jádro DA sledovalo jak hodnotu předpokládaných výsledků, tak dynamicky posunovalo na základě aktualizované předpovídané hodnoty cue během vymírání. Opravdu, DA uvolní do SLO v době, kdy krysa začala vynechávat odpovědi během zániku, se nelišila od výchozí hodnoty, bez ohledu na to, zda byla odpověď učiněna, což naznačuje, že DA signalizovala očekávanou hodnotu odpovědi, spíše než motivaci k tisku. Kromě toho vynechání odměny na počátku extinkce vyvolalo robustní pauzy v uvolnění DA, což je v souladu se signalizací chyby negativní predikce.

Shell DA sleduje motivačně významné stimuly

Uvolnění DA ve skořápce diskrétně sledovalo všechny hlavní podněty (SLO, TLO, R). Tyto vzorce nelze vysvětlit pomalejší kinetikou zpětného vychytávání a místo toho se zdá, že odrážejí kódování kontingentních událostí v reálném čase (Pan et al., 2005) a získanou pobídku (Berridge a Robinson, 1998; Berridge, 2012; Wassum a kol., 2012). Události uvolnění DA tedy kódovaly jak prediktivní podněty, tak odměny ve skořápce, ale pouze prediktivní podněty v jádru (Cacciapaglia a kol., 2012).

Našli jsme důkazy pro tuto motivační složku shell DA signalizace. Zaprvé, DA signalizace ve skořápce na podněty byla snížena mezi začátkem a koncem relací, což nebylo vidět v jádru. Jedním vysvětlením je, že krysy na konci sezení byly jednoduše nasyceny (podle definice snědly více jídla, než na začátku sezení), a jako takové, narážky prediktivní k jídlu odrážely snížený motivační stav zvířete . Naproti tomu narážky stále přesně předpovídaly dodávání sacharosové pelety, takže kódování typu PE v jádru bylo tímto motivačním posunem relativně méně ovlivněno.

Za druhé, během zániku se DA uvolňuje ve skořápce do SLO zůstal stabilní, zatímco krysa prováděla úkol na stejné motivační úrovni (jak naznačuje latence a přesnost odpovědi), ale významně poklesla poté, co motivace krys v průběhu vyhynutí poklesla (tj. latence odpovědi). Naproti tomu jsme zaznamenali rychlý pokles fázového uvolňování DA během stimulů TL. Modely IS předpovídají, že podněty, které snižují nejistotu, by měly vytvářet větší motivaci a motivaci (Zhang a kol., 2009; Smith a kol., 2011), což je zde zkreslené směrem k TL, protože je to maximálně predikce bezprostředního doručení odměny. Ve skutečnosti infuze amfetaminu v rámci NAc selektivně potencují kódování tága nejblíže k dodání odměny v řetězovém úkolu pavloviana, ale mají menší účinek na první narážku v sekvenci (Smith a kol., 2011). DA kódování TL bylo tedy zvláště citlivé na předpokládanou ztrátu odměny při zániku. Překvapení, vynechání odměny neměla za následek uvolnění DA pod základní linii, což naznačuje, že prostředí DA bylo méně pravděpodobné, že kódovalo negativní predikční chybu než jádro. Souhrnně je tento vzorec signalizace v NAc shellu zřetelně odlišný od jádra a svědčí o kódování typu IS.

Na podporu se shell NAc podílí na různých motivačních chováních. Například slaná chuť k jídlu, kde je slaný roztok obvykle averzivní, může být prospěšná, pokud je zvíře zbaveno soli. V obou případech je předpokládaný výsledek (sůl) stejný, ale motivace k dosažení tohoto výsledku se liší mezi normálními zvířaty a zvířaty zbavenými solí (Tindell a kol., 2009). Nervové kódování NAc pro slané řešení je modulováno ve skořápce na základě stupně motivace solí, zatímco jádrové neurony nedokázaly zobrazit stavové rozdíly (Loriaux a kol., 2011). Podobně i mikroinfuze amfetaminu v rámci NAc silně zesilují motivační sílu stisknutí páky v přítomnosti podnětu během přenosu na Pavlovian-instrumental (PIT), stejně jako chronické předběžné přenosy s kokainem (Wyvell a Berridge, 2000; Saddoris a kol., 2011; LeBlanc a kol., 2013). Zkušenost se samostatně podávaným kokainem, který potencuje chování PIT, také přednostně zvyšuje nervové kódování skořápky NAc vzhledem k jádru (Saddoris a kol., 2011).

Zdá se, že tento vzorec IS a PE ve skořápce a jádru sleduje chutné i averzní podmínky. V kondicionování pavloviánských strachů se fázové DA zvyšuje ve skořápce NAc pro výrazné averzní narážky, zatímco u uvolnění jádra DA došlo k poklesu a pozastavení ve vydání svědčící o predikci negativního výsledku PE typu (Badrinarayan a kol., 2012). Tudíž i negativní (ale významné) události lze započítat do modelu typu IS uvnitř shellu, zatímco uvolnění jádra DA zůstává silně spjato s předpovědí výsledné hodnoty.

Složitost signalizace PE a IS v kondicionování

Jednou výzvou je, že v pavloviánském kondicionování zvířata, která preferenčně interagují s prediktivními narážkami („sign trackers“), vykazují v jádru NAc zlepšené uvolňování DA ve srovnání s těmi, která okamžitě přecházejí do pohárku s jídlem („tracking trackers“); Flagel a kol., 2011). Toto zvýšené sledování stopy je popsáno jako podpůrné IS, protože tága se stala hlavním stimulem schopným působit jako motivační „magnet“ a odpovídá podobným zjištěním v jádru (Aragona a kol., 2009; Peciña a Berridge, 2013; Wassum a kol., 2013; Ostlund a kol., 2014). Zdá se, že to je v rozporu s naším přiřazením PE předpojaté k jádru a IS ke skořápce.

Je důležité si uvědomit, že příslušné role signálu DA v jádru a skořápce jsou pravděpodobně složité. Například jen málo z výše uvedených studií nezávisle zkoumalo roli skořápky a jádra v těchto úkolech, takže zvýšené DA v jádru u zvířat sledujících znamení může jednoduše odrážet generalizované zvýšení motivačních DA signálů v mezolimbické dráze. Dále neobhajujeme absolutní rozdělení; našli jsme nějaké DA vydání do TLO v jádru, i když DA na SLO ve skořápce přetrvával navzdory změnám v motivaci během zániku, což naznačuje, že rysy IS mohou být přítomny v jádru a PE ve skořápce (i když na nižších úrovních a / nebo méně citlivé na dynamiku úkolu). Doporučujeme spíše, aby jádro a skořepina představovaly kritické zkreslení směrem k kódovacím vzorům typu PE a IS, což je v souladu s více odstupňovaným složením striatální anatomie (Haber, 2014).

Důsledky pro závislost

Rozdíly v signalizaci DA jádra a shellu založené na modelu mají důležité důsledky nad rámec přirozeného učení odměn. Například ačkoli drogy zneužívání jsou zpočátku prospěšné, v průběhu času mohou stimuly spojené s drogami vyvolat pocity intenzivní averzní touhy, což vede k negativnímu afektivnímu stavu, který řídí vyhledávání drog (Koob a Le Moal, 1997). Prodloužená abstinence od drog zvyšuje účinek podnětů spojených s drogami, i když je proces známý jako inkubace touhy (Grimm a kol., 2001; Hollander a Carelli, 2005; Pickens a kol., 2011). Předpokládaný výsledek (droga) se nemění jak v okamžitém, tak v abstinenčním stavu, ale u abstinujících subjektů dochází k výraznému nárůstu motivace k obnovení užívání drog. To naznačuje významnou změnu motivace těchto stimulů a dalo by se předpovědět, že změny související s abstinencí by měly být přednostně vidět v prostředí. Podobně, když jsou krysy, které si samy podávají léky, prezentovány signály predikující kokain, které navozují averzivní motivační stav, změny v DA signalizaci sledují averzivní stav zvířete ve skořápce, ale ne jádro (Wheeler a kol., 2011). Souhrnně tato zjištění podporují, že základní a shell DA příspěvky k učení a motivaci jsou konzistentní jak v přírodních, tak i v drogových výhodách.

Poznámky pod čarou

  • Přijato červen 18, 2015.
  • Revize obdržela červenec 8, 2015.
  • Přijato červenec 15, 2015.
  • Tuto práci podpořili Národní ústavy pro granty na zneužívání drog DA028156 a DA035322 MPS a DA017318 a DA034021 RMC a DA010900 RMW Děkujeme Dr. Elizabeth West za připomínky k dřívějšímu návrhu této práce.

  • Autoři neuvádějí žádné konkurenční finanční zájmy.

  • Korešpondenci je třeba adresovat Dr. Michael Saddorisovi, Katedře psychologie a neurověd, University of Colorado Boulder, Muenzinger, UCB 345, Boulder, CO 80309-0345. [chráněno e-mailem]

Reference

    1. Aragona BJ,
    2. Den JJ,
    3. Roitman MF,
    4. Cleaveland NA,
    5. Wightman RM,
    6. Carelli RM

    (2009) Regionální specifičnost ve vývoji fázových přenosových vzorců dopaminu v reálném čase během získávání asociace tága a kokainu u potkanů. Eur J Neurosci 30: 1889 – 1899.

    1. Badrinarayan A,
    2. Wescott SA,
    3. Vander Weele CM,
    4. Saunders BT,
    5. Couturier BE,
    6. Maren S,
    7. Aragona BJ

    (2012) Averzní podněty odlišně modulují dynamiku přenosu dopaminu v reálném čase uvnitř jádra a jádra. J Neurosci 32: 15779 – 15790.

    1. Berridge KC

    (2012) Od chyby predikce po motivační význam: mezolimbický výpočet motivace odměny. Eur J Neurosci 35: 1124 – 1143.

    1. Berridge KC,
    2. Robinson TE

    (1998) Jaká je role dopaminu v odměně: hedonický dopad, učení se odměňování nebo stimulační podněcování? Brain Res Rev 28: 309 – 369.

    1. Bromberg-Martin ES,
    2. Matsumoto M,
    3. Hikosaka O

    (2010) Dopamin v motivační kontrole: odměňování, averze a varování. Neuron 68: 815 – 834.

    1. Budygin EA,
    2. John CE,
    3. Mateo Y,
    4. Jones SR

    (2002) Nedostatek kokainového účinku na clearance dopaminu v jádru a skořápce jádra accumbens knock-out myší s dopaminovým transportérem. J Neurosci 22: RC222.

    1. Cacciapaglia F,
    2. Saddoris MP,
    3. Wightman RM,
    4. Carelli RM

    (2012) Diferenciální dynamika uvolňování dopaminu v jádru accumbens jádro a skořepinu sleduje odlišné aspekty chování zaměřeného na cíl pro sacharózu. Neurofarmakologie 62: 2050 – 2056.

    1. Cohen JY,
    2. Haesler S,
    3. Vong L,
    4. Lowell BB,
    5. Uchida N

    (2012) Signály specifické pro neurony pro odměnu a trest ve ventrální tegmentální oblasti. Příroda 482: 85 – 88.

    1. Den JJ,
    2. Jones JL,
    3. Wightman RM,
    4. Carelli RM

    (2010) Fázové jádro accumbens uvolňování dopaminu kóduje náklady spojené s úsilím a zpožděním. Biol Psychiatry 68: 306 – 309.

    1. Flagel SB,
    2. Clark JJ,
    3. Robinson TE,
    4. Mayo L,
    5. Czuj A,
    6. Willuhn I,
    7. Akers CA,
    8. Clinton SM,
    9. Phillips PE,
    10. Akil H

    (2011) Selektivní role dopaminu v učení stimulu a odměny. Příroda 469: 53 – 57.

    1. Gan JO,
    2. Walton ME,
    3. Phillips PE

    (2010) Oddělitelné kódování nákladů a přínosů budoucích odměn mezolimbickým dopaminem. Nat Neurosci 13: 25 – 27.

    1. Grimm JW,
    2. Doufám, BT,
    3. Wise RA,
    4. Shaham Y

    (2001) Neuroadaptace: inkubace kokainové touhy po stažení. Příroda 412: 141 – 142.

    1. Haber SN

    (2014) Místo dopaminu v okruhu kortiko-bazálních ganglií. Neurovědy 282C: 248 – 257.

    1. Heien ML,
    2. Khan AS,
    3. Ariansen JL,
    4. Na zdraví JF,
    5. Phillips PE,
    6. Wassum KM,
    7. Wightman RM

    (2005) Měření fluktuací dopaminu po kokainu v mozku chovaných krys v reálném čase. Proc Natl Acad Sci USA 102: 10023 – 10028.

    1. Hollander JA,
    2. Carelli RM

    (2005) Abstinence od samopodávání kokainu zvyšuje neurální kódování cílených chování v accumbens. Neuropsychopharmacology 30: 1464 – 1474.

    1. Keithley RB,
    2. Carelli RM,
    3. Wightman RM

    (2010) Odhad pozice a vícerozměrná analýza in vivo rychlé skenování cyklických voltametrických dat. Anal Chem 82: 5541 – 5551.

    1. Koob GF,
    2. Le Moal M

    (1997) Zneužívání drog: hedonická homeostatická dysregulace. Věda 278: 52 – 58.

    1. LeBlanc KH,
    2. Maidment NT,
    3. Ostlund SB

    (2013) Opakovaná expozice kokainu usnadňuje expresi motivační motivace a vyvolává obvyklou kontrolu u potkanů. Plošní jedna 8: e61355.

    1. Loriaux AL,
    2. Roitman JD,
    3. Roitman MF

    (2011) Nucleus accumbens shell, ale ne jádro, sleduje motivační hodnotu soli. J Neurophysiol 106: 1537 – 1544.

    1. Olmstead MC,
    2. Parkinson JA,
    3. Miles FJ,
    4. Everitt BJ,
    5. Dickinson A

    (2000) Hledání kokainu u potkanů: regulace, posílení a aktivace. Psychofarmakologie 152: 123 – 131.

    1. Ostlund SB,
    2. LeBlanc KH,
    3. Kosheleff AR,
    4. Wassum KM,
    5. Zajištění NT

    (2014) Fázická mezolimbická dopaminová signalizace kóduje usnadnění motivační motivace vyvolané opakovanou expozicí kokainu. Neuropsychopharmacology 39: 2441 – 2449.

    1. Owesson-White CA,
    2. Ariansen J,
    3. Stuber GD,
    4. Cleaveland NA,
    5. Na zdraví JF,
    6. Wightman RM,
    7. Carelli RM

    (2009) Nervové kódování chování při hledání kokainu je shodné s fázovým uvolňováním dopaminu v jádru a skořápce accumbens. Eur J Neurosci 30: 1117 – 1127.

    1. Pan WX,
    2. Schmidt R,
    3. Wickens JR,
    4. Hyland BI

    (2005) Dopaminové buňky reagují na předpovězené události během klasického kondicionování: důkaz pro stopy způsobilosti v síti odměňování. J Neurosci 25: 6235 – 6242.

    1. Peciña S,
    2. Berridge KC

    (2013) Dopaminová nebo opioidní stimulace jádra accumbens podobně zesiluje „touhu“ vyvolanou narážkou za odměnu: celé jádro a mediální skořápka jsou mapovány jako substráty pro zlepšení PIT. Eur J Neurosci 37: 1529 – 1540.

    1. Pickens CL,
    2. Airavaara M,
    3. Theberge F,
    4. Fanous S,
    5. Doufám, BT,
    6. Shaham Y

    (2011) Neurobiologie inkubace drogové touhy. Trendy Neurosci 34: 411 – 420.

    1. Znovu načíst AD

    (2004) Závislost jako výpočetní proces se zhoršil. Věda 306: 1944 – 1947.

    1. Robinson TE,
    2. Berridge KC

    (2008) Recenze: teorie stimulační senzibilizace závislosti: některé aktuální problémy. Philos Trans R. Soc Lond B Biol Sci 363: 3137 – 3146.

    1. Roitman MF,
    2. Stuber GD,
    3. Phillips PE,
    4. Wightman RM,
    5. Carelli RM

    (2004) Dopamin působí jako sekundární modulátor při hledání potravy. J Neurosci 24: 1265 – 1271.

    1. Saddoris MP,
    2. Gallagher M,
    3. Schoenbaum G

    (2005) Rychlé asociativní kódování v bazolaterální amygdale závisí na spojeních s orbitofrontální kůrou. Neuron 46: 321 – 331.

    1. Saddoris MP,
    2. Stamatakis A,
    3. Carelli RM

    (2011) Neurální koreláty Pavlovian-instrumentálního přenosu ve skořápce nucleus accumbens jsou selektivně potencovány po samopodání kokainu. Eur J Neurosci 33: 2274 – 2287.

    1. Saddoris MP,
    2. Sugam JA,
    3. Cacciapaglia F,
    4. Carelli RM

    (2013) Rychlá dynamika dopaminu v jádru a shellu accumbens: učení a akce. Přední Biosci (Elite Ed) 5: 273 – 288.

    1. Saddoris MP,
    2. Sugam JA,
    3. Stuber GD,
    4. Witten IB,
    5. Deisseroth K,
    6. Carelli RM

    (2015) Mesolimbický dopamin dynamicky sleduje diskrétní aspekty rozhodování založeného na hodnotách a je s ním kauzálně spojen. Biol Psychiatry 77: 903 – 911.

    1. Schoenbaum G,
    2. Setlow B,
    3. Saddoris MP,
    4. Gallagher M

    (2003) Kódování předpokládaného výsledku a získané hodnoty v orbitofrontální kůře během vzorkování cue závisí na vstupu z bazolaterální amygdaly. Neuron 39: 855 – 867.

    1. Schultz W,
    2. Dickinson A

    (2000) Neuronové kódování predikčních chyb. Annu Rev Neurosci 23: 473 – 500.

    1. Schultz W,
    2. Dayan P,
    3. Montague PR

    (1997) Neuronový substrát předpovědi a odměny. Věda 275: 1593 – 1599.

    1. Smith KS,
    2. Berridge KC,
    3. Aldridge JW

    (2011) Odlišné potěšení z motivačních výběžků a signálů učení v obvodech odměňování mozku. Proc Natl Acad Sci USA 108: E255 – E264.

    1. Sugam JA,
    2. Den JJ,
    3. Wightman RM,
    4. Carelli RM

    (2012) Fázové jádro accumbens dopamin kóduje rozhodovací chování založené na riziku. Biol Psychiatry 71: 199 – 205.

    1. Tindell AJ,
    2. Smith KS,
    3. Berridge KC,
    4. Aldridge JW

    (2009) Dynamické výpočty motivačních výhod: „chtějí“ to, co se nikdy „nelíbilo“. J Neurosci 29: 12220 – 12228.

    1. Tobler PN,
    2. Dickinson A,
    3. Schultz W

    (2003) Kódování predikovaného vynechání odměny dopaminovými neurony v podmíněném inhibičním paradigmatu. J Neurosci 23: 10402 – 10410.

    1. Waelti P,
    2. Dickinson A,
    3. Schultz W

    (2001) Dopaminové odpovědi odpovídají základním předpokladům teorie formálního učení. Příroda 412: 43 – 48.

    1. Wassum KM,
    2. Ostlund SB,
    3. Zajištění NT

    (2012) Fázická mezolimbická dopaminová signalizace předchází a předpovídá výkon samo iniciované úlohy akční sekvence. Biol Psychiatry 71: 846 – 854.

    1. Wassum KM,
    2. Ostlund SB,
    3. Loewinger GC,
    4. Zajištění NT

    (2013) Fázické mezolimbické uvolňování dopaminu sleduje hledání odměny při expresi pavlovian-instrumentální přenos. Biol Psychiatry 73: 747 – 755.

    1. Wheeler RA,
    2. Aragona BJ,
    3. Fuhrmann KA,
    4. Jones JL,
    5. Den JJ,
    6. Cacciapaglia F,
    7. Wightman RM,
    8. Carelli RM

    (2011) Nánosy kokainu jsou hnací silou proti kontextově závislým posunům ve zpracování odměn a emočním stavu. Biol Psychiatry 69: 1067 – 1074.

    1. Wyvell CL,
    2. Berridge KC

    (2000) Amfetamin Intra-accumbens zvyšuje podmíněnou motivační odměnu za sacharosovou odměnu: zvýšení odměny „chtějí“, aniž by bylo posíleno „líbení“ nebo posílení odpovědi. J Neurosci 20: 8122 – 8130.

    1. Yorgason JT,
    2. España RA,
    3. Jones SR

    (2011) Démonový voltametrický a analytický software: analýza kokainem indukovaných změn v dopaminové signalizaci pomocí více kinetických měření. J Neurosci Metody 202: 158 – 164.

    1. Zhang J,
    2. Berridge KC,
    3. Tindell AJ,
    4. Smith KS,
    5. Aldridge JW

    (2009) Nervový výpočetní model motivačního vývinu. PLoS Comput Biol 5: e1000437.

  •