Disociata dopamina dinamiko por lernado kaj motivado (2019)

https://www.nature.com/articles/s41586-019-1235-y

abstrakta

La dopamina projekcio de ventra tegmenta areo (VTA) ĝis kerno accumbens (NAc) estas kritika por instigo labori por rekompencoj kaj rekompencita lernado. Kiel dopamino subtenas ambaŭ funkciojn, estas neklare. Dopamina ĉela pikado povas ĉifri prognozajn erarojn, kiuj estas esencaj lernaj signaloj en komputaj teorioj de adapta konduto. Male, liberigo de dopamino kreskas dum bestoj alproksimiĝas al rekompencoj, reflektante rekompencan atendon. Ĉi tiu misagordo povus reflekti diferencojn en kondutaj taskoj, pli malrapidaj ŝanĝoj en dopamina ĉela pikado aŭ spike-sendependa modulado de dopamina liberigo. Ĉi tie ni komparas spikadon de identigitaj VTA-dopaminaj ĉeloj kun NAc-dopamina liberigo en la sama decida tasko. Indikoj, kiuj indikas venontan rekompencon, kreskis kaj pliiĝis kaj eldoniĝis. Tamen, NAc-kerna dopamina liberigo ankaŭ kovris kun dinamike evoluantaj rekompencaj atendoj, sen respondaj ŝanĝoj en VTA-dopamina ĉela pikado. Niaj rezultoj sugestas fundamentan diferencon pri kiel reguligo de dopamino liberigas por atingi apartajn funkciojn: elsendaj eksplodaj signaloj antaŭenigas lernadon, dum loka kontrolo instigas motivadon.

ĉefa

Dopamina famas rilate al 'rekompenco' - sed kiel ekzakte? Unu funkcio implikas lernadon de neatenditaj rekompencoj. Mallongaj pliigoj en dopamina ĉela pafo kodigas rekomendajn erarajn prognozajn erarojn (RPEs).1,2,3—Lernantaj signaloj por optimumigi estontajn motivajn kondutojn. Dopaminaj manipuladoj povas influi lernadon kvazaŭ ŝanĝante RPE4,5,6, sed ili ankaŭ tuŝas motivitajn kondutojn tuj, kvazaŭ dopamino signalas rekompencon (valoron)5. Plue, NAc-dopamina grimpas dum motivita alproksimiĝo, konforme al dopamina kodiga valoro7,8,9,10,11.

Kun malmultaj esceptoj2,12,13, ekzameno de duobla dopamina pafo estis ekzamenita dum klasika kondiĉado en best-fiksitaj bestoj3,14, malkiel antaŭbrainan dopamin-liberigon. Ni do komparis pafon kun liberigo en la samaj kondiĉoj. Ni identigis VTA-dopaminajn neŭronojn per optogenetika etikedado3,13. Por mezuri la liberigon de dopamina NAc, ni uzis tri sendependajn metodojn: mikrodijalion, voltammetrion kaj la optikan sensilon dLight15-Kun konverĝaj rezultoj. Nia ĉefa konkludo estas, ke kvankam eksplodoj de RPE-skala dopamina pikilo krevas subitajn ŝanĝojn en dopamina liberigo taŭgaj por lernado, apartaj fluoj de dopamina NAc asociitaj kun instigo ekestas sendepende de la pafado de dopamina ĉelo.

Dopamina spuras instigon en ŝlosilaj locioj

Ni trejnis ratojn en operanta 'bandita' tasko5 (Fig. 1a, b). Ĉe ĉiu provo, lumigado de nazporda haveno ('Lumo-ŝaltita') instigis alproksimiĝon kaj eniron ('Centro-eniro'). Post ŝanĝiĝema tenperiodo (0.5-1.5 s), blanka bruo ('Go cue') igis la raton retiriĝi ('Center-out') kaj enŝovi apudan havenon ('Side-in'). Dum rekompencitaj provoj, ĉi tiu Flanka evento estis akompanata de manĝ-uja klako, kiu instigis la raton alproksimiĝi al manĝa haveno ('Manĝaĵa-haveno') por kolekti sukeron. Maldekstraj kaj dekstraj elektoj estis rekompencitaj per sendependaj probabloj, kiuj foje ŝanĝiĝis sen averto. Kiam ratoj pli verŝajne ricevis rekompencojn, ili estis pli motivitaj plenumi la taskon. Ĉi tio estis evidenta en ilia "latenteco" - la tempo inter Lum-en kaj Centra-eniro-kiu estis sentema al la rezulto de la antaŭaj malmultaj provoj (Plilongigitaj Datumoj Fig. 1) kaj tiel skale inverse kun rekompenca indico (Fig. 1b).

Fig. 1: Dopamina liberiga kovarioj kun rekompenco specife en NAc-kerno kaj ventrala prelimbika kortekso.
figuro1

a, Bandit-taskaj eventoj. b, Ekzempla kunsido. Supra vico, rekompencu probablojn en ĉiu bloko (maldekstre: dekstre); vico du, tiktakoj indikas rezulton de ĉiu provo (alta, rekompencita; mallonga, ne rekompencita); vico tri, lik-integriga takso de rekompenco (nigra) kaj kuranta mezumo de latenteco (cejano; renversita protokola skalo); malsupra vico, NAc-kerna dopamino en la sama kunsido (1-min-specimenoj). DA, dopamino. c, Supre, microdialysis lokoj en mezaj frontaj kortekso kaj striato (vidu ankaŭ Plilongigitajn Datumojn Fig. 1). n = 51 sondaj lokoj de 12 ratoj, ĉiu kun 2 mikrodializaj sondoj mallevitaj inter kunsidoj. Stango-koloro indikas korelacion inter dopamino kaj rekompenco. ACC, antaŭa cingula kortekso; dPL, dorsa prelimbia korto; vPL, ventra prelimbia kortekso; IL, infralimbia kortiko; DMS, dorsa-meza striato. Meza, averaĝe kruc-korelogramoj inter dopamino kaj rekompenco. Ruĝaj stangoj indikas 99% konfidencan intervalon de intermiksitaj tempaj serioj. Malsupre, rilatoj inter neŭrokemiaj kaj rekompenco (multa regreso). NA, noradrenalino; 5-HT, serotonino; ACh, acetilkolino; GABA, γ-aminobutira acido; Glu, glutamato; NM, normetadrenalino; DOPAC, 3,4-dihidroksifenilaceta acido; 3-MT, 3-metoxitiramin; HVA, homovanila acido; 5-HIAA, 5-hidroksindoleaceta acido. d, Efiko de blokaj transiroj pri rekompenca indico (maldekstre), latencia (meza) kaj NAc-kerna dopamino (dekstre). Transiroj estis klasifikitaj laŭ ĉu la sperta rekompenca indico pliiĝis (n = 25) aŭ malpliigita (n = 33). Datumoj estas el ĉiuj 14-kunsidoj, en kiuj mezuris NAc-kernan dopaminon (unu po rato, kombinante datumojn de novaj kaj antaŭe raportitaj5 bestoj), kaj komplotita kiel meznombro ± sem e, Komponitaj mapoj de korelacioj inter dopamino kaj rekompenco (n = 19 ratoj, 33 sesioj, 58 enketaj lokigoj). Cerbaj atlaso-konturoj en ĉi tiu figuro estis reproduktitaj kun permeso de Paxinos kaj Watson, 200551.

Ni antaŭe raportis5 korelacio inter NAc-dopamina liberigo kaj rekompenca indico, konforme al la instiga rolo de mesolimbia dopamino16. Ĉi tie, ni unue celis determini ĉu ĉi tiu rilato estas observata tra antaŭaj cerbaj celoj, konforme al 'tutmonde elsendita' dopamina signalado17, aŭ estas limigita al specifaj subregionoj. Ni plue hipotezis, ke ĉi tiuj dopaminaj dinamikoj diferencos inter striato kaj kortekso, ĉar ĉi tiuj strukturoj havas apartan dopaminan - degradan kinetikon.18 kaj povas uzi dopaminon por distingaj funkcioj19,20.

Uzante mikrodiálisis kun alta rendimento likva kromatografio-masa spektrometrio (HPLC-MS), ni enketis median frontan kortekson kaj striatum (Fig. 1c, Plilongigitaj Datumoj Fig. 1). Ni samtempe taksis 21-neurotransmisilojn kaj metabolitojn kun 1-min-tempo-rezolucio, kaj uzis regreson por kompari kemiajn tempajn seriojn kun kondutaj variabloj (Plilongigitaj Datumoj Fig. 2).

Ni replikis la korelacion inter rekompenco-procento kaj NAc-dopamino - kontraste kun aliaj neurotransmisiloj (Fig. 1c, d). Ĉi tiu rilato estis lokalizita al NAc-kerno, kaj ne en la NAc-ŝelo aŭ dors-media striato. Kontraŭe al nia hipotezo, ni observis similan spacan padronon en frontala kortekso: dopamina liberigo korelaciita kun rekompenca rapideco en ventrala prelimbika kortekso, sed ne en pli da dorsaj aŭ ventraj subregionoj (Fig. 1c, ekz). Kvankam neatenditaj, ĉi tiuj ĝemelaj "punktoj" de valor-rilata dopamina liberigo havas intrigan paralelon en homa neŭroimagado: sango-dependiga nivelo de oksigeno de sango korelacias kun subjektiva valoro, specife en NAc kaj ventral-media pre-frontala kortekso.21.

VTA-pafo ne rilatas al instigo

Ni poste pritraktis, ĉu ĉi tiu motiva rilata prabena dopamino devenas de varia pafo de dopaminaj ĉeloj. La NAc-kerno ricevas dopaminan enigon de flankaj porcioj de VTA (VTA-l)6,22,23. En kap-fiksitaj musoj, VTA-l dopamina neŭronoj laŭdire havas unuformajn, RPE-similajn respondojn al kondiĉitaj stimuloj3. Por registri VTA-l dopaminajn ĉelojn, ni infektis la VTA kun adeno-asociita viruso (AAV) por Cre-dependa esprimo de channelrhodopsin (AAV-DIO-ChR2) en ratoj, kiuj esprimas Cre recombinase sub tirosina hidroksilase (TH) iniciatinto (vidu metodoj). Optrodes (Fig. 2a, b) registris unu-unuajn respondojn al mallongaj blu-laseraj pulsoj (Fig. 2c, Plilongigitaj Datumoj. 3, 4, Suplementa Fig. 1). Ni trovis 27 bone izolitajn VTA-l ĉelojn kun fidindaj mallong-latencaj pikiloj, kaj identigis ilin kiel dopaminaj neŭronoj.

Fig. 2: Aktiveco de identigitaj VTA-dopaminaj neŭronoj ne ŝanĝiĝas kun rekompenca indico.
figuro2

a, Maldekstre, optrode-skemo kun 16 tetrodoj ĉirkaŭ 200-µm-diametra optika fibro. Prave, ekzemplo de optroda lokado ene de flanka VTA. Skala stango, 1 mm. Ruĝa, dopamina ĉela markilo tirosina hidroksilazo; verda, ChR2 – EYFP; flava, interkovras. Por ĉiuj lokigoj, vidu Plilongigita Datuma Fig. 3. b, VTA dopamina ĉelaj spikoj. Ruĝaj stangoj indikas detektitajn krevojn kaj nombron de pikiloj en ĉiu eksplodo (vidu metodoj). Skalo, 0.5 s, 0.5 mV. c, Ekzemple neŭrona respondo al lasaj pulsoj de kreskanta daŭro. d, Sesio-larĝa pafo-rapideco kontraŭ spico-larĝo (ĉe duono de maksimumo) por ĉiu VTA-ĉelo. Bluaj, etikeditaj dopaminaj ĉeloj; purpura, aparta amaso de supozataj ne-dopaminaj neŭronoj. Insektoj, ekzemploj de mezaj ondformoj (negativa tensio supren). e, Pafanta rapideco (blua; 1-minaj rubujoj) de VTA-dopamina neŭrono dum bandita tasko. Latenteco (cejano) kovas kun rekompenco, sed pafrapideco ne. f, Tago de tirado por ĉiuj VTA-neŭronoj (blua, dopamina; purpura, ne-dopamina; griza, neklasifikita) en malaltaj kontraŭ altaj rekompenco-blokoj. Neniu montris gravajn diferencojn (Wilcoxon subskribis rangon-provon uzante 1-min-bindojn, ĉio P > 0.05 post korektado por multaj komparoj). g, Meza kruc-korelacio inter dopamina ĉela pafo kaj rekompenca indico montras neniun signifan rilaton. h, Analizo de dopamina pafo-ritmo ĉe blokaj transiroj (sama formato kiel Fig. 1d). n = 95 rekompenco pliiĝas, 76 malpliiĝas. i. Distribuoj de intertempaj intertempoj (ISI, maldekstre) kaj spikaj eksplodoj (dekstre) estas senŝanĝaj inter pli altaj kaj pli malaltaj rekompencaj blokoj (statistikoj de Kolmogorov – Smirnov: ISIs, 0.138, P = 0.92; eksplodoj, 0.165, P = 0.63).

Ĉiuj dopaminaj neŭronoj estis tone aktivaj, kun relative malaltaj pafrapidecoj (averaĝa 7.7 Hz, intervalo 3.7-12.9 Hz; kompare kun ĉiuj VTA-l-neŭronoj registritaj kune kun dopaminaj ĉeloj, P <0.001 unutosta Mann-Whitney-testo). Ili ankaŭ havis pli longtempajn spikajn ondformojn (P <5 × 10-6, unu-vosta Mann-Whitney-testo), kvankam estis esceptoj (Fig. 2d), kiu konfirmas, ke ondoforma daŭro estas nesufiĉa markilo de dopaminaj ĉeloj in vivo3,24. Malsama grupo de neŭronoj VTA-ln = 38, de la samaj kunsidoj) kun mallongaj ondformoj kaj pli altaj pafaj rapidoj (> 20 Hz; averaĝa 41.3 Hz, intervalo 20.1-97.1 Hz) inkludis neniujn etikeditajn dopaminajn ĉelojn. Ni supozas, ke ĉi tiuj pli rapide pafantaj ĉeloj estas GABAergic kaj / aŭ glutamatergic3,25, kaj raportu ilin kiel "ne-dopamina" sube.

Ni registris la samajn dopaminajn ĉelojn tra multoblaj kondutaj taskoj. VTA-l-dopaminaj ĉeloj respondis forte al hazarde tempigitaj manĝaĵ-kubaj klakoj, kaj iom post iom malpli forte kiam ĉi tiuj klakoj estis pli antaŭvideblaj per antaŭaj aludoj (Plilongigitaj Datumoj Fig. 5). Ĉi tio kongruas kun kanona RPE-simila kodado de dopaminaj ĉeloj en Pavloviaj taskoj2,3,26.

Surbaze de evidenteco de anestezitaj bestoj, oni antaŭe argumentis, ke ŝanĝitaj dopaminaj niveloj mezuritaj per mikrodializo ekestiĝas de ŝanĝoj en la tonika pafrapideco de dopaminaj ĉeloj.27 kaj / aŭ la proporcio de dopaminaj neŭronoj aktiva kontraŭ neaktiva28. Tamen, en la bandita tasko, tona dopamina ĉela pafo en ĉiu bloko de provoj estis indiferenta al rekompenca indico (Fig. 2e, g). Ne estis signifa ŝanĝo en la pafo-indicoj de individuaj dopaminaj ĉeloj, aŭ tiuj de iuj aliaj VTA-l-neŭronoj, inter pli altaj kaj pli malaltaj rekompencaj blokoj. 2f, h; vidu ankaŭ ref. 29 por konkordaj rezultoj en kap-fiksitaj musoj). Ankaŭ ne estis ĝenerala ŝanĝo en la rapideco, per kiu dopaminaj ĉeloj ekbruligas spikojn (Fig. 2i). Plue, ni observis neniujn dopaminajn ĉelojn interŝanĝantajn inter aktivajn kaj neaktivajn statojn. La proporcio da tempaj dopaminaj ĉeloj pasigitaj senaktive (longaj inter-spicaj intertempoj) estis tre malalta, kaj ne ŝanĝiĝis inter pli altaj kaj pli malaltaj rekompencaj blokoj (Fig. 2i).

La anatomio de la VTA-NAc-dopamina projekcio estis intense esplorita6,22,23, sed - konsiderante ĉi tiun ŝajnan funkciajn misprezentojn inter pafo kaj liberigo - ni konfirmis, ke ni registras de la ĝusta porcio de la VTA. Malgrandaj injektoj de la retrograda trakolera toksino B (CTb) en NAc-kernon rezultigis densan etikedadon de TH+ neŭronoj ene de la sama VTA-l-areo kiel niaj optrodaj registradoj (Plilongigitaj Datumoj Fig. 3). Ene de la proksimuma registra zono, 21% de TH+ ĉeloj ankaŭ estis CTb+, Kaj ĉi tio probable estas subtaksi la frakcion de NAc-kerno projektantaj VTA-l dopaminajn ĉelojn, ĉar niaj trakaj injektoj ne komplete plenigis la NAc-kernon. Tiel, nia specimeno de n = 27 etikeditaj VTA-dopaminaj ĉeloj (plus multaj pli neetikeditaj ĉeloj) preskaŭ certe inkluzivas NAc-kernajn projektajn neŭronojn. Fine, en plia rato, ni registris du etikeditajn dopaminajn ĉelojn VTA-l post infuzado de AAV selekte en la kernon NAc (Plilongigita Datuma Fig. 3). Ambaŭ retrograde infektitaj ĉeloj havis pafajn ŝablonojn, kiuj tre similas al la aliaj etikeditaj dopaminaj ĉeloj ĉiurilate, inkluzive mankon de tonikaj pafaj ŝanĝoj kun ŝanĝiĝanta rekompenco (Suplementa Fig). Ni konkludas, ke ŝanĝoj en tonika VTA-l dopamina ĉela pafo ne respondecas pri instigaj rilataj ŝanĝoj en antaŭbrain-dopamina liberigo.

Spuri-liberigon sur multoblaj tempoj

Ĉu NAc-dopamino liberigas spuron de rekompenco per si mem, kiel sugestite en iuj teorioj30aŭ ĉu ĉi tiu korelacio estas pelita de dinamikaj fluktuoj en liberigo de dopamino tro rapidaj por solvi per mikrodijalizo? Ni argumentis por ĉi-lasta ebleco surbaze de voltmetriaj datumoj5, sed serĉis konfirmon uzante sendependan mezuron de liberigo de dopamino, kiu povas ampleksi diversajn tempojn. La dLight1-aro de genetike koditaj optikaj dopaminaj indikiloj estis kreita per enmetado de cirkume permutita GFP en dopaminajn D1-receptorojn.15. Ligado de dopamino kaŭzas tre specifan kreskon de fluoreskeco (Fig. 3a). Ni infuzis AAV en NAc por esprimi ĉu dLight1.1 (kvar kontrolitaj NAc-lokigoj de tri ratoj) aŭ la pli brilan varianton dLight1.3b (ses kontrolitaj NAc-lokoj de kvar ratoj) kaj kontrolita fluoreskeco per fibro-fotometrio. Ni observis klarajn NAc-dopaminajn respondojn al Pavloviaj rekompenco-antaŭdiroj, simile al VTA-dopamina ĉela pafo (Plilongigitaj Datumoj Fig. 5).

Fig. 3: Bridaj tempoj de dopamina mezurado.
figuro3

a, Fluoreska respondo de dLight1.3b. Insekto, titoloj de dopamino (n = 15 interesaj regionoj (ROI)) kaj noradrenalino (n = 9). Ĉefa figuro, bane aplikataj neŭrotransmitoroj (ĉio n = 12 ROI). Lia, histamino. b, Ekzempla bandita kunsido inkluzive de normaligita NAc dLight1.3b-signalo (1-min-rubujoj). c, DLight-signalo ŝanĝiĝas per blokaj transiroj. n = 35 rekompenca indico pliiĝas, 45 malpliiĝas. d, Kruc-korelacio inter dLight kaj rekompenca indico. e, Pli proksima vido de la ombra parto de b. Sagoj: nigraj, Centro-nazumaj; helruĝa, Flanka (rekompencita); helblua, Flanka eniro (senpremie); malhelruĝa, Manĝaĵ-enportebla (rekompencita); malhelblua, Enmanĝebla (sen rekompenco). Sekvaj vicoj: takso de rekompenca imposto; dLumo kun malalta distingivo (1 min); dLumo ĉe alta distingivo (50 Hz, verda; kvin-punkta meza-filtrita, nigra); modelaj statvaloroj (cejano); kaj RPEoj (magento). Post kelkaj nerekompensitaj provoj, ŝtataj valoroj komence de la testo estas malaltaj, tiam rekompenca liverado elvokas pozitivan RPE kaj akompanan akran kreskon de dopamino. Sinsekvaj rekompencitaj provoj malpliigas RPEojn, sed pliigas ŝtatajn valorojn, akompanitajn de rampanta dopamino. f, Mallongaj tempaj interkruciĝoj montras proksiman rilaton inter dLight kaj valoro, kaj pli malgranda rilato al RPE. g, Ene-provaj korelacioj inter modelaj variabloj kaj dLight kun malsamaj malfruoj; korelacio al kaj valoro kaj RPE estas plej forta ĝis dLight ĉirkaŭ 0.3 sekojn poste. hEn ĉiuj sesioj, maksimuma korelacio estis pli granda por valoro ol por RPE aŭ rekompenco.

Por la bandita tasko, ni unue ekzamenis la dLight-signalon en 1-min-rubandoj (Fig. 3b) por komparo al mikrodisizo. Ni denove vidis klaran rilaton inter NAc-dopamina liberigo kaj rekompenca indico, ambaŭ en kruc-korelacio kaj analizo de blokaj transiroj (Fig. 3c, d). Ni poste ekzamenis pli detale, kiel tiu rilato ekestas. Prefere ol malrapide varii laŭ tempodaŭro de minutoj, la dLight-signalo montris tre dinamikajn fluktuojn ene de kaj inter ĉiu provo. 3e). Ni komparis ĉi tiujn fluktuojn kun tujaj ŝtataj valoroj kaj RPE-oj taksitaj de plifortiga-lernada modelo (duon-markovra decida procezo5). Kiel antaŭe raportis uzante voltammetrio5, momento post momento NAc-dopamina montris fortan korelacion kun ŝtataj valoroj (Fig. 3f), videbla kiel rampado ene de provoj kiam rekompencoj estis atenditaj (Fig. 3e). Ni ankaŭ vidis transirajn kreskojn kun malpli atendataj rekompencaj liveraĵoj, konformaj al RPE (ekzamenita sube). En ĉiu dLight-sesio, dopamino montris pli fortan korelacion kun valoroj ol aŭ RPEs aŭ rekompenco-indico (Fig. 3h, Plilongigitaj Datumoj Fig. 6). Korelacioj kun ambaŭ ŝtataj valoroj kaj RPE estis maksimumaj rilate al la dLight-signalo ~ 0.3 s poste, kongruaj kun mallonga malfruo kaŭzita de neŭrala prilaborado de signaloj kaj sensilo-respondo-tempo (Fig. 3g; kun voltametrio, ni raportis malfruon de 0.4-0.5 s)5.

Dopamina pafo ne klarigas liberigon

Ni poste komparis dopaminan ĉelan pafon kaj liberigon ĉirkaŭ bandit-taskaj eventoj. Eksteraj stimuloj ĉe Light-on, Go cue kaj rekompencitaj Side-in (manĝaĵa klako) ĉiu elvokis rapidan pafon kreskantan (Fig. 4a). Ĉi tiuj respondoj estis observitaj en la granda plimulto de dopaminaj ĉeloj (Fig. 4c), kvankam la relativa grando de respondoj al malsamaj indikoj variis de ĉelo al ĉelo (Suplementa Fig. 1). La NAc dLight-signalo ankaŭ respondis rapide kaj fidinde al ĉiu el ĉi tiuj elstaraj indikoj. 4b, ĉ), konforme al kreva pafado de dopaminaj ĉeloj veturantan dopamin-liberigon.

Fig. 4: Fazika VTA-dopamina pafo ne enkalkulas NAc-dopaminan dinamikon.
figuro4

a, Event-vicigita agado de VTA-l dopaminaj ĉeloj. Supre, spiku rastilojn por unu reprezenta ĉelo; fundo, meza spico-indico (n = 29). En ĉiuj paneloj, eraraj bandoj indikas ± sem b, Event-vicigitaj NAc dLight. Pinta, reprezenta kunsido; fundo, mezumo (n = 10), normaligita al pinto rekompencita Flanka respondo. Laŭlonge de ĉi tiu figuro, dLight-signaloj montriĝas relative al 2-s "bazlinia" epoko finiĝanta 1 s antaŭ Centro-en. Notu pliiĝojn (sagoj) iom antaŭ Centro-eniro kaj Manĝaĵo-eniro. c, Akumulaj distribuoj de tempo prenitaj por dopaminaj ĉeloj (solida; n = 29), dLight (streketita; n = 10), por pliigi jenajn signalajn komencojn (miksa testo kompare kun baza linio, 10,000 XNUMX miksaĵoj, P <0.01, multaj komparoj korektis). Por Light-on, nur latentecoj <1 s inkluzivitaj; por Side-in nur rekompencitaj provoj. Meza latenteco (de sigmoida konvulsio): Malpeza, pafanta 152 ms, dLight 266 ms; Iru signalvorto, pafante 67 ms, dLight 212 ms; Flanko, pafado 85 m, lumo 129 m. Ne-dopaminaj ĉeloj estis kutime indiferentaj al signalaj komencoj (Plilongigita Datuma Fig. 8). d, Distinta malkaŝe elvokita, alproksimiĝ-rilata dopamina liberigo. Pinta, meza dopamina ĉela pafo (n = 29); meza, averaĝa dLumo (n = 10); fundo, voltametrio (n = 6), normaligita al pinta mallong-latenta Luma respondo. Maldekstraj paneloj, latentecoj <1 s, dekstre, latentecoj> 2 s. Datumoj estas vicigitaj sur Lum-sur (solida) aŭ Centra-en (punktita); ruĝa streketita linio, meza latenteco. Por pli longaj latentecoj ekzistas neniu pliiĝo en pafado proksime de Centro-en, sed dLumo kaj voltametrio montras konsiderindan pliiĝon. e, Scatter-intrigo komparanta pintajn signalojn vicigitajn sur Lumo-on (y akso) aŭ Centro-en (x akso). Por ĉiu ĉelo, sesiaj konektitaj linioj indikas datumojn por distingaj latentaj gamoj (<1 s,> 2 s). Dopamina-pafado (supre) konstante montras Luman respondon por provoj de mallongaj latentecoj (dudirekta analizo de varianco (ANOVA), vicigo × latenta interago, F = 7.47, P = 0.0008). signaloj dLight (meze), voltametria (malsupre) estas pli bone vicigitaj al Centro-en (dudirekta ANOVA por dLight: vicigo × latenta interago, F = 9.28, P = 0.0043). f, Dopamina pliiĝas dum alproksimiĝo, kvantigita kiel rampa angulo (vidu metodoj). Cirkloj indikas individuajn dopaminajn ĉelojn (n = 29), dLight-sesioj (n = 10).

Ni ankaŭ vidis klarajn pliiĝojn en la liberigo de dopamina NAc dum ratoj alproksimiĝis al la komenca haveno (ĵus antaŭ Centro-en) kaj la manĝaĵa haveno (antaŭ la manĝo-eniro). Ĉi tio kongruas kun la vasta volatmetria literaturo, montrante, ke motivaj alproksimiĝaj kondutoj estas akompanataj de rapidaj pliigoj en NAc-kerna dopamina5,7,8,9,10,11. Tamen, la VTA-l dopamina ĉela populacio ne montris respondan kreskon de pafo tiutempe (Fig. 4a; vidu Plilongigitaj Datumoj Fig. 7 por pliaj komparoj, inkluzive de ne-dopaminaj ĉeloj).

Por pli bone disigi dopaminan agadon elvokitan de alvokoj kaj rilate al aliro, ni disigis provojn per mallongaj (<1 s) kaj longaj (> 2 s) latentecoj (Fig. 4d, e). Pliigoj en la dopamina ĉela pafo estis konstante ŝlositaj al la ekesto ĉe Light-on, prefere por mallongaj latencaj provoj. Ĉiuj 25-dopaminaj ĉeloj kun signifa pafo-kresko post Lumigado estis pli bone vicigitaj al Light-on ol Centra-en (Fig. 4e). Kontraste, kreskoj de dopamina liberigo de NAc antaŭ Centreja-en estis diferencaj de liberigita de dopamina liberigo de cue (Fig. 4d, e). dLight-signaloj konsekvence pliiĝis antaŭ Centra en provoj pri long-latencia (dek el dek sesoj) kaj antaŭ manĝaĵ-enirhaŭta (naŭ el dek sesoj), sen respondaj pliigoj en pafaĵo de dopamino (Fig. 4f).

Fine ni pripensis kiel signoj pri dopamino pri eventoj dependas de freŝa historio de rekompenco. Dum la frua parto de ĉiu proceso, dopamina ĉela pafo ne dependis de rekompenca indico (Fig. 5a), malgraŭ la influo de rekompenca imposto sur instigo (Fig. 5b). Poste, la faza respondo al la rekompenca signalvorto ĉe Side-in estis fidinde pli forta kiam la rekompenca imposto estis pli malalta (Fig. 5a), konforme al pozitiva RPE-kodado. Kiam ĉi tiu rekompenco estis preterlasita, dopaminaj ĉeloj paŭzis pafon, kvankam kodado de negativaj RPE estis multe pli malforta aŭ forestanta, ĉu ekzamenite ĉe la nivelo de la loĝantaro (Fig. 5a, b) aŭ kiel individuaj ĉeloj (Plilongigita Datuma Fig. 8). Antaŭe oni proponis, ke negativaj RPEoj estas koditaj dum la daŭro de dopaminaj paŭzoj31, sed tio estis observita en nur 2 el 29 individuaj neŭronoj. Similaj rezultoj estis akiritaj se rekompenca atendo estis taksita alimaniere, inkluzive de prov-bazitaj plifortigaj lernaj modeloj (aktoro-kritikisto kaj Q-lernado) aŭ simple kalkulante freŝajn rekompencojn (Etendita Fig. 8).

Fig. 5: Rekompenca historio influas VTA-dopamin-ĉelan pafon kaj NAc-dopamin-liberigon malsame.
figuro5

a, Supraj, averaĝaj pafaj rapidecoj de dopaminaj ĉeloj (n = 29) vicigita al Flanka eniro, malkonstruita laŭ rekompenco (terciloj, kalkulitaj aparte por ĉiu ĉelo). Antaŭ Side-in, agado ne dependas de rekompenca atendo. Post flankaj rekompencitaj (ruĝaj) kaj senpremiaj (bluaj) provoj montriĝas aparte. Manĝa-klaka respondo estas pli forta kiam rekompenco estas malalta, kongrua kun kodado de pozitivaj RPEoj. Malsupre, frakcio de individuaj dopaminaj ĉeloj kun pafrapideco, kiu signife varias laŭ rekompenca rapideco en ĉiu momento (miksa testo, P <0.01, multaj komparoj korektis). Tiktakoj supre indikas tempojn, kiam ĉi tiu frakcio estis signife pli alta ol hazardo (binomo, P <0.01). Post Side-in, nur negativaj korelacioj estas provitaj - tio estas ebla kodigo de RPE. b, Regresaj intrigoj por sesioj kun registritaj dopaminaj ĉeloj, montrante la efikon de freŝa rekompenca historio sur (log-) latencia (supro) kaj dopamina spikado. Asteriskoj indikas gravajn regresajn pezojn (t-estest, P <0.05). Dum la 0.5-s antaŭ Go-signalvorto (dum rato devas teni konstantan nazon por provi daŭrigi) dopamina pikado ne influas rekompencan historion (meze). Ĉi tio ŝanĝiĝas post kiam la rezulto malkaŝiĝas (malsupre; taksante pinton aŭ trogon de agado en la 0.5-s post Side-in), sed nur por rekompencitaj provoj. c, d, Same kiel supre, krom dLight (normaligita al maksimuma Flanka-respondo). Dopamina liberigo fidinde skalas kun rekompenca indico eĉ antaŭ Flank-eniro.

Dopamina liberigo ĉe Flanko ankaŭ montris klaran, transigan kodigon de pozitivaj RPEs, sed ne de negativaj RPEs (Fig. 5c, d). Ĉi tiu dLight-respondo estis iomete prokrastita kaj plilongigita kompare al pafo, konforme al tempo prenita por liberigo kaj reakiro32, sed restis subsekunda fenomeno. Kontraste al pafo, tamen lumaj signaloj frue en ĉiu provo estis pli grandaj kiam lastatempaj provoj estis rekompencitaj (Fig. 5c), kongrua kun valora kodado. Ni observis ĉi tiun dependecon de rekompenca historio eĉ kiam la rato ne aktive moviĝis, sed tenis nazpikon en la centra haveno atendante la Go-signalon (Fig. 5d). Entute, ni konkludas, ke NAc-dopamina liberigo reflektas ambaŭ kverel-elvokitajn respondojn kaj rekompencan atendon, kaj ke nur la unua povas bone kalkuli per VTA-l dopamina ĉela pafo.

diskuto

VTA-l provizas la superregantan fonton de dopamino al la NAc-kerno6,23,24. VTA-l dopaminaj ĉeloj, inkluzive de tiuj, kiuj projektas al la NAc-kerno, konstante montras RPE-kodajn krevojn3,12. VTA-krevigoj estas opiniitaj precipe gravaj por veturado de NAc-dopamino32, kaj efektive ni trovis, ke rivelitaj VTA-eksplodoj estis kongruitaj per liberigo de NAc. Tamen, ni aldone trovis valor-rilatajn padronojn de NAc-dopamina liberigo, kiuj ne estis generitaj per pafo de VTA-l dopaminaj ĉeloj, ĉu sur longaj (tonikaj) aŭ mallongaj (fazaj) periodoj. Aliaj dopaminaj subpopulacioj povas porti distingajn signalojn13,33,34, kaj ni ne povas ekskludi la eblon, ke pafado de dopaminaj ĉelaj subpopulacioj ne registritaj de ĉi tie produktas valor-rilatan dopaminon en NAc-kerno. Tamen, valor-rilata pafado neniam estis raportita por iuj dopaminaj ĉeloj, tra vasta gamo de studoj. Niaj rezultoj sugestas, ke NAc-dopamina dinamiko estas kontrolita de malsamaj manieroj, en malsamaj tempoj kaj por malsamaj funkcioj, kaj ke registri dopaminajn ĉelojn gravas sed ne sufiĉas por kompreni dopaminajn signalojn.35.

Liberigo de dopaminaj fina stacioj estas potenca influo de lokaj, ne-spikantaj mekanismoj36,37,38,39,40. Ekzemple, liberigo de dopamina NAc estas modulita de la bazolateral amigdala eĉ kiam VTA-spikado estas farmacologie subpremita41,42. Oni konstatis dum jardekoj, ke loka kontrolo de liberigo de dopamino eble atingas funkciojn diferencajn de tiuj de dopamina ĉela spikado36,43, sed ĉi tio ne estis korpigita al teoriaj vidpunktoj de dopamino. Distingitaj stri-subregionoj kontribuas al malsamaj specoj de decidoj, kaj povas influi sian propran dopamin-liberigon laŭ bezono44. Oni devas determini kiom loka ĉi tiu kontrolo de liberigo de dopamino povas esti. Unu limo dividita de la 3 manieroj, kiel ni mezuris liberigon de dopamino, estas, ke ili ĉiuj provas je spaca skalo almenaŭ 100 µm, dum en vivo mikroskopio sugestas, ke liberigo de dopamino povas esti heterogena ĉe sufiĉe malpli grandaj skaloj15.

Niaj rezultoj ne subtenas la ekziston de ia aparta tona dopamina signalo, kiu povus mediacii motivajn efikojn de dopamino. Anstataŭe, dopaminaj movoj kiuj aperas malrapidaj se mezuritaj malrapide (kun mikrodijalizo) solviĝas en rapidajn fluktuojn se mezurite rapide (kun voltammetrio aŭ dLight). Plue, registradoj de identigitaj VTA-dopaminaj ĉeloj fare de ni mem kaj aliaj30 havigu fortajn pruvojn kontraŭ la ideo29 ke ŝanĝoj en la tona dopamina ĉela pafo kaŭzas tonikajn ŝanĝojn en dopamina liberigo. Kvankam tonika pafo povas esti ŝanĝita per lezoj aŭ drogaj manipuladoj28, ni ne konscias pri daŭraj ŝanĝoj en pafrapideco en iu ajn kondutisma tasko. Pafado povas rampi malsupren laŭ temposkalo de ĉirkaŭ 1 s dum antaŭĝojo de motivaj signifaj eventoj45,46. Tamen, ĉi tiu malkresko estas la malo de tio, kio estus bezonata por akceli dopamin-liberigon kun rekompenca atendo, kaj anstataŭe pli similas al vico de transiraj negativaj prognozaj eraroj47. Kvankam daŭraj signaloj kodantaj daŭran rekompencon povus esti komputile utilaj30, dopamino anstataŭe liveras rapide fluktuajn erarajn kaj valor-signalojn. Restas eble, ke daŭraj signaloj estas kalkulitaj je posta paŝo per intracelaj signalaj vojoj sube de dopaminaj riceviloj.

Multaj grupoj observis rampan liberigan dopaminon dum ratoj alproksimiĝas al la rekompenco5,7,8,9,10,11konforma al kodigado de pliigaj rekompencaj atendoj. Iuj argumentis, ke ĉi tiuj dopaminaj rampoj simple reflektas RPE-on, supozante, ke ratoj ĉu rapide forgesas valorojn48 aŭ ke ili havas moligitan aron de ŝtataj reprezentadoj49. Ĉi tiu lasta ideo ne estas subtenata de nia observado, ke rampado estas rapide modulita de provo al proceso sur la bazo de ĝisdatigitaj rekompencaj atendoj, fariĝante pli forta ene de mallonga sinsekvo de pluaj rekompencoj dum RPE-similaj respondoj al malplifortigoj (Fig. 3e). Pli ĝenerale, iu teorio en kiu dopamino nur transdonas RPE-n (lernaj signaloj) ne povas kalkuli la tre bone establitan rilaton inter daŭra mezolimbia dopamino kaj instigo16. La NAc-kerno ne bezonas por tre trejnitaj respondoj al kondiĉitaj stimuloj, sed ĝi aparte gravas kiam oni decidas plenumi multe da tempo por akiri rekompencojn.50. NAc-kerna dopamino ŝajnas provizi esencan dinamikan signalon pri kiom indas ascii tempo kaj penado por labori5,44, kvankam ĉi tiu signalo ne ĉeestas en VTA dopamina ĉela pafo.

metodoj

bestoj

Ĉiuj bestaj proceduroj estis aprobitaj de la Instituciaj Komitatoj pri Uzo kaj Prizorgo de Bestoj de la Universitato de Miĉigano aŭ Universitato de Kalifornio San Francisco. Masklaj ratoj (300-500 g, ĉu sovaĝ-specaj Long-Evans aŭ TH-Cre+ kun fono de Long-Evans52) estis konservitaj per reverso 12: 12 lumo: malhela ciklo kaj testita dum la malhela fazo. Ratoj estis senmanke senigitaj de manĝaĵoj, ricevante 15 g da norma laboratorio rato ĉiutage aldone al manĝaĵaj rekompencoj gajnitaj dum taska agado. Neniu specimeno de antaŭkalkulado estis farita. La enketistoj ne estis blindigitaj al atribuo dum eksperimentoj kaj rezulta takso.


Konduto

Antaŭtrejnado kaj testado estis faritaj en komputil-kontrolitaj Med Associates-kameroj (25 cm × 30 cm ĉe plej vasta punkto) ĉiu kun kvin-trua nazpikita muro, kiel antaŭe priskribite5. Bandit-tasaj sesioj uzis la sekvajn parametrojn: longaj blokoj estis 35-45-provoj, hazarde elektitaj por ĉiu bloko; teni periodon antaŭ Go Cue estis 500 – 1,500 ms (uniforma distribuo); maldekstre-dekstra rekompenco probabloj estis 10, 50 kaj 90% (por elektrofisiologio, fotometrio, voltammetrio kaj antaŭe raportitaj mikrodijalaj ratoj5) aŭ 20, 50 kaj 80% (nove raportitaj mikrodializaj ratoj).

Nuna rekompenco-takso estis taksita uzante temp-bazitan liki-integrilon53. Rekompenca imposto pliigis ĉiun fojon kiam rekompenco estis ricevita, kaj kadukiĝis eksponente laŭ imposto fiksita per parametro τ (la tempo en s por la rekompenca rapideco malpliiĝi je ~ 63%, tio estas 1 − 1 / e). Por ĉiuj analizoj, τ estis elektita surbaze de la konduto de la rato, maksimumigante la (negativan) korelacion inter rekompenca indico kaj logilo (latencia) en ĉiu kunsido. La korelacioj inter prebena dopamino kaj rekompenca indico ne estis tre sentemaj al ĉi tiu elekto τ (Plilongigitaj Datumoj Fig. 1).

Por klasifiki blokajn transirojn kiel 'kreskantajn' aŭ 'malpliiĝantajn' en rekompenco, ni komparis la averaĝan likan-integran rekompencan indicon en la lasta 5-min de bloko al la meza rekompenca indico en la unua 8-min de la sekva bloko.

Ratoj uzataj por elektrofiziologio kaj fotometrio ankaŭ plenumis pavlovian aliran taskon, en la sama operanta ĉambro kun la lumlumo dum la tuta kunsido. Tri aŭdaj signalvortoj (2 kHz, 5 kHz kaj 9 kHz) estis asociitaj kun malsamaj probabloj de manĝaĵa liverado (kontraŭpezita tra ratoj). Indikoj estis ludataj kiel trajno de tonaj kernoj (100 ms ŝaltitaj, 50 ms for) por tuta daŭro de 2.6 s sekvita de malfrua periodo de 500 ms. Indikoj kaj neantaŭviditaj rekompencaj transdonoj estis liveritaj laŭ pseŭda hazarda ordo kun varia inter-intertempa intervalo (15-30 s, unueca distribuo).


Mikrodisizo

kirurgio

Ratoj estis enplantitaj bilateralmente kun gvidaj kanulaoj (CMA, 830 9024) en kortekso kaj striato. Unu grupon = 8) ricevis unu gvidan kanulon celantan prelimbian kaj infralimban kortekson (anteroposterior (AP) +3.2 mm, mediolateral (ML) 0.6 mm rilate al bregma; kaj dorsoventral (DV) 1.4 mm sub cerba surfaco) kaj alia celanta dorsomedian striaton kaj kernon accumbens en la kontraŭa hemisfero (AP +1.3, ML 1.9 kaj DV 3.4). Ambaŭ enplantaĵoj estis angulaj 5 gradojn unu de la alia laŭ la rostral-kaŭdala ebeno. Dua grupo (n = 4) ricevis unu gvidan kanulon celantan antaŭan cingulan kortekson (AP +1.6, ML 0.8 kaj DV 0.8) kaj alian celantan accumbens (kerno / ŝelo en la kontraŭa hemisfero ĉe AP +1.6, ML 1.4 kaj DV 5.5 (n = 2) aŭ AP +1.6, ML 1.9 kaj DV 5.7 (n = 2). Enplantaĵoflankoj estis kontraŭpezitaj trans ratoj. Bestoj rajtis resaniĝi dum unu semajno antaŭ reedukado.

kemiaĵoj

Akvo, metanolo kaj acetonitrilo por moveblaj fazoj estis Burdick & Jackson HPLC-grado, aĉetita de VWR (Radnor). Ĉiuj aliaj kemiaĵoj estis aĉetitaj de Sigma Aldrich krom se oni indikas alie. Artefarita cerbo-spina likvaĵo (aCSF) konsistis el 145 mM NaCl, 2.68 mM KCl, 1.40 mM CaCl2, 1.01 mM MgSO4, 1.55 mM Na2HPO4 kaj 0.45 mM NaH2PO4, ĝustigis pH al 7.4 kun NaOH. Ascorbika acido (250 nM-fina koncentriĝo) estis aldonita por redukti oksidadon de analitoj.

Kolekto de specimenoj kaj HPLC-MS

En testo tago, bestoj estis metitaj en la ĉambron kun la hejtilo enŝaltita. Laŭmendaj koncentraj poliacrilonitrilaj membranaj sondaj mikrodiálisioj (1-mm dialysing AN69-membrano; Hospal) estis enmetitaj bilateralmente en gvidan kanelon kaj perfuzigitaj kontinue (Chemyx, Fusion 400) kun aCSF ĉe 2 µl / min por 90 min por permesi ekvilibron. Post 5-min-baskolektado, la hejtilo estingiĝis, kuregante la beston al bandit-taska havebleco. Kolektado de specimenoj daŭris je intervaloj de 1-min kaj specimenoj estis tuj derivatigitaj54 kun 1.5 µl natria karbonato, 100 mM; 1.5 µl benzoilklorido (2% (v / v) benzoilklorido en acetonitrilo); kaj 1.5 µl izotope etikedita interna norma miksaĵo diluita en 50% (v / v) acetonitrilo enhavanta 1% (v / v) sulfatan acidon, kaj pikita per deŭterita ACh kaj kolino (C / D / N-izotopoj) ĝis fina koncentriĝo de 20 nM. Ekzempla seriokolekto alternis inter la du enketoj je 30-s intervaloj en ĉiu el 26 sesioj, krom unu sesio en kiu rompita membrano rezultigis nur unu serion (51 ekzemplaj serioj entute). Specimenoj estis analizitaj per sistemoj Thermo Scientific UHPLC (Accela, aŭ Vanquish Horizon interfacigita al kvantuma Ultra-triobla kvadrupola mas-spektrometro ekipita per sondilo HESI II ESI), funkcianta en multnombra reaga kontrolado. Kvin-mikrolitraj specimenoj estis injektitaj sur Phenomenex-kern-ŝela bifenila Kinetex HPLC-kolono (2.1 mm × 100 mm). Movebla fazo A estis 10 mM-amonia formiato kun 0.15% formika acido, kaj movebla fazo B estis acetonitrilo. La movebla fazo ricevis eluzan gradienton je 450 µl / min jene: komenca, 0% B; 0.01 min, 19% B; 1 min, 26% B; 1.5 min, 75% B; 2.5 min, 100% B; 3 min, 100% B; 3.1 min, 5% B; kaj 3.5 min, 5% B. Thermo Xcalibur QuanBrowser (Thermo Fisher Scientific) estis uzata por aŭtomate prilabori kaj integri pintojn. Ĉiu el la> 100,000 pintoj estis vide inspektita individue por certigi taŭgan integriĝon.

analizo

Ĉiuj datumoj de neŭkemiaj koncentriĝoj estis mildigitaj kun tri-mova mezumo (y′ = [0.25 × (y−1) + 0.5y + 0.25 × (y+ 1)]) kaj z-poentaro normaligita ene de ĉiu sesio por faciligi inter-sesiajn komparojn. Por ĉiu cela regiono, kruc-korelogramo estis generita por ĉiu sesio kaj la mezumo de la kunsidoj estis grafika. Unu-procentaj konfidaj limoj estis generitaj por ĉiu partintrigo per intermiksado de unu tempo-serio 100,000 fojojn kaj generado de distribuo de korelaciaj koeficientoj por ĉiu kunsido. Multoblaj regresaj modeloj estis generitaj uzante la regresan funkcion en MATLAB, kun la neŭrokemia kiel rezulta variablo kaj kondutaj metrikoj kiel antaŭdiroj. Regresaj koeficientoj estis difinitaj signifaj je tri alfa-niveloj (0.05, 0.0005 kaj 0.000005), post Bonferroni-korekto por multnombraj komparoj (alfa / (21 kemiaĵoj × 7 regionoj × 9 kondutaj regresiloj)). Por analizo de blokaj transiroj datumoj estis enigitaj en 3-min-epokojn, forĵetante la specimenon, kiu inkluzivis la transiran tempon.


Elektrofisiologio

Ratoj (n = 25) estis enplantitaj per laŭmende projektitaj vetureblaj optrodoj, ĉiu konsistanta el 16 tetrodoj (konstruitaj el 12.5 µm-nikromata drato, Sandvik) gluitaj sur la flanko de 200-µm-optika fibro kaj etendiĝantaj ĝis 500 µm sub la fibra pinto. Dum la sama operacio, ni injektis 1 µl AAV2 / 5-EF1a-DIO-ChR2 (H134R) -EYFP en la flankan VTA (AP 5.6, ML 0.8, DV 7.5) aŭ NAc-kernon (AP 1.6, ML 1.6, DV 6.4) . Larĝbendaj (1-9,000 Hz) cerbaj signaloj estis provitaj (30,000 specimenoj po) uzante ciferecajn kapscenejojn de Intan. Optrodes estis mallevita almenaŭ 80 µm fine de ĉiu registradsesio. Individuaj unuoj estis izolitaj eksterrete uzante MATLAB-efektivigon de MountainSort55 sekvata de zorga mana inspektado.

Klasifikado

Por identigi ĉu izolita VTA-l-unuo estis dopaminergika (TH+), ni uzis la teston de latenta asocio de stimulo56. Mallonge, ĉe la fino de ĉiu eksperimenta kunsido, ni konektis la optrodon al lasera diodo kaj liveris trajn pulsojn de diversaj larĝoj kaj frekvencoj. Por ke unuo estu identigita kiel malpeza respondeco, ĝi bezonis atingi la signifan nivelon de P <0.001 por 5-ms kaj 10-ms-pulsaj trajnoj. Ni ankaŭ komparis la lumajn elvokitajn ondformojn (ene de 10 m de lasera pulsa komenco) al sesiaj larĝaj mezumoj; ĉiuj lum-elvokitaj unuoj havis korelacian koeficienton de Pearson> 0.9. Dopaminaj neŭronoj estis sukcese registritaj de kvar ratoj kun VTA-l AAV-infuzaĵoj (IM657, 1 ekzemplero; IM1002, 3 ekzempleroj; IM1003, 15 ekzempleroj; IM1037, 9 ekzempleroj) kaj unu rato kun NAc-kerno AAV (IM-1078, 2 ekzempleroj) . Pinta larĝo estis difinita kiel la plen-larĝa-je-duono-maksimumo de la plej elstara negativa ero de la vicigita, averaĝita spika ondformo. Ne-etikeditaj VTA-neŭronoj kun sesia larĝa pafrapideco> 20 Hz kaj pinta larĝo <200 µs estis klasifikitaj kiel ne-dopaminaj ĉeloj. Por certigi, ke ni komparas dopaminajn kaj ne-dopaminajn ĉelojn ene de la samaj subregionoj, ni nur analizis ne-dopaminajn ĉelojn registritajn dum kunsidoj kun almenaŭ unu optike markita dopamina ĉelo.

analizo

Spicaj krevoj estis detektitaj per la konvencia "80 / 160-ŝablono" alproksimiĝo57: ĉiufoje inter-pik-intervalo de 80 ms aŭ malpli okazas, ĉi tiuj kaj postaj pikiloj estas konsiderataj parto de eksplodo ĝis estas intervalo de 160 ms aŭ pli. Por komparo de "tonika" pafado por rekompenci imposton, dopaminaj pikiloj estis kalkulitaj en 1-minaj rubujoj. Por ekzameni pli rapidajn ŝanĝojn, spikaj densecaj funkcioj estis konstruitaj per konvertado de spikaj trajnoj kun gaŭsa kerno kun varianco 20 ms. Por determini kiom rapide neŭrono reagis al donita signalvorto, ni uzis 40-ms-rubujojn (glitante laŭ paŝoj de 20 ms) kaj uzis miksan teston (10,000 250-miksojn) por ĉiu tempa rubujo komparante la pafrapidecon post la signalvorto kun la pafrapideco en la XNUMX m tuj antaŭ la signalvorto. La unua rubujo, ĉe kiu la post-indika pafrapideco estis signife (P <0.01, korektante multoblajn komparojn) pli granda ol bazlinia pafado estis konsiderata la tempo por indiki respondon.

Pinta pafo-indico estis kalkulita kiel la maksimuma (gaŭsa-mildigita) pafo-procento de ĉiu provo en 250-ms-fenestro post flank-en por rekompensitaj provoj, kaj la valo estis kalkulita kiel la minimuma pafo-procento en 2-s-fenestro, komencante. unu sekundon post flankelemento por nerekomenditaj provoj.

Por kalkuli rampan angulon dum proksimaj kondutoj, ni mildigis meznombran pafadon kun 50-ms Gaŭsa kerno, detektis la maksimumon / minimuman de la rezulta signalo en 0.5-s-fenestro antaŭ ĉiu evento (centro-en aŭ manĝaĵo-haveno-en) ) kaj mezuris la subskribitan angulon ligantan la du ekstremojn. Por kompari pafon-taksojn en rekompenco 'alta' kaj 'malalta', por ĉiu sesio ni plenumis median disigon de mezumo de lika-integra rekompenca imposto en ĉiu bloko.


Voltammetrio kaj komputila modelo

Rapidaj skanaj ciklaj voltmetimetraj rezultoj montritaj ĉi tie reanalizas datumojn antaŭe prezentitajn en detaloj5. Ene-provaj taksoj de ŝtata valoro kaj rekompenco-prognozaj eraroj estis kalkulitaj uzante semi-Markov-decidprocesan plifortigan lernmodelon, ekzakte kiel antaŭe5.


Fotometrio

Ni uzis viralan aliron por esprimi la genetike koditan optikan dopamin-sensilon DLight15. Sub izofluranan anestezo, 1 μl de AAV9-CAG-dLight (1 × 1012 virusgenaroj po ml; UC Davis-vektoro) estis malrapide (100 nl / min) injektita (Nanoject III, Drummond) tra 30-µm-vitra mikropipeto en ventra striato duflanke (AP: 1.7 mm, ML: 1.7 mm, DV: −7.0 mm). Dum la sama kirurgio optikaj fibroj (400-µm-kerno, 430-µ totala diametro) ligitaj al metala ferolo (dorika) estis enmetitaj (celprofundo 200 µm pli alta ol AAV) kaj cementitaj modloko. Datumoj estis kolektitaj> tri semajnojn poste, por permesi dLight-esprimon.

Por dLight-ekscito blua (470 nm) kaj viola (405 nm; kontrolo) LED-oj estis sinusoidale modulitaj ĉe apartaj frekvencoj (211 Hz kaj 531 Hz, respektive58). Kaj ekscitaj kaj emisiaj signaloj pasis tra minikubaj filtriloj (dorikaj) kaj dika fluoreskeco estis mezurita per femtovata detektilo (Newport, modelo 2151) specimenanta ĉe 10 kHz. Demodulacio produktis apartajn signalojn de 470 nm (dopamino) kaj 405 nm (kontrolo), kiuj tiam estis ree skalitaj unu al la alia per malplej kvadrata konvulsio.58. Frakcia fluoreska signalo (dF/F) tiam estis difinita kiel (470–405_fit) / 405_fit. Por ĉiuj analizoj ĉi tiu signalo estis malpli specimenigita al 50 Hz kaj glatigita per kvin-punkta meza filtrilo. Por prezento de 470 nm kaj 405 nm-signaloj aparte, vidu Plilongigita Datuma Fig. 7.

Datumoj de optika fibro-lokigo estis inkluzivitaj en analizoj se la fibra pinto estis en NAc, kaj la fluoreska respondo al almenaŭ unu taska signo havis z-poentaro de> 1. Ĉi tiuj kriterioj ekskludis unu raton, kaj donis tri ratojn / kvar lokojn (IM1065-maldekstra, IM1066-duflanka, IM1089-dekstra) por dLight1.1, kaj kvar ratojn / ses lokojn (IM1088-duflanka, IM1105-dekstra, IM1106-duflanka, IM1107-dekstra) por dLight1.3b. Similaj rezultoj estis akiritaj por dLight1.1 kaj dLight1.3 (Plilongigita Datuma Fig. 7), do datumoj estis kombinitaj.

Por kalkuli rampan angulon dum proksimaj kondutoj, ni detektis la maksimumon / minimuman de la rezulta signalo en 0.5-s-fenestro antaŭ ĉiu evento (centro-en aŭ manĝ-enireja) kaj mezuris la subskribitan angulon ligantan la du ekstremojn.


Afineco kaj molekula specifeco de dLight1.3b

In vitro-mezuradoj estis faritaj kiel antaŭe priskribitaj15. Mallonge, HEK293T (ATCC CRL # 1573) ĉeloj estis kulturataj kaj transfektitaj kun plasmidoj kodigantaj dlight1.3b pelitan de CMV-iniciatinto, kaj lavitaj per HBSS (Vivaj Teknologioj) suplementitaj kun Ca2+ (4mM) kaj Mg2+ (2 mM) antaŭ bildigo. Bildigo estis farita uzante 40 × oleobazitan celon sur renversita Zeiss Observer LSN710-konfokusa mikroskopo kun 488 nm / 513 nm (ekscito / emisio) ondolongoj. Por provi la fluoreskajn respondojn de la sensilo, neŭrotransmitoroj estis rekte aplikitaj al la bano dum tempopasa bildigo, en almenaŭ du sendependaj eksperimentoj. Titraĵoj de dopamino kaj noradrenalino estis akiritaj per dekoblaj seriaj diluoj por atingi ok malsamajn koncentriĝojn. Ĉiuj aliaj neŭrotransmitoroj estis provitaj ĉe tri sinsekvaj koncentriĝoj (100 nM, 1 µM kaj 10 µM). Ĉiuj neurotransmisaj koncentriĝoj estis akiritaj per diluo de 1 mM-akcia koncentriĝo en HBSS, preparita freŝa. Krudaj fluoreskecaj intensecoj de tempopasa bildigo estis kvantigitaj sur Fiĝioj; ĉiu ROI estis mane tirita sur la membrano de unuopaj ĉeloj. Fluoreska faldŝanĝo (ΔF/F) estis kalkulita kiel F pinto (averaĝa fluoreska intenseco de kvar kadroj) - F basal (averaĝe fluoreska intenseco de kvar kadroj antaŭ aldono de ligandoj) /F baza. Grafikoj kaj statistika analizo estis faritaj uzante GraphPad Prism 6. Datumpunktoj estis analizitaj kun unu-specifa specifa liganta kurbo taŭga por akiri Kd valoroj. En skatoloj kaj fajfilo-intrigoj, la skatolo kovras la 25% al 75% -intervalon kaj flustroj etendas de minimumo al maksimumo.


Raporta resumo

Pliaj informoj pri esplora desegno haveblas en la Resumo pri Natura Esploro ligita al ĉi tiu papero.

Disponeblo de datumoj

La AAV.Synapsin.dLight1.3b-viruso uzita en ĉi tiu studo estis deponita ĉe Addgene (ne. 125560; http://www.addgene.org). Ĉiuj datumoj estos haveblaj per la retejo pri kundividado de datumoj pri Kunlabora Esplorado pri Komputaj Neŭrosciencoj (https://doi.org/110.6080/K0VQ30V9).

Kodo havebleco

Propra MATLAB-kodo haveblas laŭ peto de JDB

Kromaj Informoj

Noto de eldonisto: Springer Nature restas neŭtrala rilate al jurisdikciaj asertoj en publikaj mapoj kaj instituciaj afiliaĵoj.

Referencoj

  1. 1.

    Schultz, W., Dayan, P. & Montague, PR Neŭrala substrato de antaŭdiro kaj rekompenco. scienco 275, 1593-1599 (1997).

  2. 2.

    Pan, WX, Schmidt, R., Wickens, JR & Hyland, BI Dopamine-ĉeloj respondas al antaŭviditaj eventoj dum klasika kondiĉado: evidenteco pri kvalifikaj spuroj en la rekompenca lernado. J. Neurosci. 25, 6235-6242 (2005).

  3. 3.

    Cohen, JY, Haesler, S., Vong, L., Lowell, BB & Uchida, N. Neŭro-specaj signaloj por rekompenco kaj puno en la ventrala tegmenta areo. naturo 482, 85-88 (2012).

  4. 4.

    Steinberg, EE et al. Kaŭza ligo inter prognozaj eraroj, dopaminaj neŭronoj kaj lernado. Nat. Neurosci. 16, 966-973 (2013).

  5. 5.

    Hamid, AA et al. Mezolimbika dopamino signalas la valoron de laboro. Nat. Neurosci. 19, 117-126 (2016).

  6. 6.

    Saunders, BT, Richard, JM, Margolis, EB & Janak, PH-dopaminaj neŭronoj kreas pavlovajn kondiĉitajn stimulojn kun cirkvit-difinitaj motivaj ecoj. Nat. Neurosci. 21, 1072-1083 (2018).

  7. 7.

    Phillips, PE, Stuber, GD, Heien, ML, Wightman, RM & Carelli, RM Subsecond dopamina liberigo antaŭenigas kokainan serĉadon. naturo 422, 614-618 (2003).

  8. 8.

    Roitman, MF, Stuber, GD, Phillips, PE, Wightman, RM & Carelli, RM Dopamine funkcias kiel subsekunda modulatoro de manĝa serĉado. J. Neurosci. 24, 1265-1271 (2004).

  9. 9.

    Wassum, KM, Ostlund, SB & Maidment, NT Faza mesolimbia dopamina signalado antaŭas kaj antaŭdiras plenumon de meminiciata agosekvenca tasko. Biol. Psikiatrio 71, 846-854 (2012).

  10. 10.

    Howe, MW, Tierney, PL, Sandberg, SG, Phillips, PE & Graybiel, AM Longedaŭra dopamino signalanta en striato signalas proksimecon kaj valoron de malproksimaj kompensoj. naturo 500, 575-579 (2013).

  11. 11.

    Syed, EC et al. Ago-iniciato formas mezolimban dopaminan kodigon de estontaj rekompencoj. Nat. Neurosci. 19, 34-36 (2016).

  12. 12.

    Morris, G., Nevet, A., Arkadir, D., Vaadia, E. & Bergman, H. Mezcerbaj dopaminaj neŭronoj kodas decidojn por estonta ago. Nat. Neurosci. 9, 1057-1063 (2006).

  13. 13.

    da Silva, JA, Tecuapetla, F., Paixão, V. & Costa, RM-Dopamina neŭrona agado antaŭ pordegaj komencaj agoj kaj vigligas estontajn movadojn. naturo 554, 244-248 (2018).

  14. 14.

    Fiorillo, KD, Tobler, PN & Schultz, W. Diskreta kodigo de rekompenca probablo kaj necerteco de dopaminaj neŭronoj. scienco 299, 1898-1902 (2003).

  15. 15.

    Patriarchi, T., Cho, JR, Merten, K., Howe, MW, et al. Ultrarapida neuronal bildigo de dopamina dinamiko kun desegnitaj genetike koditaj sensiloj. scienco 360, eaat4422 (2018).

  16. 16.

    Salamone, JD & Correa, M. La misteraj motivaj funkcioj de mesolimbia dopamino. Neŭrono 76, 470-485 (2012).

  17. 17.

    Schultz, W. Antaŭdira rekompenco-signalo de dopaminaj neŭronoj. J. Neurophysiol. 80, 1-27 (1998).

  18. 18.

    Garris, PA & Wightman, RM Malsamaj kinetikoj regas dopaminergian transdonon en la amigdalo, prealfronta kortekso kaj striato: en vivo voltametria studo. J. Neurosci. 14, 442-450 (1994).

  19. 19.

    Frank, MJ, Doll, BB, Oas-Terpstra, J. & Moreno, F. Antaŭfrontaj kaj striataj dopaminergiaj genoj antaŭdiras individuajn diferencojn en esplorado kaj ekspluatado. Nat. Neurosci. 12, 1062-1068 (2009).

  20. 20.

    St Onge, JR, Ahn, S., Phillips, AG & Floresco, SB Dinamikaj fluktuoj en dopamina elfluo en la prealfronta korto kaj kerno accumbens dum riska decido. J. Neurosci. 32, 16880-16891 (2012).

  21. 21.

    Bartra, O., McGuire, JT & Kable, JW La taksada sistemo: kunordigita metanalizo de BOLD-fMRI-eksperimentoj ekzamenantaj neŭralajn korelaciaĵojn de subjektiva valoro. Neuroimage 76, 412-427 (2013).

  22. 22.

    Ikemoto, S. Dopamina rekompenca cirkvito: du projekciaj sistemoj de la ventra mezkerno al la nukleo accumbens-olfakta tuberkulo. Cerbo Res. Cerbo Res. Rev. 56, 27-78 (2007).

  23. 23.

    Breton, JM et al. Relativaj kontribuoj kaj mapado de ventralaj tegmentaj areaj dopaminoj kaj GABA-neŭronoj per projekcia celo en la rato. J. Komp. Neurol. (2018).

  24. 24.

    Ungless, MA, Magill, PJ & Bolam, JP Uniforma inhibicio de dopaminaj neŭronoj en la ventra tegmenta areo per aversivaj stimuloj. scienco 303, 2040-2042 (2004).

  25. 25.

    Morales, M. & Margolis, EB Ventra tegmenta areo: ĉela heterogeneco, konektebleco kaj konduto. Nat. Rev. Neurosci. 18, 73-85 (2017).

  26. 26.

    Morris, G., Arkadir, D., Nevet, A., Vaadia, E. & Bergman, H. Koincidaj sed apartaj mesaĝoj de mezcerba dopamino kaj striataj tonike aktivaj neŭronoj. Neŭrono 43, 133-143 (2004).

  27. 27.

    Floresco, SB, West, AR, Ash, B., Moore, H. & Grace, AA Aferenta modulado de dopamina neŭrona pafado diference reguligas tonikan kaj fazan dopaminan transdonon. Nat. Neurosci. 6, 968-973 (2003).

  28. 28.

    Gracia, AA-Malreguligo de la dopamina sistemo en la fiziopatologio de skizofrenio kaj depresio. Nat. Rev. Neurosci. 17, 524-532 (2016).

  29. 29.

    Cohen, JY, Amoroso, MW & Uchida, N. Serotonergiaj neŭronoj signalas rekompencon kaj punon laŭ multnombraj temposkaloj. eLife 4, e06346 (2015).

  30. 30.

    Niv, Y., Daw, N. & Dayan, P. Kiom rapide labori: respondo vigleco, instigo kaj tonika dopamino. Adv. Neŭra Inf. Procezo. Syst. 18, 1019 (2006).

  31. 31.

    Bayer, HM, Lau, B. & Glimcher, PW-Statistikoj de mezcerbaj dopaminaj neŭronaj spikaj trajnoj en la veka primato. J. Neurophysiol. 98, 1428-1439 (2007).

  32. 32.

    Chergui, K., Suaud-Chagny, MF & Gonon, F. Nelinia rilato inter impulsa fluo, liberigo de dopamino kaj elimino de dopamino en la rata cerbo in vivo. Neurokienco 62, 641-645 (1994).

  33. 33.

    Parker, NF et al. Rekompenco kaj elekto kodanta en fina stacioj de dubonaj dopaminaj neŭronoj dependas de striatala celo. Nat. Neurosci. 19, 845-854 (2016).

  34. 34.

    Menegas, W., Babayan, BM, Uchida, N. & Watabe-Uchida, M. Kontraŭa komencigo al novaj signalvortoj pri dopamina signalado en ventra kaj posta striato en musoj. eLife 6, e21886 (2017).

  35. 35.

    Trulson, ME Samtempa registrado de substantia nigra neŭronoj kaj voltammetrika liberigo de dopamino en la kaŭzato de kondutaj katoj. Cerbo Res. Virbovo. 15, 221-223 (1985).

  36. 36.

    Glowinski, J., Chéramy, A., Romo, R. & Barbeito, L. Presinapta reguligo de dopaminergia transdono en la striato. Ĉelo. Mol. Neurobiol. 8, 7-17 (1988).

  37. 37.

    Zhou, FM, Liang, Y. & Dani, JA Endogena nikotina kolinergia agado reguligas liberigon de dopamino en la striato. Nat. Neurosci. 4, 1224-1229 (2001).

  38. 38.

    Threlfell, S. et al. Striatala dopamina liberigo estas deĉenigita de sinkronigita aktiveco en kolinergiaj interneŭronoj. Neŭrono 75, 58-64 (2012).

  39. 39.

    Cachope, R. et al. Selektiva aktivigo de kolinergiaj interneŭronoj plibonigas akumulan fazan dopaminan liberigon: fiksante la tonon por rekompenco-prilaborado. Ĉeloj Raportoj 2, 33-41 (2012).

  40. 40.

    Sulzer, D., Cragg, SJ & Rice, ME Striatal dopamine neurotransmission: reguligo de liberigo kaj asimilado. Basal Ganglia 6, 123-148 (2016).

  41. 41.

    Floresco, SB, Yang, CR, Phillips, AG & Blaha, CD Basolateral amigdala stimulo elvokas glutamatan receptoran dependan dopaminan elfluon en la kerno accumbens de la anestezita rato. Eur. J. Neurosci. 10, 1241-1251 (1998).

  42. 42.

    Jones, JL et al. Basolateral amigdala modulas la finan dopamin-liberigon en la kerno acumbens kaj kondiĉas respondadon. Biol. Psikiatrio 67, 737-744 (2010).

  43. 43.

    Schultz, W. Respondoj de dubonaj dopaminaj neŭronoj al kondutaj ellasaj stimuloj en simio. J. Neurophysiol. 56, 1439-1461 (1986).

  44. 44.

    Berke, JD Kion signifas dopamino? Nat. Neurosci. 21, 787-793 (2018).

  45. 45.

    Bromberg-Martin, ES, Macumoto, M. & Hikosaka, O. Distinga tonika kaj faza anticipa agado en flankaj habenula kaj dopamina neŭronoj. Neŭrono 67, 144-155 (2010).

  46. 46.

    Pasquereau, B. & Turner, RS-dopaminaj neŭronoj kodas erarojn antaŭdirante movadon deĉeniga okazo. J. Neurophysiol. 113, 1110-1123 (2015).

  47. 47.

    Fiorillo, KD, Newsome, WT & Schultz, W. La tempa precizeco de rekompenca antaŭdiro en dopaminaj neŭronoj. Nat. Neurosci. 11, 966-973 (2008).

  48. 48.

    Morita, K. & Kato, A. Stria dopamina rampado povas indiki flekseblan plifortigan lernadon kun forgesado en la kortikaj-bazaj ganglioj-cirkvitoj. Fronto. Neŭralaj Cirkvitoj 8, 36 (2014).

  49. 49.

    Drapaminaj rampoj de Gershman, SJ estas konsekvenco de eraraj prognozaj eraroj. Neŭra Komputilo. 26, 467-471 (2014).

  50. 50.

    Nicola, SM La fleksebla alproksimiĝa hipotezo: unuiĝo de penado kaj korespondaj hipotezoj por la rolo de kerno akuzanta dopaminon en la aktivado de rekompenc-konduto. J. Neurosci. 30, 16585-16600 (2010).

  51. 51.

    Paxinos, G. & Watson, C. La Cerbo de Rato en Stereotoksaj Koordinatoj 5th edn (Elsevier Academic, 2005).

  52. 52.

    Witten, IB et al. Recombinase-ŝoforaj ratoj: iloj, teknikoj, kaj optogenetika apliko al dopamina-mediaciita plifortigo. Neŭrono 72, 721-733 (2011).

  53. 53.

    Sugrue, LP, Corrado, GS & Newsome, WT-kongrua konduto kaj la reprezento de valoro en la parietala korto. scienco 304, 1782-1787 (2004).

  54. 54.

    Wong, JM et al. Benzoil-klorid-deratizado kun likva kromatografio-masa spektrometrio por celataj metabolomikoj de neŭkemiaj kemiaj biologiaj specimenoj. J. Kromatogr. A 1446, 78-90 (2016).

  55. 55.

    Chung, JE et al. Tute aŭtomata alproksimiĝo al spic-ordigo. Neŭrono 95, 1381-1394 (2017).

  56. 56.

    Kvitsiani, D. et al. Distingktaj kondutaj kaj retaj korelacioj de du interneuronaj tipoj en prefrontal-kortekso. naturo 498, 363-366 (2013).

  57. 57.

    Grace, AA & Bunney, BS La kontrolo de pafado en nigralaj dopaminaj neŭronoj: eksplodo. J. Neurosci. 4, 2877-2890 (1984).

  58. 58.

    Lerner, TN kaj aliaj. Intakta cerba analizo rivelas apartajn informojn portitajn de SNc-dopaminaj cirkvitoj. ĉelo 162, 635-647 (2015).

Elŝuti referencojn

Dankoj

Ni dankas P. Dayan, H. Fields, L. Frank, C. Donaghue kaj T. Faust pro iliaj komentoj pri frua versio de la manuskripto, kaj V. Hetrick, R. Hashim kaj T. Davidson pro teknika helpo kaj konsiloj. Ĉi tiu laboro estis subtenita de la Nacia Instituto pri Drogaj Misuzoj, la Nacia Instituto pri Mensa Sano, la Nacia Instituto pri Neŭrologiaj Malordoj kaj Streko, la Universitato de Miĉigano, Ann Arbor, kaj la Universitato de Kalifornio, San-Francisko.

Informoj pri recenzisto

naturo dankon Margaret Rice kaj la aliaj anonimaj reviziantoj (j) pro ilia kontribuo al la samideanaj recenzoj pri ĉi tiu verko.

Informoj pri aŭtoro

AM realigis kaj analizis la electrofisiologion kaj fotometrion, kaj aplikis la komputan modelon. JRP elfaris kaj analizis la mikrodializon kun helpo de J.-MTW kaj gvido de RTKAAH disvolvis la kondutan taskon kaj komencan fotometran aranĝon, kaj plenumis la voltammetrion. LTV elfaris retrogradan spuradon kaj analizon. TP kaj LT evoluigis la dLight-sensilon kaj dividis kompetentecon. JDB desegnis kaj kontrolis la studon, kaj verkis la manuskripton.

Konkurantaj interesoj

La aŭtoroj deklaras neniujn konkurenajn interesojn.

Korespondado al Josuo D. Berke.