Avaldatud Internetis 2018 May 14. doi: 10.1038 / s41593-018-0152-y
Abstraktne
Dopamiin on nii õppimise kui ka motivatsiooni kriitiline modulaator. See kujutab endast probleemi: kuidas sihtrakud teavad, kas suurenenud dopamiin on signaal õppimiseks või liikumiseks? Sageli eeldatakse, et motivatsiooniga kaasneb aeglane (“tooniline”) dopamiini muutus, samas kui kiire (“faasiline”) dopamiini kõikumine annab õpitulemustele ennustusvigu. Kuid hiljutised uuringud on näidanud, et dopamiin edastab motivatsiooni ja edendab liikumist isegi teisel ajajärgul. Siin kirjeldan alternatiivset kontot sellest, kuidas dopamiin reguleerib käimasolevat käitumist. Dopamiini vabanemine, mis on seotud motivatsiooniga, moodustub kiiresti ja lokaalselt dopamiini terminalides olevate retseptorite poolt, sõltumata dopamiiniraku põletamisest. Sihtmärgiks olevad neuronid vahelduvad järsult õppimis- ja jõudlusrežiimide vahel, striatri koliinergilised interneuronid, mis pakuvad ühte kandidaat-lülitusmehhanismi. Dopamiini käitumuslik mõju varieerub allpiirkondade kaupa, kuid igal juhul annab dopamiin dünaamilise hinnangu selle kohta, kas tasub kulutada piiratud sisemist ressurssi, näiteks energiat, tähelepanu või aega.
Kas dopamiin on signaal õppimiseks, motivatsiooniks või mõlemaks?
Meie arusaam dopamiinist on minevikus muutunud ja muutub jälle. Üks kriitiline erinevus on dopamiini mõju kohta praegune käitumine (jõudlus) ja dopamiini mõju tulevik käitumine (õppimine). Mõlemad on reaalsed ja olulised, kuid erinevatel aegadel on olnud üks ja teine ei ole.
Kui (70is) sai võimalikuks teha selektiivseid, täielikke dopamiiniradade kahjustusi, oli ilmne käitumise tagajärg tõsine liikumise vähenemine1. See sobib dopamiinikadu inimestele tekitatud akineetilise mõjuga, mida põhjustab kaugelearenenud Parkinsoni tõbi, toksilised ravimid või entsefaliit.2. Kuid ei rottidel ega inimestel ei ole põhilist võimetust liikuda. Dopamiiniga kahjustatud rotid ujuvad külmas vees3ja akinetilised patsiendid võivad tõusta ja käivitada, kui tulekahjuhäire kõlab („paradoksaalne” kinesia). Samuti ei esine baasipuudujääki hüvede hindamisel: dopamiiniga kahjustatud rotid tarbivad suhu paigutatud toitu ja näitavad märke selle nautimisest4. Pigem ei tee nad jõupingutusi, et aktiivselt saada hüvesid. Need ja paljud teised tulemused tõid esile fundamentaalse seose dopamiini ja motivatsiooni vahel5. Isegi väiksema raskusega Parkinsoni tõve korral täheldatud aeglustumist võib pidada motiveerivaks puuduseks, mis peegeldab kaudseid otsuseid, et kiiremini liikumiseks vajalikku energiat ei ole väärt.6.
Siis („80s”) tulid ahvidel käitudes dopamiini neuronite teerajajad (keskjoonel asuvates piirkondades, mis projektivad enneaegseks: ventral tegmental area, VTA / materiia nigra pars compacta, SNc). Täheldatud põletusmustrite hulgas olid lühikesed aktiivsuse purunemised stiimulitele, mis vallandasid vahetu liikumise. Seda "faasilist" dopamiini põletamist tõlgendati esialgu kui "käitumuslikku aktiveerimist".7 ja “motiveeriv erutus”8 - teisisõnu kui looma praeguse käitumise turgutamist.
„90-ides toimus radikaalne muutus, kusjuures faasiliste dopamiini purunemiste ümbermõtestamine kodeerimisena tasu ennustusvead (RPEd9). See põhines olulisel tähelepanekul: dopamiinirakud reageerivad ootamatutele stiimulitele, mis on seotud tulevase tasuga, kuid sageli ei vasta need, kui need stiimulid oodatakse10. RPE idee sai alguse varasematest õppe teooriatest ja eriti siis, kui arenenud arvutiteaduse valdkonnas õnnestus õppida11. RPE signaali punkt on värskendada väärtused(tulevaste hüvede hinnangud). Neid väärtusi kasutatakse hiljem, et aidata teha valikuid, mis maksimeerivad tasu. Kuna dopamiiniraku põletamine sarnaneb RPE-dega ja õppimiseks kasutatakse RPE-sid, oli loomulik rõhutada dopamiini rolli õppimisel. Hiljem kinnitasid optogeneetilised manipulatsioonid RPE-d kodeerivate rakkude dopamiinergilist identiteeti12,13 ja näitasid, et nad tegelikult õpinguid moduleerivad14,15.
Idee, et dopamiin annab õppesignaali, sobib ilusti kirjandusega, et dopamiin moduleerib sünaptilist plastilisust striatumis, mis on dopamiini esmane eesnäärme sihtmärk. Näiteks põhjustab striatsi dendriidi selgroo, postünaptilise depolarisatsiooni ja dopamiini vabanemise glutamaadi stimuleerimise kolmekordne kokkusattumine selgroo kasvamist16. Pikaajaliste õppemehhanismide dopamiinergiline moduleerimine aitab selgitada sõltuvust tekitavate ravimite püsivat käitumuslikku toimet, millel on omadus suurendada striatraalse dopamiini vabanemist17. Isegi dopamiini kadumise sügavat akinesiat võib osaliselt seletada selliste õppemehhanismidega18. Dopamiini puudumist võib pidada pidevalt negatiivseks RPE-ks, mis järk-järgult värskendab toimingute väärtusi nullini. Dopamiini antagonistid võivad valmistada sarnaseid progresseeruvaid, väljasuremisega sarnaseid toimeid käitumisele19,20.
Kuid idee, et dopamiin on kriitiliselt seotud jätkuva motivatsiooniga, pole kunagi kadunud - vastupidi, käitumisharjumuste neuroteadlased peavad seda üldiselt enesestmõistetavaks. See on asjakohane, arvestades tõsiseid tõendeid selle kohta, et dopamiini funktsioonid motivatsioonis / liikumises / ergutamises on õppest lahutatavad15,20-23. Vähem hinnatud on väljakutse, mis on seotud selle motiveeriva rolli ühitamisega teooriaga, et DA annab RPE õppesignaali.
Motivatsioon „ootab”: kasutab tulevase tasu (väärtuste) prognoose, et õigesti toota praegust käitumist. Seevastu õpib „vaatab tagasi” riikides ja tegevustes viimasel ajal ning ajakohastab nende väärtusi. Need on tsükli üksteist täiendavad faasid: uuendatud väärtusi võib kasutada järgnevatel otsuste tegemisel, kui need olekud uuesti kokku puutuvad, seejärel uuendatakse ja nii edasi. Kuid mis tsükli etapp on dopamiin seotud - väärtuste kasutamine otsuste tegemiseks (jõudlus) või väärtuste (õppe) uuendamiseks?
Mõnel juhul on lihtne ette kujutada, et dopamiin mängib mõlemat rolli üheaegselt.24Ootamatu, tasu-ennustavad vihjed on arhetüüpilised sündmused dopamiiniraku põletamise ja vabastamise esilekutsumiseks ning sellised vihjed stimuleerivad tavaliselt käitumist ja tekitavad õppimist (Joon. 1). Selles konkreetses olukorras suurenevad samaaegselt nii preemia ennustamine kui ka preemia ennustamise vead - kuid see pole alati nii. Ainult ühe näitena on inimesed ja teised loomad sageli motiveeritud hüvede nimel töötama ka siis, kui üllatavat on vähe või pole midagi üllatavat. Nad võivad preemiatele lähenedes üha rohkem vaeva näha (väärtus tõuseb, kui hüved lähenevad). Asi on selles, et õppimine ja motivatsioon on kontseptuaalselt, arvutuslikult ja käitumuslikult erinevad - ja dopamiin näib siiski mõlemat.
Allpool on kriitiliselt hinnatud praeguseid ideid selle kohta, kuidas dopamiin suudab saavutada nii õppimis- kui motivatsioonifunktsioone. Pakun uuendatud mudelit, mis põhineb kolmel põhilisel faktil: 1) dopamiini vabanemine terminalidest ei tulene lihtsalt dopamiiniraku põletamisest, vaid võib olla ka lokaalselt kontrollitav; 2) dopamiin mõjutab nii sihtrakkude sünaptilist plastilisust kui ka erutatavust, millel on vastavalt erinevad tagajärjed õppimisele ja jõudlusele; 3) dopamiini toimet plastilisusele saab sisse lülitada või välja lülitada lähedal asuvate vooluahelate abil. Üheskoos võivad need funktsioonid võimaldada aju ahelatel vahetada kahte erinevat dopamiini sõnumit, vastavalt õppimiseks ja motivatsiooniks.
Kas on olemas erinevad "faasilised" ja "toonilised" dopamiini signaalid, millel on erinevad tähendused?
Sageli väidetakse, et dopamiini õppimis- ja motivatsioonirollid esinevad erinevatel ajastustel25. Dopamiinirakud tulevad pidevalt ("tooniliselt") mõne tipuga sekundis, aeg-ajalt lühikeste ("faasiliste") purunemiste või pausidega. Purunemised, eriti kui need on kunstlikult sünkroniseeritud dopamiinirakkude vahel, põhjustavad eesmise dopamiini kiiret kasvu26 mis on väga mööduvad (sub-second kestus27). Toonilise dopamiiniraku põletamise eraldi panus eesmise dopamiini kontsentratsioonidesse on vähem selge. Mõned tõendid näitavad, et see panus on väga väike28. Võib olla piisav kõrgema afiinsusega D2 retseptorite peaaegu pideva stimuleerimise valmistamiseks, võimaldades süsteemil täheldada lühikesi pausid dopamiiniraku põletamisel29 ja kasutage neid pausid negatiivsete ennustusvigade kujul.
Mikrodialüüsi on laialdaselt kasutatud otsese aju dopamiini taseme mõõtmiseks, ehkki madala ajaline lahutusvõime (tavaliselt keskmiselt mitme minuti jooksul). Sellised dopamiini aeglased mõõtmised võivad olla täpselt seotud käitumisega. Sellegipoolest näitab dopamiini mikrodialüüs tuuma accumbensis (NAc; ventral / medial striatum) positiivseid korrelatsioone liikumisaktiivsuse suhtes30 ja muud motivatsiooni näitajad5. See on laialt levinud tähendamaks, et dopamiini kontsentratsioonis on aeglane („tooniline”) muutus ja et need aeglased muutused annavad motivatsiooni. Täpsemalt, arvutuslikud mudelid on teinud ettepaneku, et toonilised dopamiini tasemed jälgivad pikaajalist keskmist tasu määra31 - kasulik motivatsiooniline muutuja aja jaotamiseks ja otsuste tegemiseks. Tasub rõhutada, et väga vähestes artiklites on selgelt määratletud toonilise dopamiini tase - nad eeldavad tavaliselt, et dopamiini kontsentratsioon mikrodialüüsi mitme minuti pikkuse skaala jooksul aeglaselt muutub.
Kuid see „faasiline dopamiin = RPE / õppimine, tooniline dopamiin = motivatsioon” seisab silmitsi paljude probleemidega. Esiteks puuduvad otsesed tõendid selle kohta, et dopamiini rakkude põletamine on aeglase aja jooksul tavaliselt erinev. Tooniliste süütamise kiirused ei muutu motivatsiooni muutumisel32,33. On väidetud, et dopamiini toonilised tasemed muutuvad aktiivsete dopamiinirakkude osakaalu muutumise tõttu34,35. Kuid paljude uuringute puhul, mis on seotud ebaõnnestunud loomadega, ei ole dopamiinirakkudest kunagi teatatud vaikiva ja aktiivse oleku vahel.
Lisaks ei tähenda asjaolu, et mikrodialüüs mõõdab aeglaselt dopamiini taset, seda, et dopamiini tase tegelikult muutuks aeglaselt. Me hiljuti15 uuriti rottide NAc dopamiini tõenäosusliku tasuülesandega, kasutades nii mikrodialüüsi kui ka kiiret skaneerivat tsüklilist voltammeetriat. Me kinnitasime, et mikrodialüüsi abil mõõdetud mesolimbiline dopamiin korreleerub taseme määraga (hüved / min). Kuid isegi parema mikrodialüüsi ajalise resolutsiooniga (1min) kõigutas dopamiin nii kiiresti kui me proovisime: me ei näinud tõendeid loomupäraselt aeglase dopamiini signaali kohta.
Võrreldes voltammeetrilise ajaline resolutsiooniga täheldasime teise dopamiini kõikumiste ja motivatsiooni vahelist tihedat seost. Kuna rotid tegid hüvede saavutamiseks vajalike toimingute järjestuse, tõusis dopamiin kõrgemale ja kõrgemale, saavutades tippu, nagu nad said tasu (ja langesid kiiresti, kui nad seda tarbisid). Näitasime, et dopamiin korreleerus tugevalt hetkeseisundi väärtusega, mis on määratletud kui eeldatav tulevane tasu, diskonteerituna selle vastuvõtmiseks vajaliku ajaga. Need dopamiini kiire dünaamika võivad seletada ka mikrodialüüsi tulemusi, ilma eraldi dopamiini signaalideta erinevatel ajastustel. Kuna loomadel on rohkem hüvesid, suurendavad nad oma ootusi tulevaste hüvede suhtes iga katseseeria etapis. Selle asemel, et aeglaselt arenev keskmine tasu määr, selgitaks dopamiini ja tasu määra vahelist korrelatsiooni kõige kiiremini arenevate riigi väärtuste keskmisena pikendatud mikrodialüüsi proovi võtmise aja jooksul.
See mesolimbilise dopamiini vabanemise väärtuse tõlgendus on kooskõlas teiste uurimisrühmade voltammeetria tulemustega, kes on korduvalt leidnud, et dopamiini vabanemise kaldteed kasvavad, kui suureneb lähedus tasu eest36-38(Joon. 2). See motivatsioonisignaal ei ole oma olemuselt „aeglane”, vaid pigem võib seda täheldada pideva ajavahemiku jooksul. Kuigi dopamiini kaldteed võivad kesta mitu sekundit, kui lähenemiskäitumine kestab ka mitu sekundit38See peegeldab pigem käitumise aja kulgu kui sisemist dopamiini dünaamikat. Mesolimbilise dopamiini vabanemise ja kõikuva väärtuse vaheline suhe on nähtav nii kiiresti kui salvestustehnika lubab, st 100ms'i ajastusel akuutse voltammeetriaelektroodiga.15.
Kiired dopamiini kõikumised ei peegelda ainult motivatsiooni, vaid ka motiveeritud käitumist. Dopamiinirakkude suuremad faasilised vastused, mis käivitavad vihjeid, ennustavad selle sama uuringu puhul lühemaid reaktsiooniaegu39. VTA dopamiinirakkude optogeneetiline stimulatsioon muudab rottide tõenäolisema tasuülesande tegemise tõenäolisemaks15, justkui neil oleks suurem tasu saamise ootus. SNc dopamiini neuronite või nende aksonite optogeneetiline stimuleerimine dorsaalses striatumis suurendab liikumise tõenäosust40,41. Kriitiliselt on need käitumuslikud mõjud ilmnevad paarisaja millisekundi jooksul pärast optogeneetilise stimulatsiooni algust. Tasu-ennustavate märkide võime motivatsiooni võimendamiseks näib olevat vahendatud väga kiire dopamiinergilise modulatsiooniga NAc spiny neuronite erutatavuses42. Kuna dopamiin muutub kiiresti ja need dopamiini muutused mõjutavad motivatsiooni kiiresti, kirjeldatakse dopamiini motivatsioonifunktsioone paremini kui kiiret („faasilist”), mitte aeglast (“toonik”).
Pealegi ei lahenda eraldi kiire ja aeglase skaala kasutamine iseenesest dopamiiniretseptoritega neuronite dekodeerimise probleemi. Kui dopamiin annab õppimisest märku, näib sünaptilise plastilisuse moduleerimine sobiva rakureaktsioonina. Kuid kohene mõju motiveeritud käitumisele tähendab kohest mõju spikerdamisele - nt erutuvuse kiirete muutuste kaudu. Dopamiin võib avaldada mõlemat postsünaptilist toimet (ja rohkemgi), kas siis on antud dopamiini kontsentratsioonil konkreetne tähendus? Või kas see tähendus tuleb konstrueerida - nt dopamiini taseme võrdlemine ajas või muude kokkulangevate signaalide abil kindlaks teha, millist rakumehhanismi rakendada? Seda võimalust käsitletakse allpool.
Kas dopamiini vabanemine edastab sama informatsiooni kui dopamiiniraku põletamisel?
Kiire dopamiini kõikumiste ja motivatsiooniväärtuse seos tundub kummaline, arvestades, et dopamiini rakkude põletamine sarnaneb pigem RPE-ga. Lisaks on mõnedes uuringutes teatatud RPE signaalidest mesolimbilise dopamiini vabanemisel43. Närviandmete mõningate vormide tõlgendamisel on oluline välja tuua väljakutse. Väärtussignaalid ja RPE-d on omavahel korrelatsioonis - pole üllatav, et RPE määratletakse tavaliselt väärtuse muutusena ühest hetkest teise ("ajaline erinevus" RPE). Selle seose tõttu on oluline kasutada eksperimentaalseid kujundusi ja analüüse, mis eristavad väärtust RPE kontodest. Probleemile lisandub närvimõõt, mis tugineb signaali absoluutsetele, mitte absoluutsetele muutustele. Voltammeetriaanalüüsides võrreldakse dopamiini mingil huvipakkuval hetkel iga uuringu alguses varasema “baasjoone” ajastuga (et eemaldada signaalikomponendid, mis ei sõltu dopamiinist, sealhulgas elektroodide laadimine igal pinge pühkimisel ja triivimine minutite jooksul). Kuid baasjoonest lahutades võib väärtussignaal sarnaneda RPE signaaliga. Seda täheldasime enda voltammeetriaandmetes (Joonis 2e). Tasuootuse muutused kajastusid dopamiini kontsentratsiooni muutustes iga uuringu alguses ja need muutused jäid vahele, kui eeldatakse, et katsed on püsivad.15. Järeldusi dopamiini vabanemise ja RPE kodeerimise kohta tuleb seega vaadata ettevaatusega. See andmete tõlgendamise oht ei kehti mitte ainult voltammeetria, vaid ka mis tahes analüüsi kohta, mis tugineb suhtelistele muutustele - sealhulgas potentsiaalselt fMRI ja fotomeetria44.
Sellegipoolest peame siiski kooskõlastama väärtusega seotud dopamiini vabanemise NAc südamikus koos dopamiini neuronite järjepideva väärtuseta spikeerimise puudumisega13, isegi VTA külgsuunas, mis tagab dopamiini NAc tuumale45. Üheks potentsiaalseks teguriks on see, et dopamiinirakud registreeritakse tavaliselt klassikalise konditsioneerimisülesannetega peapeatusega loomadel, samal ajal kui dopamiini vabanemist mõõdetakse tavaliselt piiramata loomadel, kes liiguvad aktiivselt läbi oma keskkonna. Me tegime ettepaneku, et mesolimbiline dopamiin võib konkreetselt näidata „töö“ väärtust15 - et see peegeldab nõuet preemia saamiseks aega ja vaeva pühendada. Sellega kooskõlas suureneb dopamiin liikumist juhendavate signaalide korral, kuid mitte vaikust juhendavate signaalide korral, isegi kui need näitavad sarnast tulevast tasu46. Kui aktiivsest „tööst” pole nagu paljudel klassikalistel tingimisülesannetel kasu, siis võivad töö väärtusele viitavad dopaminergilised muutused olla vähem ilmsed.
Veelgi olulisem võib olla asjaolu, et dopamiini vabanemist saab kontrollida terminaalsetes paikades ise ja seega on neil näidustused rakkude kehast sõltumatult. Näiteks võib basolateraalne amygdala (BLA) mõjutada NAc dopamiini vabanemist isegi siis, kui VTA on inaktiveeritud47. Seevastu vähendab BLA inaktiveerimine NAc dopamiini vabanemist ja vastavat motiveeritud käitumist, ilma et see ilmselt mõjutaks VTA põletamist48. Dopamiiniterminalidel on retseptorid mitmete neurotransmitterite, sealhulgas glutamaadi, opioidide ja atsetüülkoliini jaoks. Nikotiinsed atsetüülkoliini retseptorid võimaldavad striatri kolinergilistel interneuronidel (CIN) kiiresti kontrollida dopamiini vabanemist49,50. Kuigi pikka aega on täheldatud, et dopamiini vabanemise kohalik kontroll on potentsiaalselt oluline7,51, seda ei ole arvestatud dopamiini funktsiooni arvutustes. Teen ettepaneku, et väärtuse kodeerimisega seotud dopamiini vabanemise dünaamika tekib suures osas läbi kohalik kontroll, isegi kui dopamiiniraku põletamine pakub olulisi RPE-sarnaseid signaale õppimiseks.
Kuidas võib dopamiin segadust tekitada nii õppimise kui motivatsiooni?
Põhimõtteliselt piisab RPE edastamiseks piisavast väärtussignaalist, sest ajaline vahe RPE on lihtsalt väärtuse kiire muutus (Joonis 2B). Näiteks võivad sihtmärk-neuronites erinevad intratsellulaarsed radad olla erinevalt tundlikud dopamiini absoluutse kontsentratsiooni suhtes (esindav väärtus) võrreldes kiirete suhteliste kontsentratsiooni muutustega (mis esindavad RPE-d). See skeem näib usutav, võttes arvesse keerulise neuroni füsioloogia kompleksset dopamiini moduleerimist52 ja nende tundlikkus kaltsiumi kontsentratsiooni ajaliste mustrite suhtes53. Kuid see tundub ka mõnevõrra ülearune. Kui RPE-sarnane signaal on juba dopamiinirakkude spiktis, peaks seda olema võimalik kasutada pigem RPE väärtuse signaalist taaskehtestamiseks.
Erinevate RPE- ja väärtussignaalide nõuetekohaseks kasutamiseks võivad dopamiini saaja ahelad aktiivselt dopamiini tõlgendamisel vahetada. On huvitavaid tõendeid selle kohta, et atsetüülkoliin võib olla ka selle vahetuse roll. Samal ajal, kui dopamiinirakud purunevad naastud ootamatutele märkidele, näitavad CIN-d lühidalt (~ 150ms) puruneb tulekahju ajal, mis ei ole RPE-ga skaalal54. Neid CIN pausid saab juhtida VTA GABAergiliste neuronite poolt55 samuti "üllatada" seotud rakke intralaminaalses talamuses ja on pakutud toimima seotuse signaalina, mis soodustab õppimist56. Morris ja Bergman pakkusid välja54 et kolinergilised paused määravad ajakavad, mis võimaldavad striaalset plastilisust, mille käigus saab dopamiini kasutada õppesignaalina. Dopamiinist sõltuvat plastilisust pärsivad pidevalt mehhanismid, kaasa arvatud muskariinsed m4 retseptorid otseliini striatu neuronitel57. Intratsellulaarse signaalimise mudelid viitavad sellele, et CIN-i pauside ajal võib m4-i sidumise puudumine toimida sünergistlikult faasiliste dopamiini purunemisega, et suurendada PKA aktivatsiooni.58seeläbi edendada sünaptilist muutust.
Seega on striatri koliinergilised rakud hästi positsioneeritud, et dünaamilise dopamiinergilise sõnumi tähendust dünaamiliselt vahetada. CIN-i pauside ajal võimaldaks muskariinse blokaadi vabastamine sünaptilise plastilisuse tõttu õppimisel kasutada dopamiini. Teistel aegadel oleks dopamiiniterminalidest vabanemine kohapeal, et mõjutada käimasolevat käitumist. Praegu on see ettepanek spekulatiivne ja mittetäielik. On tehtud ettepanek, et CIN-id integreeriksid paljudest ümbritsevatest spin-neuronitest informatsiooni, et saada kasulikke võrgutaseme signaale, nagu entropia59,60. Kuid pole üldse selge, et CIN-i aktiivsuse dünaamikat saab kasutada dopamiini väärtussignaalide loomiseks61ning ka dopamiini õppimise signaale.
Kas dopamiin tähendab sama eelkäija?
Kui RPE idee pidi kinni pidama, arvati, et dopamiin oli ülemaailmne signaal, mis edastas veateate striaalsete ja frontaalsete kortikaalsete eesmärkide juures. Schultz rõhutas, et ahvide dopamiinirakkudes VTA ja SNc-s on väga sarnased vastused62. Kindlaksmääratud dopamiinirakkude uuringutes on närilistel leitud ka üsna homogeensed RPE-sarnased reaktsioonid, vähemalt klassikalise konditsioneerimise kontekstis VTA neuronite jaoks.13. Dopamiinirakud on aga molekulaarselt ja füsioloogiliselt erinevad63-65 ja praegu on palju teateid, et nad käituvad loomade käitamisel mitmesuguste põletusmudelitega. Nendeks on faasiline suurenemine tulistamises aversiivseteks sündmusteks66 ja käivitab vihjeid67 mis sobivad halvasti standardse RPE kontoga. Paljudel dopamiinirakkudel esineb esialgne lühiajalise vastus sensoorsetele sündmustele, mis peegeldavad üllatust või „hoiatust” rohkem kui konkreetne RPE kodeerimine68,69. See hoiatav aspekt on SNc-s nähtavam69, kus dopamiinirakud ulatuvad rohkem “sensorimotori” dorsaalsele / lateraalsele striatumile (DLS45,63). On teatatud, et SNc dopamiinirakkude subpopulatsioonid suurenevad41 või väheneb70 tulistamist koos spontaansete liikumistega, isegi ilma väliste vihjeta.
Mitmed rühmad kasutasid kiu fotomeetria ja kaltsiumindikaator GCaMP, et uurida dopamiini neuronite alampopulatsioonide üldist aktiivsust71,72. Dopamiinirakud, mis ulatuvad selja / mediaalse striatumini (DMS), näitasid ootamatute lühikeste šokkide suhtes mööduvat depressiooni, samas kui DLS-ile suunatud projektid näitasid suurenenud aktiivsust71- paremini kooskõlas hoiatava reageeringuga. Erinevates esiaju alampiirkondades on täheldatud ka erinevaid dopaminergilisi reaktsioone, kasutades GCaMP-d dopamiini aksonite ja terminalide aktiivsuse uurimiseks40,72,73. Howe ja Dombeck kasutavad kahe fotoni kujutist peatues hiirtel40 teatatud faasilise dopamiini aktiivsusest, mis on seotud spontaansete liikumistega. Seda täheldati peamiselt SNc üksikutel dopamiini aksonitel, mis lõppesid dorsaalse striatumiga, samas kui VTA dopamiini aksonid reageerisid NAc-s rohkem tasu andmisele. Teised leidsid ka tasulise dopamiinergilise aktiivsuse NAc-s, DMS seostus pigem vastandlike toimetega72 ja striatumi tagumine saba, mis reageerib aversiivsetele ja uutele stiimulitele74.
Dopamiini vabanemise otsesed mõõdud näitavad ka alampiirkondade heterogeensust30,75. Mikrodialüüsi puhul leiti, et dopamiin korreleerub spetsiifiliselt NAc südamiku ja ventraalse-mediaalse eesmise koore väärtusega, mitte striatumi (NAc shell, DMS) või eesmise ajukoore teiste mediaalsete osadega. See on intrigeeriv, sest tundub, et see kaardistab hästi kahe väärtuse kodeerimise „hotspotiga”, mis on inimese fMRI uuringutes järjepidevalt näha76,77. Eelkõige NAc BOLD signaal, mis on tihedalt seotud dopamiini signalisatsiooniga78, suureneb preemia ootusega (väärtusega) - rohkem kui RPE-ga76.
Kas need dopamiini vabanemise ruumilised mustrid tulenevad erinevate dopamiinirakkude subpopulatsioonide põletamisest, dopamiini vabanemise kohalikust kontrollist või mõlemast, seavad nad kahtluse alla globaalse dopamiini sõnumi idee. Võib järeldada, et on palju erinevaid dopamiini funktsioone: (näiteks) dopamiini dorsaalses striatumis, mis tähistab “liikumist” ja dopamiini kõhu striatumis, andes “tasu”.40. Siiski pooldan ma teist kontseptuaalset lähenemisviisi. Erinevad striatuse alampiirkonnad saavad sisendeid erinevatest kortikaalsetest piirkondadest ja töötlevad nii erinevat tüüpi teavet. Ometi jagab iga striatuse alampiirkond ühist mikroskeemide arhitektuuri, kaasa arvatud eraldi D1-versus D2-retseptorit kandvad spiny neuronid79, CIN-id jne. Kuigi on tavaline, et viidatakse erinevatele striatuse alampiirkondadele (nt DLS, DMS, NAc tuum), nagu oleksid nad eraldiseisvad alad, nende vahel ei ole teravaid anatoomilisi piire (NAc kest on veidi neurokemiliselt erinev). Selle asemel on retseptori tiheduse, interneuroni proportsioonide jms puhul vaid õrnad gradientid, mis tunduvad sarnasemad jagatud arvutusalgoritmi parameetritele. Võttes arvesse seda ühist arhitektuuri, kas me saame kirjeldada ühist dopamiini funktsiooni, mis on eraldatud konkreetsest informatsioonist, mida iga allpiirkond hakkab käsitsema?
Striaalne dopamiin ja piiratud ressursside eraldamine.
Ma teen ettepaneku, et erinevaid dopamiini toimeid käimasolevale käitumisele saab mõista kui ressursside jaotamise otsused. Täpsemalt, dopamiin annab hinnanguid selle kohta, kui kasulik on kulutada piiratud sisemine ressurss, kusjuures eriressurss erineb striatüüpi alampiirkondade vahel. „Mootori” striatumi (~ DLS) puhul on ressurss liikumine, mis on piiratud, sest liiguvad kulud energia ja paljud tegevused on omavahel kokkusobimatud80. Dopamiini suurendamine muudab tõenäolisemaks, et loom otsustab, et energiat on kasulik liikuda või liikuda kiiremini6,40,81. Pange tähele, et dopamiini signaal, mis kodeerib "liikumist väärt", tekitab dopamiini ja liikumise vahelisi seoseid isegi ilma "liikumist" kodeeriva dopamiini korral. Rep.
„Kognitiivse“ striatumi (~ DMS) puhul on ressursid kognitiivsed protsessid, sealhulgas tähelepanu (mis on määratletult piiratud \ t82) ja töömälu83. Ilma dopamiinita on tähelepanuta jäetud olulised välised näpunäited, mis tavaliselt provotseerivad orienteeruvaid liikumisi.3. Lisaks on kognitiivsete kontrollprotsesside tahtlik marssalimine kulukas (kulukas)84). Dopamiin - eriti DMS-is85 - mängib võtmerolli otsustamisel, kas seda vaeva tasub pingutada86,87. See võib hõlmata seda, kas kasutada rohkem kognitiivselt nõudlikumaid, deliberatiivseid („mudelipõhiseid”) otsustusstrateegiaid88.
„Motiveeriva” striatumi (NAc) puhul võib üks peamine piiratud ressurss olla looma aeg. Mesolimbiline dopamiin ei ole vajalik, kui loomad teevad lihtsa ja püsiva toimingu, et saada kiiresti hüvesid89. Kuid paljusid tasu vorme saab ainult pikaajalise töö kaudu: laiendamata toimingute laiendatud järjestused, nagu sööda puhul. Tööle valimine tähendab, et on vaja loobuda teistest soodsatest aegadest. Kõrge mesolimbiline dopamiin näitab, et ajaliselt pikendatud, pingulise töö tegemine on väärt, kuid kuna dopamiini alandatakse, siis loomad ei viitsinud ja võivad selle asemel lihtsalt ette valmistada magama90.
Dopamiini panus käimasolevasse käitumisse on igas cortico-striatali silmusahelas nii majanduslik (seotud ressursside eraldamisega) kui ka motiveeriv (olenemata sellest, kas see on väärt kulutada ressursse81). Need ahelad ei ole täielikult sõltumatud, vaid omavad pigem hierarhilist, spiraalset organisatsiooni: rohkem striatumi ventralseid osi mõjutavad dopamiinirakud, mis ulatuvad rohkem seljaosaosadesse5,91. Sel moel võivad tööga seotud otsused aidata ka vajalikke spetsiifilisi, lühemaid liigutusi turgutada. Kuid üldiselt annab dopamiin „aktiveerivaid“ signaale - suurendades tõenäosust, et mõni otsus tehakse -, mitte „suunavaid“ signaale, mis täpsustavad kuidas ressursse5.
Milline on dopamiini arvutuslik roll otsuste tegemisel?
Üks mõtteviis sellest aktiveerivast rollist on otsuste tegemise “künniste” mõttes. Teatud matemaatiliste mudelite puhul suurenevad otsustusprotsessid, kuni nad jõuavad künnise tasemeni, kui süsteem on toime pannud92. Kõrgem dopamiin oleks samaväärne madalama kauguseni künnisega, nii et otsused saavutatakse kiiremini. See idee on lihtsustatud, kuid annab siiski kvantitatiivseid prognoose, mis on kinnitatud. Liikumise künniste alandamine põhjustaks konkreetse muutuse reaktsiooniaegade jaotuse kujus, just seda, mis on nähtav, kui amfetamiini infundeeritakse sensorimotori striatumisse.20.
Fikseeritud künniste asemel võivad käitumuslikud ja närviandmed paremini sobida, kui künnised aja jooksul vähenevad, nagu oleksid otsused muutunud üha kiireloomulisemaks. Basaalganglionide väljund on välja pakutud dünaamiliselt areneva kiireloomulise signaali loomiseks, mis ergutab valimismehhanisme ajukoores93. Kiirus oli ka suurem, kui tulevased hüved olid aja jooksul lähemal, muutes selle kontseptsiooni sarnaseks dopamiini väärtuse kodeerimise, aktiveeriva rolliga.
Kas selline aktiveeriv roll on piisav, et kirjeldada striataalse dopamiini toimivust moduleerivaid toimeid? See on seotud pikaajalise küsimusega, kas põhilised ganglionahelad valivad otseselt õppetegevuse vahel80 või lihtsalt elavdada mujal tehtud valikuid93,94. Dopamiinil on vähemalt kaks võimalust, mis näib olevat "suunavam". Esimene on see, kui dopamiin toimib aju alampiirkonnas, mis töötleb oma olemuselt suunavat informatsiooni. Basal ganglioni ahelatel on oluline, osaliselt külgsuunaline rollide orienteerimine potentsiaalsete hüvede poole ja nende lähenedes. Primaadi caudate (~ DMS) on seotud silmade liikumise juhtimisega kontralateraalsete ruumiväljade suunas95. Dopamiinergiline signaal, mis on midagi vastuolulises ruumis orienteeritavat väärt, võib tähendada täheldatud seost dopamiinergilise aktiivsuse vahel DMS-is ja vastandlike liikumiste vahel.72, samuti dopamiini manipulatsioonide poolt tekitatud rotatsioonikäitumist96. Dopamiini teine „suunaline” mõju ilmneb siis, kui (kahepoolsed) dopamiini kahjustused ründavad rotte väikese vaevaga / madala tasuga valikute asemel, mitte suure jõudlusega / kõrge tasuga alternatiividega97. See võib peegeldada asjaolu, et mõned otsused on järjestikamad kui paralleelsed, kusjuures rottidel (ja inimestel) hinnatakse võimalusi ükshaaval98. Nendes otsustuskontekstides võib dopamiin ikkagi maksta põhiliselt aktiveerivat rolli, edastades hetkel kaalutud võimaluse väärtuse, mida saab seejärel aktsepteerida või mitte24.
Aktiivsed loomad teevad otsuseid mitmel tasandil, sageli kõrge kiirusega. Lisaks üksikute otsuste mõtlemisele võib osutuda kasulikuks kaaluda üldist trajektoori riikide vahel (Joon. 1). Lihtsustades üleminekuid ühelt seisundilt teisele, võib dopamiin kiirendada voolu mööda õpitud trajektoore99. See võib olla seotud dopamiini olulise mõjuga käitumise ajastamisele44,100. Tulevase töö üks peamisi piire on saada sügavam arusaam sellest, kuidas sellised dopamiini mõjud käimasolevale käitumisele tekivad mehhaaniliselt, muutes infotöötlust üksikute rakkude, mikroskeemide ja suurte koore-basaalsete ganglionide silmuste vahel. Samuti olen rõhutanud dopamiini tavapäraseid arvutuslikke rolle mitmesugustes striataalsetes sihtmärkides, kuid suuresti tähelepanuta jäetud kortikaalsetes sihtmärkides, ja on veel näha, kas mõlemas struktuuris saab dopamiini funktsioone kirjeldada samas raamistikus.
Kokkuvõtvaltdopamiini adekvaatne kirjeldus selgitaks, kuidas dopamiin võib nii kiire õppimise kui ka motivatsiooni signaale anda, ilma et segadust tekitaks. See selgitaks, miks dopamiini vabanemine võtmesse on suunatud palgatõusu ootajatele, kuigi dopamiini rakkude põletamine ei ole. Ja see annaks ühtse arvutusliku arvestuse dopamiini toimingutest kogu striatumi ja mujal, mis selgitab erinevusi käitumise mõju liikumisele, tunnetusele ja ajastamisele. Mõned siin esitatud konkreetsed ideed on spekulatiivsed, kuid nende eesmärk on uuendada uusi arutelusid, modelleerimist ja uusi eksperimente.
Tänuavaldused.
Tänan paljusid kolleege, kes esitasid tähelepanelikke märkusi varasemate tekstide kohta, sealhulgas Kent Berridge, Peter Dayan, Brian Knutson, Jeff Beeler, Peter Redgrave, John Lisman, Jesse Goldberg ja anonüümsed kohtunikud. Mul on kahju, et ruumi piirangud välistasid paljude oluliste eelnevate uuringute arutamise. Olulist tuge andsid Riiklik Neuroloogiliste Häirete Instituut, Riiklik Vaimse Tervise Instituut ja Riiklik Uimastitarbimise Instituut.