Publikigita interrete 2018 majo 14. doi: 10.1038 / s41593-018-0152-y
abstrakta
Dopamino estas kritika modulilo de lernado kaj instigo. Ĉi tio prezentas problemon: kiel celaj ĉeloj povas scii, ĉu pliigita dopamino estas signalo por lerni, aŭ moviĝi? Oni ofte supozas, ke instigo kaŭzas malrapidajn ("tonikajn") dopaminajn ŝanĝojn, dum rapidaj ("fazaj") dopaminaj fluctuoj transdonas rekompencajn erarojn pro lernado. Tamen lastatempaj studoj montris, ke dopamino donas motivan valoron kaj antaŭenigas movadon eĉ en subaj duaj tempoj. Ĉi tie mi priskribas alternativan konton pri kiel dopamina reguligas daŭrantan konduton. Dopamina liberigo ligita al instigo estas rapide kaj loke skulptita de riceviloj sur dopaminaj finaĵoj, sendepende de dopamina ĉela pafo. Celaj neŭronoj subite interŝanĝas inter lernadaj kaj plenumaj reĝimoj, kun striaj kolinergiaj interneŭronoj provizantaj unu kandidatan ŝaltilon. La kondutisma efiko de dopamino varias laŭ subregiono, sed en ĉiu kazo dopamino donas dinamikan taksadon pri tio, ĉu indas elspezi limigitan internan rimedon, ekzemple energion, atenton aŭ tempon.
Ĉu dopamino estas signalo por lernado, por instigo, aŭ ambaŭ?
Nia kompreno pri dopamino ŝanĝiĝis en la pasinteco, kaj denove ŝanĝiĝas. Unu kritika distingo estas inter dopaminfektoj nuna konduto (agado), kaj dopamina efikoj sur estonteco konduto (lernado). Ambaŭ estas realaj kaj gravaj, sed diversaj fojoj unu estis en favoro kaj la alia ne.
Kiam (en la '70s) eblis plenumi selektemajn kaj kompletajn lezojn de dopaminaj vojoj, la evidenta kondutisma konsekvenco estis severa redukto de movado1. Ĉi tio kongruas kun akinetikaj efikoj de perdo de dopamino en homoj, produktitaj de progresinta Parkinsona malsano, venenaj drogoj aŭ encefalito2. Sed nek kazoj nek homaj kazoj montras fundamentan nekapablon moviĝi. Dopamin-vunditaj ratoj naĝas en malvarma akvo3kaj akinetikaj pacientoj povas leviĝi kaj funkcii se ekbruligas alarmon ("paradoksa" kinezio). Nek ekzistas baza deficito en aprezo de rekompencoj: dopamin-vunditaj ratoj konsumos manĝaĵon metitan en siajn buŝojn, kaj montros signojn de ĝuado de ĝi4. Prefere, ili ne elektos praktiki penadon por akiri rekompencojn aktive. Ĉi tiuj kaj multaj aliaj rezultoj establis fundamentan ligon inter dopamino kaj instigo5. Eĉ la malrapida movo observita en malpli severaj kazoj de Parkinsona Malsano povas esti konsiderata motiviga deficito, reflektante implicajn decidojn, ke ne indas elspezi la energion bezonatan por pli rapidaj movadoj.6.
Tiam (en la '80s) venis pioniraj registradoj de dopaminaj neŭronoj en kondutado de simioj (en mezkruraj areoj projektantaj antaŭfrazon: ventral-tegmenta areo, VTA / substantia nigra pars compacta, SNc). Inter observitaj pafaj padronoj estis mallongaj eksplodoj de aktiveco al stimuloj, kiuj ekigis tujan movadon. Ĉi tiu "fazo" dopamina pafo estis komence interpretita kiel subtenanta "kondutan aktivadon"7 kaj "instiga instigo"8 - alivorte, kiel vigliganta la nunan konduton de la besto.
Radikala ŝanĝo okazis en la '90-oj, kun la reinterpreto de fazaj dopaminaj eksplodoj kiel kodigo rekompenco prognozaj eraroj (RPEoj)9). Ĉi tio baziĝis sur ŝlosila observo: dopaminaj ĉeloj respondas al neatenditaj stimuloj asociitaj kun estonta rekompenco, sed ofte ĉesas respondi, se ĉi tiuj stimuloj atendas10. La ideo de RPE originis de pli fruaj teorioj pri lernado, kaj precipe en la tiama disvolva komputila kampo de plifortiga lernado11. La punkto de RPE-signalo estas ĝisdatigi valoroj(taksoj pri estontaj rekompencoj). Ĉi tiuj valoroj estas uzataj poste, por helpi fari elektojn, kiuj maksimume rekompencas. Ĉar la dopamina ĉela pafo similis RPEojn, kaj RPEoj estas uzataj por lernado, fariĝis nature emfazi la rolon de dopamino en lernado. Poste optogenetikaj manipuladoj konfirmis la dopaminergian identecon de RPE-kodantaj ĉeloj12,13 kaj montris, ke ili efektive modulas lernadon14,15.
La ideo, ke dopamino disponigas lernan signalon, kongruas bele kun la literaturo, ke dopamino modulas sinaptikan plasticecon en la striatumo, la ĉefa antaŭĉiela celo de dopamino. Ekzemple, la triobla koincido de glutamata stimulado de stria dendrita kolumna vertebro, postsinaptika depolarigo kaj dopamina liberigo kaŭzas, ke la spino kreskas16. Dopaminergia modulado de longtempa lernomekanismo helpas klarigi la konstantajn kondutajn efikojn de toksomaniuloj, kiuj dividas la posedaĵon de plibonigo de striatala dopamina liberigo17. Eĉ la profunda akinesia kun dopamina perdo povas parte kalkuli per tiaj lernadaj mekanismoj18. Manko de dopamino povas esti traktata kiel konstante negativa RPE, kiu iom post iom ĝisdatigas valorojn de agoj al nulo. Similaj progresemaj, formortaj efikoj sur konduto povas esti produktitaj de dopaminaj antagonistoj19,20.
Tamen la ideo, ke dopamino estas grave implikita en daŭra instigo, neniam malaperis - male, ĝi estas vaste konsiderata de kondutaj neŭrosciencistoj. Ĉi tio taŭgas pro la forta indico, ke dopaminaj funkcioj en instigo / movado / vigligo estas disigeblaj de lernado15,20-23. Malpli vaste estimata estas la defio implikanta akordigi ĉi tiun motivan rolon kun la teorio, ke DA disponigas RPE-lernadan signalon.
Motivado "antaŭĝojas": ĝi uzas antaŭdirojn pri estontaj rekompencoj (valoroj) por taŭge aktualigi konduton. Kontraŭe, lerni "aspektas malantaŭen" ĉe statoj kaj agoj en la lastatempa pasinteco, kaj ĝisdatigas siajn valorojn. Ĉi tiuj estas komplementaj fazoj de ciklo: la ĝisdatigitaj valoroj povas esti uzataj en posta decido se tiuj ŝtatoj estas re-renkontitaj, tiam ĝisdatigitaj denove, kaj tiel plu. Sed kun kiu fazo de la ciklo partoprenas dopamino - uzado de valoroj por fari decidojn (agadon), aŭ ĝisdatigi valorojn (lernado)?
En iuj cirkonstancoj estas simple imagi dopaminon ludante ambaŭ rolojn samtempe.24Neatenditaj, rekompencaj antaŭvidoj estas la arketipaj eventoj por elvokado de la dopamina ĉela pafo kaj liberigo, kaj tiaj tipoj tipe ambaŭ revigligas konduton kaj elvokas lernadon (Figo. 1). En ĉi tiu aparta situacio ambaŭ rekompencas antaŭdiron kaj rekompencas antaŭdirajn erarojn pliiĝas samtempe - sed ĉi tio ne ĉiam okazas. Kiel nur unu ekzemplo, homoj kaj aliaj bestoj ofte estas instigitaj labori por rekompencoj eĉ kiam malmulta aŭ nenio surpriza okazas. Ili eble laboros pli kaj pli malfacile dum ili pli kaj pli proksimas al rekompenco (valoraj pliiĝoj dum rekompencoj alproksimiĝas). La afero estas, ke lernado kaj instigo estas koncepte, komputile kaj kondute aparte - kaj tamen dopamino ŝajnas fari ambaŭ.
Sube mi kritike taksas aktualajn ideojn pri tio, kiel dopamina kapablas atingi lernajn kaj motivajn funkciojn. Mi proponas ĝisdatigitan modelon, bazitan sur tri ŝlosilaj faktoj: 1) dopamina liberigo de fina stacioj ne rezultas simple de pafaĵo de dopamina ĉelo, sed ankaŭ povas esti surloke kontrolita; 2) dopamino influas kaj sinaptikan plasticecon kaj ekscitemon de celaj ĉeloj, kun apartaj konsekvencoj por lernado kaj agado respektive; Dopaminaj efikoj sur 3) sur plasteco povas esti ŝaltitaj aŭ malŝaltitaj per proksimaj cirkvitaj elementoj. Kune, ĉi tiuj karakterizaĵoj povas permesi cerbajn cirkvitojn alterni inter du apartaj dopaminaj mesaĝoj, por lernado kaj instigo respektive.
Ĉu ekzistas apartaj dopaminaj "fazaj" kaj "tonikaj" signaloj, kun malsamaj signifoj?
Oni ofte argumentas, ke lernado kaj instigaj roloj de dopamino okazas laŭ malsamaj tempaj skaloj25. Dopamaj ĉeloj ekbruliĝas kontinue ("tonike") je kelkaj pikiloj por dua, kun fojaj mallongaj ("fazaj") kreviĝoj aŭ paŭzoj. Eksplodoj, precipe se artefarite sinkronigitaj tra dopaminaj ĉeloj, kaŭzas respondajn rapidajn pliiĝojn en prebena dopamino26 kiuj estas tre transiraj (sub-dua daŭro27). La aparta kontribuo de tonika dopamina ĉela pafo al antaŭbrainaj dopaminaj koncentriĝoj estas malpli klara. Iuj evidentaĵoj sugestas, ke ĉi tiu kontribuo estas tre malgranda28. Eble sufiĉas produkti preskaŭ kontinuan stimuladon de la D2-receptoroj de pli alta afineco, permesante al la sistemo rimarki mallongajn paŭzojn en la pafo de ĉelaj dopaminoj29 kaj uzu ĉi tiujn paŭzojn kiel negativajn prognozajn erarojn.
Mikrodisizo estis vaste uzata por rekte mezuri prebrainajn dopaminajn nivelojn, kvankam kun malalta tempo-rezolucio (tipe averaĝe tra multaj minutoj). Tiaj malrapidaj mezuradoj de dopamino povas esti malfacile rilati precize al konduto. Tamen la microdializo de dopamino en la kerno accumbens (NAc; ventral / medial striatum) montras pozitivajn rilatojn al lokomotora agado30 kaj aliaj indicoj de instigo5. Ĉi tio vaste signifas, ke estas malrapidaj ("tonikaj") ŝanĝoj en dopamina koncentriĝo, kaj ke ĉi tiuj malrapidaj ŝanĝoj transdonas motivan signalon. Pli specife, komputaj modeloj proponis, ke tonikaj dopaminaj niveloj spuras la longtempan mezan rekompencon31 - utila instiga variablo por tempaj asignoj kaj manĝodecidoj. Indas emfazi, ke tre malmultaj artikoloj klare difinas "tonajn" dopaminajn nivelojn - ili kutime nur supozas, ke dopamina koncentriĝo malrapide ŝanĝiĝas dum la plurminuta temposkalo de mikrodializo.
Tamen ĉi tiu vidado "fazo dopamina = RPE / lernado, tona dopamina = instiga" alfrontas multajn problemojn. Unue, ekzistas neniu rekta evidenteco, ke tipa dopamina ĉela pafo kutime varias laŭ malrapidaj tempaj skaloj. Tona pafo-ritmo ne ŝanĝiĝas kun ŝanĝiĝema instigo32,33. Oni argumentis, ke tonikaj dopaminaj niveloj ŝanĝiĝas pro ŝanĝiĝanta proporcio de aktivaj dopaminaj ĉeloj34,35. Sed tra multaj studoj en nesufiĉaj, malsimilaj bestoj, oni neniam raportis, ke dopaminaj ĉeloj ŝanĝi inter silentaj kaj aktivaj statoj.
Plue, la fakto, ke mikrodisizo mezuras nivelojn de dopamino malrapide ne signifas, ke efektive niveloj de dopamino ŝanĝiĝas malrapide. Antaŭnelonge15 ekzamenis ratan NAc-dopaminon en probabilisma rekompenca tasko, uzante kaj mikrodijalion kaj rapidan skanan ciklikan voltammetrion. Ni konfirmis, ke mezolimbia dopamino, kiel mezurita per mikrodijaliso, rilatas al rekompenca indico (rekompencoj / min). Tamen, eĉ kun plibonigita tempodaŭra rezolucio (1min) dopamino fluctuis tiel rapide kiel ni sampligis ĝin: ni vidis neniun evidentecon por sendanĝera malrapida dopamina signalo.
Uzante la pli fajnan tempan rezolucion ankoraŭ de voltammetrio ni observis proksiman rilaton inter sub-dua dopamina fluktuado kaj instigo. Dum ratoj plenumis la sinsekvon de agoj bezonataj por atingi rekompencojn, dopamino altiĝis pli kaj pli alte, atingante pinton ĝuste kiam ili akiris la rekompencon (kaj falis rapide dum ili konsumis ĝin). Ni montris, ke dopamino korelaciis forte kun tuja ŝtata valoro - difinita kiel la atendata estonta rekompenco, rabatita de la atendata tempo necesa por ricevi ĝin. Ĉi tiuj rapidaj dopaminaj dinamikoj ankaŭ povas klarigi la rezultojn de microdializo, sen alvoki apartajn dopaminajn signalojn laŭ malsamaj tempaj skaloj. Ĉar bestoj spertas pli da rekompenco, ili pliigas siajn atendojn pri estontaj rekompencoj ĉe ĉiu paŝo de la proceso. Prefere ol malrapide evoluanta averaĝa rekompenco-signalo, la korelacio inter dopamino kaj rekompenca indico estas plej bone klarigita kiel mezumo, dum la plilongigita mikrodialysa specimeno-kolektado, de ĉi tiuj rapide evoluantaj ŝtataj valoroj.
Ĉi tiu valora interpreto de mesolimbika dopamina liberigo kongruas kun voltammetriaj rezultoj de aliaj esplorgrupoj, kiuj plurfoje konstatis, ke dopamina liberigo rampas kun pli kaj pli da proksimeco por rekompenci36-38(Figo. 2). Ĉi tiu motiviga signalo ne estas esence "malrapida", sed oni povas observi ĝin laŭ kontinua gamo da tempaj skaloj. Kvankam dopaminaj rampoj povas daŭri plurajn sekundojn, kiam alproksimiĝa konduto ankaŭ daŭras plurajn sekundojn38, ĉi tio reflektas la tempan kurson de la konduto, pli ol intrinseka dopamina dinamiko. La rilato inter mezolimbia dopamina liberigo kaj flua valoro estas videbla tiel rapide kiel la registradotekniko permesas, t.e. en ~ 100ms-tempodaŭro kun akraj voltammetrodelektroj15.
Rapidaj dopaminaj fluktuoj ne simple spegulas instigon, ili ankaŭ tuj pelas motivitan konduton. Pli grandaj fazaj respondoj de dopaminaj ĉeloj por ekigi signojn antaŭdiras pli mallongajn reagajn tempojn sur tiu sama proceso39. Optogenetika stimulo de VTA-dopaminaj ĉeloj igas ratojn pli verŝajne komenci laboron en nia probabilisma rekompenca tasko15, same kiel se ili havus pli altan atendon de rekompenco. Optogenetika stimulo de SNc-dopamina neŭronoj, aŭ iliaj akonoj en dorsa striatumo, pliigas la probablon de movado40,41. Kritike, ĉi tiuj kondutaj efikoj estas ŝajnaj ene de kelkcent milisekundoj de la ekapero de optogenetika stimulo. La kapablo de rekompencaj antaŭdiroj de akcelado de instigo ŝajnas esti mediaciita per tre rapida dopaminergia modulado de la ekscitebleco de spaj neŭronoj de NAc42. Ĉar dopamina ŝanĝiĝas rapide, kaj ĉi tiuj dopaminaj ŝanĝoj influas instigon rapide, la motivaj funkcioj de dopamino estas pli bone priskribitaj kiel rapidaj ("fazaj"), ne malrapidaj ("tonikaj").
Plue, alvoki apartajn rapidajn kaj malrapidajn temposkalojn ne per si mem solvas la malkodigan problemon, kiun alfrontas neŭronoj kun dopaminaj riceviloj. Se dopamino signalas lernadon, modulado de sinapta plastikeco ŝajnus taŭga ĉela respondo. Sed tujaj efikoj al motivita konduto implicas tujajn efikojn al pikado - ekz. Per rapidaj ŝanĝoj de eksciteco. Dopamino povas havi ambaŭ ĉi tiujn postsinaptajn efikojn (kaj pli), do ĉu donita dopamina koncentriĝo havas specifan signifon? Aŭ ĉu ĉi tiu signifo devas esti kreita - ekz. Komparante dopaminajn nivelojn laŭlonge de la tempo, aŭ uzante aliajn koincidajn signalojn por determini kiun ĉelan maŝinaron engaĝiĝi? Ĉi tiu ebleco estas diskutita plu sube.
Ĉu dopamina liberigo transdonas la samajn informojn kiel dopamina ĉela pafo?
La rilato inter rapidaj dopaminaj fluktuoj kaj motiva valoro ŝajnas stranga, konsiderante, ke la dopamina ĉela pafo anstataŭe similas al RPE. Plue, kelkaj studoj raportis RPE-signalojn en mesolimbic dopamina liberigo43. Gravas rimarki defion interpretante iujn formojn de neŭralaj datumoj. Valorsignaloj kaj RPEoj estas korelaciitaj unu kun la alia - ne surprize ĉar la RPE estas kutime difinita kiel la ŝanĝo de valoro de unu momento al la sekva ("temp-diferenca" RPE). Pro ĉi tiu korelacio estas kritike uzi eksperimentajn projektojn kaj analizojn, kiuj distingas valoron de RPE-kontoj. La problemo kunmetiĝas kiam oni uzas neŭralan mezuron, kiu dependas de relativaj anstataŭ absolutaj signalaj ŝanĝoj. Voltametriaj analizoj kutime komparas dopaminon iam interesan punkton al "baza linio" pli frue en ĉiu provo (por forigi signalajn komponantojn, kiuj ne dependas de dopamino, inkluzive elektrodajn ŝarĝojn sur ĉiu tensia balaado kaj drivado dum tempodaŭro de minutoj). Sed subtrahi bazlinion povas igi valoran signalon simili RPE-signalon. Jen kion ni observis en niaj propraj voltametriaj datumoj (Fig. 2e). Ŝanĝoj en rekompenco de rekompenco reflektis ŝanĝojn en dopamina koncentriĝo frue en ĉiu provo, kaj ĉi tiuj ŝanĝoj estas maltrafitaj se oni nur supozas konstantan bazlinion tra provoj.15. Konkludoj pri liberigo de dopamino kaj kodigo de RPE devas do esti rigardataj singarde. Ĉi tiu datuma interpreta danĝero validas ne nur por voltametrio, sed por iu ajn analizo, kiu dependas de relativaj ŝanĝoj - eble inkluzive de iu fMRI kaj fotometrio44.
Tamen, ni ankoraŭ devas akordigi valor-rilatan dopamin-liberigon en NAc-kerno kun la konstanta foresto de valor-rilata spikado de dopaminaj neŭronoj.13, eĉ ene de la flanka VTA-areo kiu provizas dopaminon al NAc-kerno45. Unu ebla faktoro estas, ke dopaminaj ĉeloj estas kutime registritaj en kap-restriktitaj bestoj plenumantaj klasikajn taŭgajn taskojn, dum dopamina liberigo estas tipe mezurita en nerestriktitaj bestoj aktive moviĝantaj tra sia medio. Ni proponis, ke mesolimbia dopamino povus specife indiki la valoron de "laboro"15 - ke ĝi reflektas postulon dediĉi tempon kaj penon akiri la rekompencon. Konforme al ĉi tio, dopamino pliiĝas kun signaloj instruantaj movadon, sed ne kun signaloj instruantaj kvietecon, eĉ kiam ili indikas similan estontan rekompencon.46. Se - kiel en multaj klasikaj kondiĉaj taskoj - ne ekzistas avantaĝo por aktiva "laboro", tiam dopaminergiaj ŝanĝoj indikantaj la valoron de laboro povas esti malpli ŝajnaj.
Eĉ pli grava povas esti la fakto, ke liberigo de dopamino povas esti surloke regata ĉe la fina stacioj mem, kaj tiel montras spaca-temporajn padronojn sendepende de ĉelkorpo. Ekzemple, la bazolateral amigdala (BLA) povas influi NAc-dopamin-liberigon eĉ kiam VTA estas neaktivigita47. Al la inversigi, senaktivigi BLA reduktas la dopan liberigon de NAc kaj respondan motivitan konduton, sen ŝajne tuŝi la pafon de VTA48. Dopaminaj finaĵoj havas ricevilojn por gamo da neŭrotransmisiloj, inkluzive de glutamato, opioidoj kaj acetilkolino. Nicotinaj acetilkolinaj riceviloj permesas striatajn kolinergiajn interneurojn (CINoj) rapide kontroli dopamin-liberigon49,50. Kvankam oni longe konstatis, ke loka kontrolo de liberigo de dopamino estas gravega7,51, ĝi ne estis inkludita en komputikaj kontoj pri dopamina funkcio. Mi proponas, ke la dinamiko de liberigo de dopamino rilata al valoro-kodado plejparte okazas lokaj kontrolo, eĉ dum dopamina ĉela pafo liveras gravajn RPE-similajn signalojn por lernado.
Kiel dopamina povas signifi lernadon kaj instigon sen konfuzo?
Principe, valoro-signalo sufiĉas por ankaŭ transdoni RPE, ĉar temp-diferencaj RPE-oj simple estas rapidaj ŝanĝoj en valoro (Fig. 2B). Ekzemple, distingaj intracelulaj vojoj en celaj neŭronoj povus esti malsame sentaj al la absoluta koncentriĝo de dopamino (reprezentanta valoron) kontraŭ rapidaj relativaj ŝanĝoj en koncentriĝo (reprezentanta RPE). Ĉi tiu skemo ŝajnas plaŭdita, konsiderante la kompleksan dopaminan moduladon de spina neŭronologio52 kaj ilia sentiveco al tempaj ŝablonoj de koncentriĝo de kalcio53. Tamen ĉi tio ankaŭ ŝajnas iomete sensignifa. Se RPE-simila signalo jam ekzistas en dopamina ĉela spikado, ĝi devus esti eble uzi ĝin anstataŭ ol derivi RPE de valora signalo.
Por taŭge uzi distingajn RPE- kaj valor-signalojn, dopamin-ricevantaj cirkvitoj povas aktive ŝanĝi kiel ili interpretas dopaminon. Estas interesaj evidentecoj, ke acetilkolino ankaŭ povas servi ĉi tiun ŝaltilon. Samtempe kun dopaminĉeloj ekbruligas spikojn al neatenditaj signoj, CIN-oj montras mallongan (~ 150ms) paŭzoj en pafo, kiuj ne skalas kun RPE-oj54. Ĉi tiuj CIN-paŭzoj povas esti pelataj de VTA GABAergic-neŭronoj55 krom "surprizaj" rilataj ĉeloj en la intralaminara thalamo, kaj oni proponis agi kiel asociita signalo antaŭeniganta lernadon.56. Morris kaj Bergman sugestis54 ke kolinergiaj paŭzoj difinas tempajn fenestrojn por stria plasteco, dum kiuj dopamino povas esti uzata kiel lernada signalo. Dopamine-dependa plastikeco estas kontinue subpremita per mekanismoj inkluzive de muskarinaj m4-receptoroj sur rektaj vojaj striaj neŭronoj57. Modeloj de intracelula signalado sugestas, ke dum CIN-paŭzoj, la foresto de m4-ligado povas agi sinergie kun fazaj dopaminaj eksplodoj por akceli PKA-aktivigon58, tiel antaŭenigante sinaptan ŝanĝon.
Striatalaj kolinergiaj ĉeloj estas tiel bone poziciigitaj por dinamike ŝanĝi la signifon de multobligita dopaminergia mesaĝo. Dum CIN-paŭzoj, krizhelpo de muskarina bloko super sinaptika plastikeco permesus uzi dopaminon por lernado. Alifoje liberigo de dopaminaj finaĵoj estus loke skulptita por efiki daŭrantan kondutan agadon. Nuntempe ĉi tiu sugesto estas kaj spekulativa kaj nekompleta. Oni proponis, ke CINoj integru informojn de multaj ĉirkaŭaj dornaj neŭronoj por ĉerpi utilajn retnivelajn signalojn kiel entropion59,60. Sed tute ne klaras, ke dinamiko de CIN-agado povas esti uzata por generi dopaminajn valor-signalojn61kaj ankaŭ al pordaj dopaminaj lernaj signaloj.
Ĉu dopamino signifas la samon en la tuta antaŭbrako?
Dum la ideo pri RPE ekkaptis, oni imagis, ke dopamino estis tutmonda signalo, elsendante eraran mesaĝon tra striaj kaj frontaj kortikaj celoj. Schultz emfazis, ke simiaj dopaminaj ĉeloj tra VTA kaj SNc havas tre similajn respondojn62. Studoj pri identigitaj dopaminaj ĉeloj ankaŭ trovis sufiĉe homogenajn RPE-similajn respondojn en ronĝuloj, almenaŭ por flankaj VTA-neŭronoj en klasikaj kondiĉaj kuntekstoj.13. Tamen dopaminaj ĉeloj molekule kaj fiziologie diversaj63-65 kaj nun estas multaj raportoj, ke ili montras diversajn pafajn ŝablonojn en kondutaj bestoj. Ĉi tiuj inkluzivas fazajn kreskojn de pafo al avversaj eventoj66 kaj ekigi signojn67 kiuj kongruas malbone kun la norma RPE-konto. Multaj dopaminaj ĉeloj montras komencan mallongan respondon al sensaj eventoj, kiuj reflektas surprizon aŭ "atentigon" pli ol specifa RPE-kodado68,69. Ĉi tiu atentiga aspekto pli elstaras en SNc69, kie dopaminaj ĉeloj projektas pli al "sensorimotora" dorsal / flanka striatum (DLS)45,63). Subpopulacioj de SNc-dopaminaj ĉeloj ankaŭ estis raportitaj pliiĝi41 aŭ malpliiĝi70 pafo lige kun spontaneaj movadoj, eĉ sen eksteraj indikoj.
Pluraj grupoj uzis fibran fotometrion kaj la kalian indikilon GCaMP por ekzameni pograndan agadon de subpopulacioj de dopaminaj neŭronoj.71,72. Dopamaj ĉeloj, kiuj projektas la dorsan / median striatum (DMS), montris transitivan deprimitan aktivecon al neatenditaj mallongaj ŝokoj, dum tiuj projektantaj al DLS montris pliigitan aktivecon71- pli kongrua kun atentiga respondo. Apartaj dopaminergiaj respondoj en malsamaj antaŭcerbaj subregionoj ankaŭ estis observitaj uzante GCaMP por ekzameni agadon de dopaminaj aksonoj kaj fina stacioj.40,72,73. Uzante bildojn de du fotonoj en kap-kvietigitaj musoj, Howe kaj Dombeck40 raportis faza dopamina aktiveco rilata al spontaneaj movadoj. Ĉi tio vidis ĉefe en individuaj dopaminaj axonoj de SNc, kiuj finiĝis en dorsa striatumo, dum VTA-dopaminaj axonoj en NAc respondis pli por rekompenci liveradon. Aliaj ankaŭ trovis rekompencan rilatan dopaminergian agadon en NAc, kun DMS anstataŭe pli ligita al kontraŭflankaj agoj72 kaj la posta vosto de striatumo respondema al sensencaj kaj novaj stimuloj74.
Rekta mezuro de liberigo de dopamino ankaŭ malkaŝas heterogenecon inter subregionoj30,75. Kun mikrodijalizo, ni trovis dopaminon korelaciita kun valoro specife en NAc-kerno kaj ventral-media frontala kortekso, ne en aliaj mezaj partoj de striatum (NAc shell, DMS) aŭ frontala kortekso. Ĉi tio estas interesa, ĉar ĝi ŝajnas bone mapi du "hotspotojn" de valoro-kodado konstante viditaj en homaj studoj pri fMRI.76,77. Precipe la signalo NAC BOLD, kiu havas proksiman rilaton al dopamina signalado78, pliiĝas kun rekompenca antaŭvido (valoro) - pli ol kun RPE76.
Ĉu ĉi tiuj spacaj padronoj de liberigo de dopameno ekestas de pafo de malsamaj subpopulacioj de dopamina ĉelo, loka kontrolo de liberigo de dopamina, aŭ ambaŭ, ili defias la ideon de tutmonda dopamina mesaĝo. Oni povus konkludi, ke ekzistas multaj malsamaj dopaminaj funkcioj, kun (ekzemple) dopamino en dorsala striatum-signalado "moviĝo" kaj dopamino en ventrala striatuma signalado "rekompencas"40. Mi tamen favoras alian konceptan aliron. Malsamaj striaj subregionoj akiras enigaĵojn el diversaj kortikaj regionoj, kaj tiel prilaboras diversajn informojn. Tamen ĉiu stria subregiono dividas komunan mikrocirkvitan ar architectureitekturon, inkluzive de apartaj D1- kontraŭ D2- riceviloj kun spinaj neŭronoj.79, CIN, kaj tiel plu. Kvankam estas komune aludi al diversaj striaj subregionoj (ekz. DLS, DMS, NAc-kerno) kvazaŭ ili estas diskretaj areoj, ne ekzistas akraj anatomiaj limoj inter ili (NAc-ŝelo estas iom pli neŭkemie distinga). Anstataŭe estas nur mildaj gradientoj en ricevilo, proporcioj interneuron ktp, kiuj ŝajnas pli kiel retuŝoj al la parametroj de dividita komputila algoritmo. Konsiderante ĉi tiun komunan arkitekturon, ĉu ni povas priskribi oftan dopaminan funkcion, forprenitan de la specifaj informoj pritraktataj de ĉiu subregiono?
Striatala dopamino kaj la atribuo de limigitaj rimedoj.
Mi proponas, ke diversaj disaj efikoj de dopamino sur daŭra konduto povas esti komprenataj kiel modulado de decidoj pri rimedo pri atribuo. Specife, dopamino disponigas taksojn pri kiom indas elspezi limigitan internan rimedon, kun la aparta rimedo diferencanta inter striktaj subregionoj. Por "motora" striatumo (~ DLS) la rimedo estas movado, kiu estas limigita ĉar movo kostas energion kaj ĉar multaj agoj estas nekongruaj inter si.80. Pliigi dopaminon faras pli verŝajne, ke besto decidos, ke indas elspezi energion por moviĝi aŭ pli rapide6,40,81. Notu, ke dopamina signalo kodanta "movadon valoras" produktos korelaciojn inter dopamino kaj movado, eĉ sen dopamina kodado "movado" en si mem.
Por "kognaj" strioj (~ DMS) la rimedoj estas kognaj procezoj inkluzive de atento (kiu estas limigita kapablo per difino82) kaj laboranta memoro83. Sen dopamino, elstaraj eksteraj indikoj, kiuj kutime provokas orientiĝajn movadojn, estas neglektitaj, kvazaŭ konsiderataj malpli atentindaj3. Plue, intence prilabori procezojn de kognitiva kontrolo estas peniga (multekosta)84). Dopamino - precipe en DMS85 - ludas ŝlosilan rolon por decidi ĉu indas fari ĉi tiun penon86,87. Ĉi tio povas inkluzivi ĉu uzi pli kognie postulemajn, decidajn ("model-bazitajn") decidajn strategiojn88.
Por "instiga" striatumo (~ NAc) unu ŝlosila limigita rimedo povas esti la tempo de la besto. Mezolimbika dopamino ne bezonas kiam bestoj plenumas simplan, fiksitan agon por rapide akiri rekompencojn89. Sed multajn formojn de rekompenco eblas nur per plilongigita laboro: plilongigitaj sinsekvoj de nerekomenditaj agoj, kiel en furaĝo. Elekti okupiĝi pri laboro signifas ke oni devas forlasi aliajn utilajn manierojn pasigi tempon. Alta mezolimbia dopamino indikas, ke utilas tempodaŭre plilongigita penado, sed ĉar dopamina estas malaltigita bestoj ne ĝenas, kaj eble anstataŭe nur prepariĝas por dormi90.
Ene de ĉiu kortico-striatala bukla cirkvito la dopamina kontribuo al daŭra konduto estas tiel ekonomia (koncernita pri atribuo de rimedoj) kaj motiva (ĉu ĝi estas inda elspezi rimedojn81). Ĉi tiuj cirkvitoj ne estas plene sendependaj, sed prefere havas hierarkian, spiran organizon: pli ventraj porcioj de striato influas dopaminajn ĉelojn, kiuj projektas al pli da dorsaj porcioj5,91. Tiel decidoj okupiĝi pri laboro ankaŭ povas helpi vigligi necesajn specifajn pli mallongajn movadojn. Sed entute dopamino donas "aktivajn" signalojn - pliigante la probablon, ke iu decido estas farita - anstataŭ "direktaj" signaloj specifantaj kiom rimedoj devas esti elspezataj5.
Kio estas la komputila rolo de dopamino dum decidoj?
Unu maniero pensi pri ĉi tiu aktiva rolo estas en la decidoj de "sojloj". En iuj matematikaj modeloj decidaj procezoj pliiĝas ĝis ili atingas sojlan nivelon, kiam la sistemo kompromitas al ago92. Pli alta dopamino samvalorus al pli malalta distanco al la sojlo, tiel ke oni atingas decidojn pli rapide. Ĉi tiu ideo estas simplisma, tamen faras kvantajn prognozojn konfirmitajn. Malaltigi sojlojn por movado kaŭzus specifan ŝanĝon en la formo de la distribua tempo de reago, ĝuste tion, kio vidiĝas, kiam amfetamino estas infuzita en sensorimotora striatumo.20.
Prefere ol fiksitaj sojloj, kondutaj kaj neŭralaj datumoj povus pli bone taŭgi se sojloj malpliiĝas kun la tempo, kvazaŭ decidoj fariĝas ĉiam pli urĝaj. Oni proponis produktaĵon de bazaj ganglioj por doni dinamikan evoluan urĝan signalon, kiu vigligas elektomekanismojn en kortekso93. La urĝeco estis ankaŭ pli granda kiam estontaj rekompencoj estis pli proksimaj en la tempo, farante ĉi tiun koncepton simila al valorvaloro, aktiviga rolo de dopamino.
Ĉu tia aktivula rolo sufiĉas por priskribi la efikajn modulajn efikojn de stria dopamina? Ĉi tio rilatas al la longa demando pri tio, ĉu bazaj ganglioj-cirkvitoj rekte elektas inter lernitaj agoj80 aŭ simple vigligi elektojn faritajn aliloke93,94. Estas almenaŭ du manieroj laŭ kiuj dopamino povas aspekti pli "direktebla" efiko. La unua estas kiam dopamino agas ene de cerba subregiono, kiu prilaboras senpere direktajn informojn. Bazaj ganglioj-cirkvitoj havas gravan, parte-flankan rolon, orientiĝantan al kaj aliro al eblaj rekompencoj. La primata kaŭdato (~ DMS) okupiĝas pri veturado de okulaj movadoj al kontraŭ-flankaj spacaj kampoj95. Dopaminergia signalo, ke io en kontraŭkontraŭa spaco valoras orientiĝi, povas klarigi la observan korelacion inter dopaminergiaj agadoj en DMS kaj kontraŭ-flankaj movadoj.72, same kiel la rotacia konduto produktita per dopaminaj manipuladoj96. Dua "direkcia" influo de dopamino estas ŝajna kiam (bilateraj) dopaminaj lezoj ratacias ratojn direkte al malalt-penaj / malalt-rekompencaj elektoj, anstataŭ alternativaj / alt-rekompencaj alternativoj97. Ĉi tio eble reflektas la fakton, ke iuj decidoj estas pli seriaj ol paralelaj, kaj ratoj (kaj homoj) taksas opciojn samtempe98. En ĉi tiuj decidaj kuntekstoj, dopamino ankoraŭ povas pagi esence aktivan rolon transdonante la valoron de la aktuale konsiderata opcio, kiu tiam povas esti akceptita aŭ ne24.
Aktivaj bestoj faras decidojn je multnombraj niveloj, ofte je altaj rapidecoj. Preter pensado pri unuopaj decidoj, eble helpos konsideri ĝeneralan trajektorion tra sinsekvo de ŝtatoj (Figo. 1). Faciligante transirojn de unu ŝtato al la sekva, dopamino eble akcelas la fluon laŭ lernitaj trajektorioj99. Ĉi tio povas rilati al la grava influo de dopamino sur la tempokonduto44,100. Unu ŝlosila limo por estonta laboro estas pli profunda kompreno pri kiel tiaj dopaminaj efikoj sur daŭra konduto ekestas meisticanike, ŝanĝante informan prilaboron ene de unuopaj ĉeloj, mikrocirkvitoj kaj grandskalaj kortik-bazaj ganglioj. Ankaŭ mi emfazis oftajn komputajn rolojn de dopamino tra diversaj striaj celoj, sed plejparte neglektitajn kortikajn celojn, kaj restas vidi, ĉu dopaminaj funkcioj en ambaŭ strukturoj povas esti priskribitaj en la sama kadro.
En resumo, taŭga priskribo de dopamino klarigus, kiel dopamino povas signali ambaŭ lernadon, kaj instigon, sur la samaj rapidaj skaloj, sen konfuzo. Ĝi klarigus kial la dopamina liberigo en ŝlosilaj celoj kun kunplekta atendo kvankam ne dopamina ĉela pafo. Kaj ĝi provizus unuigitan komputan raporton pri dopaminaj agoj tra striato kaj aliloke, kio klarigas disigajn kondutajn efikojn al movado, kogno kaj tempolimo. Iuj specifaj ideoj prezentitaj ĉi tie estas konjektaj, sed celas vigligi renovigitan diskuton, modeladon kaj incisive novajn eksperimentojn.
Agnoskoj.
Mi dankas la multajn kolegojn, kiuj liveris sensencajn komentojn pri pli fruaj tekstaj projektoj, inkluzive de Kent Berridge, Peter Dayan, Brian Knutson, Jeff Beeler, Peter Redgrave, John Lisman, Jesse Goldberg kaj la anonimaj Arbitraciistoj. Mi bedaŭras, ke spacaj limigoj malhelpis diskuton de multaj gravaj antaŭaj studoj. Esenca subteno estis provizita de la Nacia Instituto pri Neŭrologiaj Malordoj kaj Streko, la Nacia Instituto pri Mensa Sano, kaj la Nacia Instituto pri Drogaj Misuzoj.