Kuntekstaj Novelty-Ŝanĝoj Rekompencas Reprezentojn en la Striatumo (2010)

 Plena Studo: Kunteksta Noveco Ŝanĝas Rekompencajn Reprezentojn en Striatumo


J Neŭroscio. Aŭtoro manuskripto; havebla en PMC 2010 Aug 3.
Eldonita en fina redaktita formo kiel:

Marc Guitart-Masip,*,1,2 Nico Bunzeck,*,1 Klaas E Stephan,2,3 Raymond J Dolan,2 kaj Emrah Düzel1,4

La fina redaktita versio de ĉi tiu artikolo de la eldonisto disponeblas senpage ĉe J Neurosci

Vidu aliajn artikolojn en PMC tio citas La artikolo eldonita.

Iru al:

abstrakta

Rekompensa reprezentado en ventrala striatumo estas akcelita de percepta noveco, kvankam la mekanismo de ĉi tiu efiko restas malfacila. Animalaj studoj indikas funkcian buklon (Lisman kaj Grace, 2005) kiu inkluzivas hipokampon, ventralan striatumon kaj mezan cerbon tiel gravan en reguligado de saga atribuo en la kunteksto de novaj stimuloj. Laŭ ĉi tiu modelo, rekompencaj respondoj en ventrala striatumo aŭ meza cerbo devas esti plibonigitaj en la kunteksto de noveco eĉ se rekompenco kaj noveco konsistigas senrilataj, sendependaj, eventoj. Uzante fMRI, ni montras, ke provoj kun rekompenco-prognozaj indikoj kaj postaj rezultoj provokas pli altajn respondojn en la striatumo se antaŭitaj de senrilata novembra bildo indikanta, ke rekompenco-reprezentado estas plibonigita kadre de noveco. Notinde, ĉi tiu efiko estis observita nur kiam rekompenco, kaj tial rilata rekompenco, estis malalta. Ĉi tiuj trovoj subtenas vidon, ke kunteksta noveco plibonigas neŭralajn respondojn sub la rekompenco de rekompenco en la striatumo kaj konsentas pri la efikoj de noviga prilaborado kiel antaŭvidite de la modelo de Lisman kaj Grace (2005).

Ŝlosilvortoj: noveco, rekompenco, striato, hipokampo, meza cerbo, fMRI

Enkonduko

La bazaj ganglioj, kune kun iliaj dopaminergiaj aferentoj, provizas mekanismon por lerni pri rekompenca valoro de malsamaj kondutaj elektoj (Berridge kaj Robinson, 2003; Frank kaj aliaj, 2004; Pessiglione et al., 2006). Lige al ĉi tiu vidpunkto, fMRI-studoj montras, ke rekompencas kaj rekompencas antaŭdirojn, provokas cerban agadon en la striatumo (ekz. (Delgado et al., 2000; Knutson et al., 2000; Aŭ'Doherty et al., 2003; Aŭ'Doherty et al., 2004) kaj meza cerbo (Aron et al., 2004; Wittmann et al., 2005). Tamen la dubspira dopaminergia sistemo ankaŭ respondas al ne-rekompencaj romanaj stimuloj en simioj (Ljungberg et al., 1992) kaj homoj (Bunzeck kaj Duzel, 2006; Wittmann et al., 2007). De komputika perspektivo sugestis, ke noveco mem povas agi kiel motiva signalo, kiu akcelas rekompencan reprezentadon kaj pelas esploradon de nekonata, novega elekta opcio (Kakade kaj Dayan, 2002).

Kvankam prilaboro de noveco kaj rekompenco dividas oftajn neŭrajn mekanismojn, la neŭra substrato, kiu subtenas interagadon inter noveco kaj rekompenco, estas malbone komprenata. Esploro en bestoj rivelas, ke hipokampaj novedzaj signaloj reguligas la kapablon de dopaminaj neŭronoj montri eksplodan pafon de agado. Konsiderante, ke eksplodpafado estas la ĉefa dopaminergia responda mastro kodanta rekompencojn, kaj eble aliajn elstarajn eventojn, estas bonaj kialoj suspekti, ke hipokampaj novecaj signaloj havas eblon reguligi rekompencan prilaboron kaj atribuon de saleco (Lisman kaj Grace, 2005). Hipokampaj novedzaj signaloj estas transdonitaj al VTA per la subikla, ventra striato kaj ventrala pallidum, kie ili kaŭzas malinstigon de silentaj dopaminaj neŭronoj por indiki reĝimon de tona agado (Lisman kaj Grace, 2005; Grace and Bunney, 1983). Grave, nur tonike aktivaj sed ne silentaj dopaminaj neŭronoj translokiĝas en krevan pafan reĝimon kaj montras fazajn respondojn (Floresco et al., 2003). Tiamaniere, hipokampaj novecaj signaloj povas potenciali fazajn dopaminajn signalojn kaj faciligi kodigon de novaj informoj en longtempan memoron.

Kvankam lastatempaj esploroj montris, ke stimula noveco plibonigas striitan rekompencon-antaŭdiro-eraro (Wittmann et al., 2008), ĉi tiu trovo ne traktas fiziologian hipotezon, ke kunteksta noveco praktikas plibonigan efikon sur postaj rekompencaj signaloj (Lisman kaj Grace, 2005). Testi ĉi tion postulas sendependan manipuladon de la nivelo de noveco kaj rekompenco tia, ke noveco (kaj familiareco) agas kiel portempe plilongigitajn kuntekstojn antaŭajn rekompencojn. Ni esploris la esprimon de strukula modulado de rekompenco-prilaborado en la kunteksto de noveco prezentante romanan stimulon antaŭ la prezentado de notoj, kiuj antaŭdiras rekompencojn. Plue, ni manipulis ambaŭ faktorojn (noveco kaj rekompenco) sendepende; tio permesis al ni distingi iliajn respondajn neŭrajn reprezentojn. Ni prezentis subjektojn kun unu el tri malsamaj fraktalaj bildoj, kiuj kuracis liveradon kun donita probablo (neniu rekompenco (p = 0), malalta (p = 0.4) kaj alta rekompenca probablo (p = 0.8)). Tiamaniere, nia dezajno ankaŭ ebligis al ni esplori ĉu kunteksta noveco influas rekompencajn respondojn estis influita de la probablo de rekompenco. Probabla dependa efiko de noveco sur rekompenco-prilaborado provizus fortan subtenon por la antaŭdiro, ke noveco kaj rekompenco-prilaborado funkcie interagas. En kontrasto, efiko de noveco en rekompenco-rilata cerba agado, kiu estas sendependa de rekompenco-grandeco kaj indico, ke noveco kaj rekompenco dividas cerbajn regionojn kaj produktas aldona neŭra aktiveco sen funkcia interago.

Materialoj kaj Metodoj

temoj

16-plenkreskuloj partoprenis la eksperimenton (9-inoj kaj 7-viraj; aĝa gamo 19-32-jaroj; mezume 23.8, SD = 3.84-jaroj). Ĉiuj subjektoj estis sanaj, dekstraj kaj havis normala aŭ korektita al normala akreco. Neniu el la partoprenantoj raportis historion de neŭrologiaj, psikiatriaj aŭ kuracaj malordoj aŭ iujn ajn aktualajn kuracajn problemojn. Ĉiuj eksperimentoj estis aranĝitaj kun skriba informita konsento de ĉiu subjekto kaj laŭ la loka etika liberigo (University College London, Britujo).

Eksperimenta desegno kaj tasko

La tasko estis dividita en 3-fazojn. En fazo 1, temoj konatiĝis kun aro de 10-bildoj (5 endoma, 5-subĉiela). Ĉiu bildo estis prezentita 10-fojojn por 1000ms kun inter-stimula intervalo (ISI) de 1750 ± 500ms. Subjektoj indikis la endoman aŭ subĉielan statuson per sia dekstra indekso kaj meza fingro. En fazo 2, 3-fraktaj bildoj pariĝis, sub malsamaj probabloj (0, 0.4 kaj 0.8), kun mona rekompenco de 10-penco en kondiĉa sesio. Ĉiu fractala bildo estis prezentita 40-fojojn. Sur ĉiu elprovo, unu el 3-fraktalaj bildoj estis prezentita sur la ekrano por 750ms kaj subjektoj indikis la detekton de la prezentado de stimulo per butona gazetaro. La probabla rezulto (10 aŭ 0-penco) estis prezentita kiel numero sur la ekrano 750ms poste por alia 750ms kaj subjektoj indikis ĉu ili gajnis monon aŭ ne uzante sian indicon kaj mezan fingron. La intertempa intervalo (ITI) estis 1750 ± 500ms. Fine en testo-fazo (fazo 3) la efiko de kunteksta noveco sur rekompencaj respondoj estis determinita en kvar dek-minutaj kunsidoj (figuro 1). Ĉi tie, bildo estis prezentita por 1000ms kaj subjektoj indikis la endoman aŭ subĉielan statuson per siaj dekstraj indaj kaj mezaj fingroj. Respondoj povis fariĝi dum la sceno bildo kaj posta fraktala bildo estis montritaj sur la ekrano (1750 ms entute). La bildo estis aŭ de la familiara aro de bildoj de la fazo 1 (nomataj "familiaraj bildoj") aŭ de alia aro de bildoj, kiuj neniam estis prezentitaj (nomataj "novaj bildoj"). Entute 240-romanaj bildoj estis prezentitaj al ĉiu temo. Poste oni prezentis unu el la 3-fraktalaj bildoj de fazo 2 (nomata antaŭdira rekompenco) por 750ms (ĉi tie, subjektoj estis instrukciitaj ne respondi). Kiel en la dua fazo, la probabilisma rezulto (10 aŭ 0-penco) estis prezentita 750ms poste por alia 750ms kaj subjektoj indikis ĉu ili gajnis monon aŭ ne uzante sian indicon kaj mezan fingron. Respondoj povis fari dum la rezulto estis montrita sur la ekrano kaj dum la posta intertempa intervalo (2500 ± 500 ms entute). ITI estis 1750 ± 500ms. Dum ĉiu sesio, ĉiu fractala bildo estis prezentita 20-fojojn sekvante romanan bildon kaj 20-fojojn sekvante familiaran bildon, rezultigante 120-provojn per sesio. La prezenta ordo de la ses provtipoj estis plene hazarda. Ĉiuj tri eksperimentaj fazoj estis faritaj ene de la MRI-skanilo sed BOLD-datumoj estis akiritaj nur dum la testo-fazo (fazo 3). Temoj estis instrukciitaj respondi kiel eble plej rapide kaj ĝustatempe kaj ke ili pagos siajn gajnojn ĝis £ 20. Partoprenantoj estis diritaj, ke 10-penco restus por ĉiu malĝusta respondo - ĉi tiuj provoj estis ekskluditaj de la analizo. Totalaj gajnoj estis montritaj sur la ekrano nur fine de la 4th-bloko.

figuro 1 

Eksperimenta dezajno

Ĉiuj bildoj estis grize skalitaj kaj normaligitaj al meznombra griza valoro de 127 kaj norma devio de 75. Neniu el la scenoj bildigis homojn aŭ homajn korpopartojn (inkluzive vizaĝojn) en la malfono. Stimuloj estis projektitaj sur la centron de ekrano kaj la subjektoj rigardis ilin tra spegula sistemo muntita sur la ĉefa bobeno de la fMRI-skanilo.

akiraĵo pri fMRI-datumoj

fMRI estis farita sur 3-Tesla Siemens Allegra magneta resonanca skanilo (Siemens, Erlangen, Germanio) per echoa planlingva bildigo (EPI). En la funkcia sesio 48 T2 * pezitaj bildoj po volumo (kovrante tutan kapon) kun sango-oksigeniga nivelo-dependa (BOLD) kontrasto estis akiritaj (matrico: 64 × 64; 48 oblikvaj axaj tranĉaĵoj po volumo angulitaj je −30 ° en la anteroposterior akso; spaca rezolucio: 3 × 3 × 3 mm; TR = 2880 ms; TE = 30 ms). La fMRI-akira protokolo estis optimumigita por redukti susceptibilidad-induktitan BOLD-sentivecajn perdojn en malsuperaj frontaj kaj tempaj lobaj regionoj (Weiskopf et al., 2006). Por ĉiu temo funkciaj datumoj estis akiritaj en kvar skanadaj sesioj enhavantaj 224-volumojn por sesio. Ses pliaj volumoj komence de ĉiu serio estis akiritaj por permesi konstantan magnetan magnetigon kaj poste estis forĵetitaj. Anatomiaj bildoj de la cerbo de ĉiu subjekto estis kolektitaj uzante mult-echoan 3D FLASH por mapi proton-densecon (PD), T1 kaj magnetigan translokadon (MT) ĉe 1mm3 rezolucio (Weiskopf kaj Helms, 2008) kaj per T1-pezita inversiga reakiro preparita EPI (IR-EPI) sekvencoj (spaca rezolucio: 1 × 1 × 1 mm). Aldone, individuaj kampaj mapoj estis registritaj per duobla eco-FLASH-sekvenco (grandeco de matrico = 64 × 64; 64-tranĉaĵoj; spaca rezolucio = 3 × 3 × 3 mm; breĉo = 1 mm; mallonga TE = 10 ms; longa TE = 12.46 ms; longa TE = 1020 ms ; TR = XNUMX ms) por distordo-korektado de la akiritaj EPI-bildoj (Weiskopf et al., 2006). Uzante la 'Kampa ilobreton' (Hutton et al., 2002) kampa mapoj estis taksitaj de la fazdiferenco inter la bildoj akiritaj ĉe la mallonga kaj longa TE.

fMRI-datuma analizo

Antaŭ-prilaborado inkluzivis rearanĝon, senŝanĝan uzadon de unuopaj kampoj, spaca normaligo al la spaco de Montreala Neŭrologia Instituto (MNI) kaj finfine glatigita per 4mm Gaŭsa kerno. La datumoj pri fMRI-serio-serioj estis altaj enirpermesiloj (ekstermitaj = 128-oj) kaj blankigitaj uzante modelon AR (1). Por ĉiu temo statistika modelo estis kalkulita per aplikado de kanona hemodinamika respondfunkcio (HRF) kombinita kun tempo kaj dispersaj derivaĵoj (Friston et al., 1998).

Nia faktoria dezajno 2 × 3 inkluzivis interesajn kondiĉojn de 6, kiuj estis modeligitaj kiel apartaj regresiloj: familiara bildo kun rekompenco-probablo 0, familiara bildo kun rekompenco-probablo 0.4, familiara bildo kun rekompenco-probablo 0.8, romano-bildo kun rekompenco -problemo 0, romano-bildo kun rekompenco-probablo 0.4, romano-bildo kun rekompenco-probablo 0.8. La tempa proksimeco de la rekompenco-antaŭdiroj (t.e. fraktala bildo) kaj la rekompenco rezultigas problemojn por la apartigo de BOLD-signaloj rezultantaj de ĉi tiuj du eventoj. Tial ni modelis ĉiun provon kiel kunmetaĵan eventon, uzante mini-skatoleton, kiu inkluzivis la prezenton de la poŝto kaj la rezulton. Ĉi tiu teknika limigo ne estis problema por nia faktoria analizo, kiu koncentriĝis sur la interago inter novedzeco kaj rekompenco-prilaboro kaj kunekzistantaj rekompencoj kaj novecaj efikoj. Eraraj provoj estis modeligitaj kiel regresoro sen intereso. Por kapti restadejajn moviĝajn artefaktojn ses kovarioj estis inkluzivitaj (la tri rigida korpa traduko kaj tri rotacioj rezultantaj el realinstruado) kiel regresaj sen intereso. Regionaj specifaj kondiĉaj efikoj estis provitaj per uzado de linearaj kontrastoj por ĉiu subjekto kaj ĉiu kondiĉo (unua-nivela analizo). La rezultaj kontrastaj bildoj estis enmetitaj al dua-nivela hazarda-efika analizo. Ĉi tie, la hemodinamikaj efikoj de ĉiu kondiĉo estis taksitaj per 2 × 3-analizo de varianco (ANOVA) kun la "noveco" de la faktoroj (romano, familiara), kaj rekompenco-probablo (0, 0.4, 0.8).

Ni fokusis nian analizon sur anatomie difinitaj regionoj de intereso 3 (striatum, midbrain, kaj hipokampo), kie hipotezitaj interagoj inter novedzino kaj rekompenco bazitaj sur antaŭaj studoj (Lisman kaj Grace, 2005; Wittmann et al., 2005; Bunzeck kaj Duzel, 2006). Por tuteco, ni ankaŭ raportas tutajn cerbajn rezultojn en la suplementa materialo. Ambaŭ striatumaj kaj hipokampaj regionoj de intereso (ROI) estis difinitaj surbaze de la ilo Pick Atlas (Maldjian et al., 2003; Maldjian et al., 2004). Dum la stria ROI inkluzivis la kapon de kaŭdata, kaŭdita korpo kaj putamen, la hipokampa ROI ekskludis la amigdala kaj ĉirkaŭan rinoceron. Finfine, la SN / VTA ROI estis permane difinita, uzante la programon MRIcro kaj la meznombran bildon MT por la grupo. Sur MT-bildoj la SN / VTA distingeblas de ĉirkaŭaj strukturoj kiel hela strio (Bunzeck kaj Duzel, 2006). Oni devas rimarki, ke en primatoj rekompencas respondemaj dopaminergiaj neŭronoj estas disdonataj tra la SN / VTA-komplekso kaj tial taŭgas konsideri la aktivigon de la tuta SN / VTA-komplekso prefere ol koncentri ĝin sur subpartoj (Duzel et al., 2009). Por ĉi tiu celo, rezolucio de 3mm3, kiel uzite en la nuna eksperimento, permesas specimenigi 20-25-voxelojn de la komplekso SN / VTA, kiu havas volumenon de 350 al 400 mm3.

rezultoj

Kondiĉe, subjektoj montris altan precizecon en la taska agado dum la ena / subĉiela diskriminacio (mezume sukcesa indico 97.1%, SD = 2.8% por familiaraj bildoj; mezumo de sukcesa indico 96.8%, SD = 2.1% por novaj bildoj; t15= 0.38, ns), same kiel por la gajno / neniu gajno-diskriminacio ĉe la rezulta tempo (mezumo sukcesa indico 97.8%, SD = 2.3% por venkaj eventoj; mezumo sukcesa indico 97.7%, SD = 2.2% por neniuj venkaj eventoj; t15= 0.03, ns). Subjektoj diskriminacias endoman kaj subĉielan staton pli rapide por familiaraj kompare kun novaj bildoj (mezuma reaga tempo (RT) RT = 628.2 ms, SD = 77.3ms por familiaraj bildoj; meznombro RT = 673.8 ms, SD = 111 ms por novaj bildoj; t15= 4.43, P = 0.0005). Ekzistis neniu RT-diferenco por la venko / neniu gajno-diskriminacio ĉe la rezulta tempo (mezumo RT = 542ms, SD = 82.2 ms por venkaj provoj; meznombro RT = 551 ms, SD = 69 ms por neniuj venkaj provoj; t15= 0.82, ns). Simile, dum kondiĉado ne ekzistis RT-diferencoj por 3-malsamaj fractal bildoj (0.8-probablo: RT = 370.1 ms, SD = 79 ms; 0.4-probablo: RT = 354.4, SD = 73.8ms; 0-probablo: RT = 372.2ms, SD = 79.3ms; F (1,12) = 0.045, ns). Ĉi-lasta RT-analizo ekskludis tri subjektojn pro teknikaj problemoj dum akiro de datumoj.

En la analizo de la fMRI-datumoj, 2 × 3 ANOVA kun faktoroj 'noveco' (romano, familiara) kaj rekompenco-probablo (p = 0, p = 0.4, p = 0.8) montris ĉefan efikon de noveco bilateralmente en la hipokampo (Figuro 2A) kaj dekstra striato, FDR-korektita por la serĉa volumo de la ROI. Simpla ĉefa efiko de rekompenco ('p = 0.8> p = 0') estis observita ene de la maldekstra komplekso SN / VTA (Figuro 2B) kaj ene de bilaterala striato (Figuro 2C). Vidu tablo 1 por ĉiuj aktivigitaj cerbaj regionoj.

figuro 2 

fMRI-rezultoj
tablo 1 

fMRI-rezultoj

Ni ne observis novecon × rekompencon de interago dum korektado por multoblaj provoj laŭ la tuta serĉa volumo de niaj ROI-oj. Tamen, plenuminte post-analizon (t-teston) de la tri pintaj vokaloj montrantaj ĉefan efikon de rekompenco en la striato, ni trovis (ortogonajn) efikojn de noveco kaj ĝian interagadon kun rekompenco: unu voxelo ankaŭ montris ĉefan efikon de Noveleco kaj noveco × rekompenco interaga, dum alia voxel ankaŭ montris ĉefan efikon de noveco.

Kiel montris cifero 2C (meze), en la unua voksel ([8 10 0]; ĉefa efiko de rekompenco F (2,30) = 8.12, P = 0.002; ĉefa efiko de noveco F (1,15) = 7.03, P = 0.02; noveco × rekompenca interago F (2,30) = 3.29, P = 0.05) ĉi tiu efiko estis pelita de pli altaj BOLD-respondoj al provoj kun rekompenca probablo 0.4 kaj antaŭita de nova bildo (post-hoc t-testo: t (15) = 3.48 , P = 0.003). En la dua voxel (2C dekstre) ([−10 14 2] ĉefa efiko de rekompenco F (2,30) = 13.13, P <0.001; ĉefa efiko de novaĵo F (1,15) = 9.19, P = 0.008; ne signifa interago F (2,30) = 1.85, ns) post-hoc t-testoj denove pruvis, ke la ĉefa efiko de noveco estis pelita de diferencoj inter novaj kaj konataj bildoj ĉe la du malaltaj probabloj de rekompenca liverado (t (15) = 2.79, P = 0.014; kaj t (15) = 2.19, P = 0.045, por probablo p = 0 kaj p = 0.4, respektive), (vidu cifero 2C). Kontraŭe, la tria voxelo (2C lasis [−22 4 0] ĉefa efiko de rekompenco, F (2,30) = 9.1, P = 0.001) nek montris ĉefan efikon de noveco (F (1,15) = 2.33, ns) nek interago (F (2,30) = 1.54, ns).

En la mezcerbo, la voksel kun maksimumaj rekompencaj respondoj ([−8 −14 −8], F (2,30) = 12.19, P <0.001), ankaŭ montris tendencon al ĉefa efiko de noveco (F (1,15 , 4.18) = 0.059, P = 2,30) en la foresto de signifa interago (F (0.048) = XNUMX, ns).

diskuto

Novaj bildoj de scenoj plibonigis striajn rekompencajn respondojn eliritajn de postaj kaj senrilataj rekompencaj eventoj (antaŭdirante abstraktajn indicojn kaj liveradon de rekompencoj). Kiel atendite, novaj bildoj ankaŭ aktivigis la hipokampon. Ĉi tiuj trovoj, laŭ nia scio, montras fiziologian antaŭdiron, ke noveca rilata hipokampa aktivado devas praktiki kuntekste plibonigan efikon sur rekompenco-prilaborado en la ventra striatumo (Lisman kaj Grace, 2005; Bunzeck kaj Duzel, 2006).

Pro la ecoj de la BOLD-signalo, la tempa proksimeco de la rekompenco-antaŭdira kvoto kaj rezulta liverado malhelpis taksadon de la efikoj de noveco sur ĉi tiuj eventoj aparte. Prefere ni konsideris la kviet-rezultan sekvencon kiel kunmetitan eventon kaj ni trovis, ke la efiko de noveco sur rekompenc-procesado varias kiel funkcio de la probablo de rekompenco. Plibonigo estis observita nur kiam la probablo de antaŭdirita rekompenco estis malalta (0 aŭ 0.4) kaj forestis pro alta rekompenca probablo (0.8) (Figuro 2C). Estas grave noti, ke ĉi tiu padrono de rezultoj ne povas esti klarigita per sendependaj efikoj de noveco kaj rekompenco en la sama regiono. BOLD-efikoj kaŭzitaj de du funkcie distingaj sed spacaj interkovrantaj neŭralaj populacioj estus aldonaĵoj sendepende de rekompenca probablo kaj tial kondukus al novega efiko ankaŭ en la 0.8-probabla kondiĉo. Tial ĉi tiuj probablecaj dependaj efikoj de novedzeco sur rekompenc-prilaborado argumentas kontraŭ la ebleco, ke ili reflektas poluadon per BOLD-respondoj eliritaj de novaj stimuloj mem. Anstataŭe, la trovoj indikas, ke kunteksta noveco pliigis rekompencan prilaboron per si mem, kvankam nur en la malalta probabla kondiĉo.

Kiel klarigita supre, ni ne povis malambiguigi BOLD-respondojn inter rekompenco (rekompencoj) kaj rekompenco-liverado (rezultoj). Noveco eble unuavice pliigis la prilaboron de ne-rekompencaj rezultoj (neniuj gajnaj provoj). Ĉi tio kongruus kun la fakto, ke ni ne observis ian signifan novecon pri provoj kun alta rekompenco-probablo, ĉar 80% de ĉi tiuj provoj rezultigis rekompencon. Alternative, novedzo eble influis rekompencon por rekompencoj, kiuj antaŭdiris rekompencan liveradon kun malalta probableco (t.e. 0 kaj 0.4). Ambaŭkaze, kunteksta noveco plibonigis cerban reprezentadon por tiuj eventoj, kiuj estis objektive malpli rekompencaj. Plie, la manko de novega modulado de rekompencaj signaloj en la alta probabla kondiĉo verŝajne ne kaŭzas plafonan efikon en rekompenc-prilaborado. Antaŭa laboro montris, ke rekompencaj respondoj en la homa striato estas skale adaptitaj en malsamaj kuntekstoj rezultigante signalon, kiu reprezentas ĉu rezulto estas favora aŭ malfavora en aparta aranĝo (Nieuwenhuis et al 2004). Oni povas do atendi, ke rekompencaj respondoj ankaŭ povu akcepti novigan bonon sub kondiĉoj de alta rekompenco.

Estas bone konstatita, ke la primata cerbo ekscias pri la valoro de malsamaj stimuloj kun rekompenco en klasikaj kondiĉaj eksperimentoj laŭ mezuro de pliigita antaŭĝojo de la rezulto (ekz. Pliigita lekado). En la nuna eksperimento ni mezuris reagajn tempojn dum la kondiĉiga fazo, sed ne trovis diferencojn inter la malsamaj niveloj de prognozaj signaloj. Konsiderante la simplecon de la tasko kaj la rapidon, kun kiu respondis la subjektoj (<375ms por ĉiuj kondiĉoj), ĉi tiu manko de diferenca respondo eble ŝuldiĝas al plafona efiko. Malgraŭ la manko de objektiva konduta mezuro por kondiĉado, la sukcesa uzo de ĉi tiu signalvorto en antaŭaj studoj (ekz Aŭ'Doherty et al., 2003) sugestas, ke subjektoj ankoraŭ formis asocion inter la monbiletoj kaj la malsamaj probablecoj de livera rekompenco.

En antaŭa laboro, rekompencaj signaloj en la striato estis ligitaj al diversaj rekompencoj rilataj al kaj en homoj kaj ne-homaj primatoj inkluzive de probableco (Preuschoff et al., 2006; Tobler et al., 2008), grando (Knutson et al., 2005), necerteco (Preuschoff et al., 2006) kaj agadvaloro (Samejima et al., 2005). Ĉi tiu diverseco de rekompencaj variabloj esprimitaj en la striatumo kongruas bone kun sia rolo kiel limfika / sensimotora interfaco kun kritika rolo en la organizado de cel-direktitaj kondutoj (Wickens et al., 2007). Ambaŭ la SN / VTA kaj la striatum, unu el la ĉefaj projekciaj lokoj de la dopamina sistemo, ankaŭ respondas por rekompenci kaj rekompenci antaŭdirojn en klasikaj kondiĉaj paradigmoj (ekz.Delgado et al., 2000; Knutson et al., 2000; Fiorillo et al., 2003; Knutson et al., 2005; Tobler et al., 2005; Wittmann et al., 2005; D'Ardenne et al., 2008). Laŭ pluraj komputikaj perspektivoj, dopamina transdono originanta de la SN / VTA instruas la striatum pri la valoro de kondiĉitaj stimuloj per antaŭdira erara signalo (Schultz et al., 1997).

Kvankam en klasikaj studaj kondiĉoj rekompenco kaj ne-rekompenco-esprimoj esprimitaj en la striatumo ne ĉiam havas evidentajn kondutajn konsekvencojn (Aŭ'Doherty et al., 2003; den Ouden et al., 2009), fMRI-studoj sisteme montris, ke ŝanĝoj en striata BOLD-agado rilatas al prognozaj eraroj rilataj al valoro de elektaj elektoj, kiel karakterizitaj de komputaj modeloj taŭgaj al kondutaj datumoj (Aŭ'Doherty et al., 2004; Pessiglione et al., 2006). Striatal-stataj valorprezentoj ne ligitaj al ago eble rilatas al signaloj de rekompenco-havebleco, kiuj estas tradukitaj al preparaj respondoj, ekzemple alproksimiĝo aŭ viglaj efikoj kiel vidite en pavloviana-instrumenta translokigo (PIT) (Kardinalo et al., 2002; Talmi et al., 2008). Niaj datumoj sugestas, ke noveco modulas tiajn ŝtatvalorajn reprezentadojn pliigante la atendon de rekompenco aŭ la respondon al ne-rekompencaj rezultoj. La sekvo de ĉi tiu interagado inter noveco kaj rekompenco povus esti la generacio de senkondiĉaj preparaj respondoj. En la reala mondo, tiaj respondoj kondukus al plibonigita alproksimiĝo kiam noveco estas identigita kun kaŝejo (Wittmann et al., 2008) aŭ hazarda esplorado de la medio kiam noveco estas detektita sed ne asociita kun specifa signo kiel observite en la besta literaturo (Hokoj kaj Kalivas, 1994). Ĉi tiu vido ankaŭ konformas al influaj komputaj modeloj (Kakade kaj Dayan, 2002).

Unu kritika strukturo, kiu probable implikas la kontekste plibonigitajn rekompencajn respondojn en la striatumo, estas la hipokampo. Kiel en antaŭaj studoj (Tulving et al., 1996; Strange et al., 1999; Bunzeck kaj Duzel, 2006; Wittmann et al., 2007) ni montras, ke kunteksta noveco aktivigis la hipokampon pli forte ol familiareco. Konsiderante siajn fortajn (nerektajn) projekciojn al la SN / VTA, ni sugestas, ke ĉi tiu strukturo estas la verŝajna fonto por novega signalo al la dopaminergia sistemo de la cerbo (Lisman kaj Grace, 2005; Bunzeck kaj Duzel, 2006). La dopaminérgica cerbo ankaŭ ricevas enigon de aliaj cerbaj areoj kiel la prefrontal-kortekso, kiu povus ankaŭ transdoni novajn signalojn al ĝi (Kampoj et al., 2007). Tamen, konsiderante la evidentaĵojn, ni konsideras la hipokampon kiel la plej verŝajnan kandidaton por veturado pri novedzinaj malinstigoj de dubonaj dopaminaj neŭronoj, kiuj klarigos amplifon de striataj rekompencaj signaloj en la kunteksto de noveco. Aliflanke, la probabla dependiga modereco de la kunteksta novega efiko, siavice, eble originis de la antaŭfronta kortekso (PFC). Fiziologiaj studoj montras, ke pliigi PFC-veturadon al SN / VTA-neŭronoj plibonigas dopaminergian moduladon de PFC-regionoj nur sed ne dopaminergian enigon al la ventra striatum (Margolis et al., 2006). Per tia mekanismo, PFC povis reguligi la probablajn dependajn kuntekstajn efikojn de noveco sur SN / VTA kaj ventra striatala rekompenco-reprezentado.

Por fini, la nunaj rezultoj montras, ke kunteksta noveco pliigas rekompencan prilaboron en la striatumo en respondo al senrilataj indikoj kaj rezultoj. Ĉi tiuj trovoj kongruas kun la prognozoj de polisináptica vojo-modelo (Lisman kaj Grace, 2005) en kiuj hipokampaj novecaj signaloj disponigas mekanismon por la kunteksta regulado de saleca atribuo al senrilataj eventoj.

Suplementa Materialo

Supp1

Alklaku ĉi tie por vidi.(168K, dokumento)

Dankoj

Ĉi tiu laboro estis subtenita de Wellcome Trust Project Grant (al ED kaj RJD 81259; www.wellcome.ac.uk; RD estas subtenata de subvencio de bonfara programo. MG havas Marie Curie Kunularon (www.mariecurie.org.uk). KES agnoskas subtenon de la NEUROCHOICE SystemsX.chh-projekto.

Referenca Listo

  • Aron AR, Shohamy D, Clark J, Myers C, Gluck MA, Poldrack RA. Homa mezkorpa sentiveco al kognitiva retrosciigo kaj necerteco dum klasika lernado. J Neŭrofiziol. 2004; 92: 1144 – 1152. [PubMed]
  • Berridge KC, Robinson TE. Sperta rekompenco. Tendencoj Neŭrosci. 2003; 26: 507 – 513. [PubMed]
  • Bunzeck N, Duzel E. Absoluta novigado de stimula noveco en la homa substanca nigra / VTA. Neŭrono. 2006; 51: 369 – 379. [PubMed]
  • Kardinalo RN, Parkinson JA, Halo J, Everitt BJ. Emocio kaj instigo: la rolo de la amigdalo, ventra striato kaj prefrontala kortekso. Neŭroska Biobehav-Rev. 2002; 26: 321-352. [PubMed]
  • D'Ardenne K, McClure SM, Nystrom LE, Cohen JD. BOLD-respondoj reflektantaj dopaminergajn signalojn en la homa ventrala tegmenta areo. Scienco. 2008; 319: 1264 – 1267. [PubMed]
  • Delgado MR, Nystrom LE, Fissell C, Noll DC, Fiez JA. Spurado de la hemodinamikaj respondoj al rekompenco kaj puno en la striato. J Neurophysiol. 2000: 84: 3072-3077. [PubMed]
  • den Ouden HE, Friston KJ, Daw ND, McIntosh AR, Stephan KE. Duobla rolo por antaŭdira eraro en asocieca lernado. Cereba kortekso. 2009; 19: 1175 – 1185. [PMC libera artikolo] [PubMed]
  • Duzel E, Bunzeck N, Guitart-Masip M, Wittmann B, Schott BH, Tobler PN. Funkcia bildado de la homa dopaminérgica cerbo. Tendencoj Neŭrosci. 2009 [PubMed]
  • Kampoj HL, Hjelmstad GO, Margolis EB, Nicola SM. Neŭralaj ventraj areaj neŭronoj en lernita apetita konduto kaj pozitiva plifortigo. Annu Rev Neurosci. 2007; 30: 289 – 316. [PubMed]
  • Fiorillo KD, Tobler PN, Schultz W. Diskreta kodigo de rekompenco kaj necerteco de dopamina-neŭronoj. Scienco. 2003; 299: 1898-1902. [PubMed]
  • Floresco SB, West AR, Ash B, Moore H, Grace AA. Loka modulado de dopamina neŭron-pafo reguligas malsame regulan tonikan kaj fazan dopaminan dissendon. Nat Neurosci. 2003; 6: 968 – 973. [PubMed]
  • Frank MJ, Seeberger LC, O'Reilly RC. Per karoto aŭ per bastono: kognitiva plifortiga lernado en parkinsonismo. Scienco. 2004; 306: 1940 – 1943. [PubMed]
  • Friston KJ, Fletcher P, Josephs O, Holmes A, Rugg MD, Turner R. FMRI-rilataj eventoj: karakterizantaj diferencajn respondojn. Neuroimage. 1998; 7: 30 – 40. [PubMed]
  • Grace AA, Bunney BS. Intraĉela kaj eksterĉela elektrofiziologio de nigraj dopaminergiaj neŭronoj – 1. Identigo kaj karakterizado. Neŭroscienco. 1983; 10: 301-315. [PubMed]
  • Hokoj MS, Kalivas PW. Partopreno de dopamina kaj ekscitita aminoacido-transdono en novec-induktita motora agado. J Pharmacol Exp Ther. 1994; 269: 976 – 988. [PubMed]
  • Hutton C, Bork A, Josephs O, Deichmann R, Ashburner J, Turner R. Bildregula distordo en fMRI: Kvanta takso. Neuroimage. 2002; 16: 217 – 240. [PubMed]
  • Kakade S, Dayan P. Dopamine: ĝeneraligo kaj gratifikoj. Neŭra Reto. 2002; 15: 549 – 559. [PubMed]
  • Knutson B, Westdorp A, Kaiser E, Hommer D. FMRI-bildigo de cerba agado dum tasko de mona prokrasta tasko. Neuroimage. 2000; 12: 20 – 27. [PubMed]
  • Knutson B, Taylor J, Kaufman M, Peterson R, Glover G. Distribuita neŭra reprezentado de atendita valoro. J Neŭroscio. 2005; 25: 4806 – 4812. [PubMed]
  • Lisman JE, Grace AA. La hipokampo-VTA buklo: kontrolo de eniro de informoj en longtempan memoron. Neŭrono. 2005; 46: 703 – 713. [PubMed]
  • Ljungberg T, Apicella P, Schultz W. Respondoj de simio-dopamino-neŭronoj dum lernado de kondutaj reagoj. J Neurophysiol. 1992: 67: 145-163. [PubMed]
  • Maldjian JA, Laurienti PJ, Burdette JH. Precentra girusa diskreteco en elektronikaj versioj de la Talairach-atlaso. Neuroimage. 2004; 21: 450 – 455. [PubMed]
  • Maldjian JA, Laurienti PJ, Kraft RA, Burdette JH. Aŭtomata metodo por neuroanatomaj kaj citoaritectitekturaj atlas-bazitaj pridemandadoj de fMRI-datumoj. Neuroimage. 2003; 19: 1233 – 1239. [PubMed]
  • Margolis EB, Lock H, Chefer VI, Shippenberg TS, Hjelmstad GO, Fields HL. Kappa-opioidoj kontrolas selektive dopaminergajn neŭronojn projekciantajn al la prefrontal-kortekso. Proc Natl Acad Sci Usono A. 2006; 103: 2938 – 2942. [PMC libera artikolo] [PubMed]
  • O'Doherty J, Dayan P, Schultz J, Deichmann R, Friston K, Dolan RJ. Disociataj roloj de ventra kaj dorsa striato en instrumenta kondiĉado. Scienco. 2004: 304: 452-454. [PubMed]
  • O'Doherty JP, Dayan P, Friston K, Critchley H, Dolan RJ. Modelaj temporaj diferencoj kaj rekompenco-rilata lernado en la homa cerbo. Neŭrono. 2003; 38: 329 – 337. [PubMed]
  • Pessiglione M, Seymour B, Flandin G, Dolan RJ, KD Frith. Antaŭdiroj de dopamina-dependaj eraroj fundamentas rekompencan serĉadon en homoj. Naturo. 2006; 442: 1042 – 1045. [PMC libera artikolo] [PubMed]
  • Preuschoff K, Bossaerts P, Quartz SR. Neŭra diferenco de atendata rekompenco kaj risko en homaj subkortikaj strukturoj. Neŭrono. 2006; 51: 381 – 390. [PubMed]
  • Samejima K, Ueda Y, Doya K, Kimura M. Reprezento de valor-specifaj rekompencaj valoroj en la striatumo. Scienco. 2005; 310: 1337 – 1340. [PubMed]
  • Schultz W, Dayan P, Montague PR. Substara neŭtrala antaŭdiro kaj rekompenco. Scienco. 1997; 275: 1593-1599. [PubMed]
  • Stranga BA, Fletcher PC, Henson RN, Friston KJ, Dolan RJ. Apartigante la funkciojn de homa hipokampo. Proc Natl Acad Sci Usono A. 1999; 96: 4034 – 4039. [PMC libera artikolo] [PubMed]
  • Talmi D, Seymour B, Dayan P, Dolan RJ. Homa pavloviana-instrumenta translokigo. J Neŭroscio. 2008; 28: 360 – 368. [PMC libera artikolo] [PubMed]
  • Tobler PN, Fiorillo KD, Schultz W. Adapta kodado de rekompenca valoro de dopaminaj neŭronoj. Scienco. 2005; 307: 1642 – 1645. [PubMed]
  • Tobler PN, Christopoulos GI, O'Doherty JP, Dolan RJ, Schultz W. Neŭronaj distordoj de rekompenca probableco sen elekto. J Neŭroscio. 2008; 28: 11703 – 11711. [PMC libera artikolo] [PubMed]
  • Tulving E, Markowitsch HJ, Craik FE, Habib R, Houle S. Noveligo kaj familiaraj aktivadoj en PET-studoj pri memora kodado kaj retrovo. Cereba kortekso. 1996; 6: 71 – 79. [PubMed]
  • Weiskopf N, Helms G. Multi-parametra mapado de la homa cerbo ĉe 1mm-rezolucio en malpli ol 20-minutoj; ISMRM 16; Toronto, Kanado. 2008
  • Weiskopf N, Hutton C, Josephs O, Deichmann R. Optimaj EPI-parametroj por redukto de susceptibilidad-induktitaj BOLD-sentivecaj perdoj: tute-cerba analizo ĉe 3 T kaj 1.5 T. Neuroimage. 2006; 33: 493 – 504. [PubMed]
  • Wickens JR, Horvitz JC, Costa RM, Killcross S. Dopaminergiaj mekanismoj en agoj kaj kutimoj. J Neŭroscio. 2007; 27: 8181 – 8183. [PubMed]
  • Wittmann BC, Bunzeck N, Dolan RJ, Duzel E. Antaŭvidado de novedzinaj varboj rekompencas sistemon kaj hipokampon dum antaŭenigado de memoro. Neuroimage. 2007; 38: 194 – 202. [PMC libera artikolo] [PubMed]
  • Wittmann BC, Daw ND, Seymour B, Dolan RJ. Striatala agado substrekas nov-bazitan elekton en homoj. Neŭrono. 2008; 58: 967 – 973. [PMC libera artikolo] [PubMed]
  • Wittmann BC, Schott BH, Guderian S, Frey JU, Heinze HJ, Duzel E. Reward-rilata FMRI-aktivigo de dopaminergic midbrain estas asociita kun plibonigita hipokampo-dependa longtempa memoro-formado. Neŭrono. 2005; 45: 459 – 467. [PubMed]