Sentiveco de la kerno accumbens al malobservoj en atendo de rekompenco (2007)

Neuroimage. 2007 Jan 1; 34 (1): 455-61. Epub 2006 Okt 17.

Spicer J, Galvano A, Hare TA, Voss H, Glover G, Casey B.

fonto

La Sackler Instituto por Disvolva Psikobiologio, Weill Cornell Medicina Kolegio de Universitato Cornell, 1300 York Avenue, Box 140, Nov-Jorko, NY 10021, Usono.

abstrakta

Ĉi tiu studo ekzamenis, ĉu ventraj frontostriaj regionoj malsame kodas atenditajn kaj neatenditajn rekompencajn rezultojn. Ni parametrize manipulis la probablon de rekompenco kaj ekzamenis la neŭra respondo al rekompenco kaj nereprezento por ĉiu probabla kondiĉo en la ventra striato kaj la orbitofrontala kortekso (OFC). Per malfruaj provoj de la eksperimento, subjektoj montris pli malrapidajn kondutajn respondojn por la kondiĉo kun la plej malalta probablo de rekompenco, relative al la kondiĉo kun la plej alta probablo de rekompenco. Je la neŭra nivelo, ambaŭ la kerno accumbens (NAcc) kaj OFC montris pli grandan aktivadon al rekompencitaj parencoj al nerekomenditaj provoj, sed la akciuloj ŝajnis plej sentemaj al perfortoj en atenditaj rekompencaj rezultoj. Ĉi tiuj datumoj sugestas apartajn rolojn por frontostriaj cirkvitoj en antaŭdiro de rekompenco kaj en respondo al malobservoj en atendoj.

 

Enkonduko

Formi precizajn antaŭdirojn kaj detekti malobservojn en atendoj pri venontaj rekompencaj eventoj estas esenca ero de cel-direktita konduto. Nehomaj primataj kaj homaj bildaj studoj sugestas, ke riĉaj frontostriataj regionoj kun dopamino estas implikitaj en formado de antaŭdiroj pri estontaj rekompencaj rezultoj kaj optimumigante konduton laŭe. La neŭraj mekanismoj de rekompenca prognozo-eraro - reprezento de la diferenco inter la reala kaj atendata rekompenco (Schultz et al, 1997) - estis studitaj ĉe nehomaj primatoj laŭ atendataj kaj neatenditaj kompensoj kaj / aŭ preterlasoj de rekompenco (Hollerman et al, 1998, Leono kaj Shadlen, 1999; Tremblay kaj Schultz, 1999). La nuna studo uzis simplan spacan malfruan kongruan ekzemplan taskon, similan al unu uzata antaŭe kun nehomaj primatoj (Fiorillo et al, 2003), kiu manipulis la probablon de rekompenca rezulto, por ekzameni neŭralajn respondojn al atendataj kaj neatenditaj rekompencoj.

Konverĝa indico implicas la dopaminan sistemon kiel kritika por prognozado kaj rekompenco-prilaborado (Olds kaj Milner, 1954; Montague et al, 2004, Schultz, 2002 por revizio). Studoj pri nehomaj primatoj montris, ke dopaminaj neŭronoj respondas al neatenditaj primaraj rekompencoj kaj eventuale al la stimuloj, kiuj antaŭdiras tiujn rekompencojn (Mirencowicz & Schultz, 1994, Tobler et al, 2005). Dopaminaj neŭronoj en la ventra tegmenta areo (VTA) de la simio ekbruliĝos en respondo al primara rekompenco, kiu estas antaŭvidita (aŭ antaŭdirita kun malalta probablo) pli ol al rekompenco tute antaŭdirita (Fiorillo et al, 2003;Tobler et al, 2005). Al la inversa, la aktiveco de la samaj neŭronoj estas subpremita kiam atendita rekompenco ne liveras rilate al atendita preterlaso de rekompenco (Fiorillo et al, 2003; Tobler et al, 2005). Tiel, dopaminaj neŭronoj kodas prognozan eraron reprezentante la diferencon inter la reala kaj antaŭdirita rezulto (Schultz et al, 1997; Tobler et al, 2005), tia ke neatendita prezento de rekompenco rezultigas pliigitan aktivecon kaj neatenditajn omisiojn de rekompenco rezultigas malpliigon de agado.

Ŝanĝoj en dopamina pafo en respondo al ŝanĝoj en rekompenco estas paraleligitaj per ŝanĝoj en konduto. Studoj pri nehomaj primatoj trovis, ke simio pliigos sian antaŭvidan lekadon kiel funkcio de la probableco kun kiu kondiĉita stimulo estas asociita kun posta senkondiĉa stimulo (liverado de suko). Tiel, stimuloj reprezentantaj altan probablecon de posta suko-liverado provokas pli antaŭvidan likadon (Fiorillo et al., 2003).

Reciprokaj anatomiaj ligoj ekzistas inter regionoj asociitaj kun cel-direktita konduto (ekz. Prefrontal-kortekso) kaj tiuj asociitaj kun pli aŭtomataj apetitivaj kondutoj (ekz. Ventral striatum) kie prognozoj povus esti kalkulitaj (Shultz et al., 1997; Haber et al., 2003). Ĉi tiuj regionoj estas multe inervataj de dopamino per projekcioj de neŭromatomaj dopaminaj neŭronoj kaj ĉi tiuj ligoj povus formi funkcian neŭroatomikan cirkviton, kiu subtenas optimumigon de konduto favore al agoj, kiuj rezultigas plej grandajn profitojn.

Lastatempe, studoj de homa funkcia magneta resonanca bildigo (fMRI) implicis du regionojn de ĉi tiu cirkvito, la kerno acumbens kaj orbitofrontal-kortekso, en la prezento de antaŭdira eraro. Ekzemple, neantaŭvideblaj sekvencoj de suko kaj akvo-liverado estis montritaj provoki pliigitan aktivecon en la NAcc relative al antaŭvidebla liverado (Berns et al, 2001). Antaŭdiro eraro bazita sur temporal (McClure et al, 2003) kaj stimulo (O'Doherty et al, 2003 O'Doherty et al, 2004) seksperfortadoj ankaŭ aktivigas ventralan striatumon.

La rolo de OFC en rekompenca antaŭdiro estis malpli klara. Dum iuj studoj raportis sentivecon de la OFC sub kondiĉoj de antaŭdira eraro (Berns et al., 2001; Aŭ'Doherty et al., 2003; Ramnini et al., 2004; Dreher et al., 2005) aliaj ne havas (McClure et al., 2003; Aŭ'Doherty et al., 2004; Delgado et al., 2005). Studoj kun malpli emfazo de antaŭdira eraro montras pli grandan OFC-aktivigon al favora rilata al malfavoraj rezultoj (O'Doherty et al, 2001; Elliott et al, 2003; Galvan et al, 2005) en studoj pri rekompenca valoro (Gottfried et al, 2003), kaj valenco (Cox et al, 2005; O'Doherty, 2000 O'Doherty, 2003 O'Doherty, 2004). Ĵus, Kringelbach kaj Ruloj (2004) integris la neuroimage kaj neuropsikologian literaturon por enkalkuli diversajn funkciojn de la orbitofrontala kortekso. Ili sugestas mez-flankan distingon kaj antaŭan-postan distingon. La meza kaj flanka orbitofrontala kortekso monitoras rekompencon kaj taksadon de punantoj respektive (ekz O'Doherty et al, 2001 ; Rolls et al, 2003). La antaŭa orbitofrontala kortekso estas pensita esti pli implikita en la reprezentado de abstraktaj plifortigiloj (O'Doherty et al, 2001) super pli simplaj rilataj al gusto (ekz De Araujo et al, 2003) kaj doloro (ekz Craig et al, 2000).

Ĉi tiuj ventraj frontostriaj regionoj havas lastatempe (Knutson et al, 2005) estis asociita kun la reprezentado de atendita valoro (la produkto de atendata probableco kaj grando de rezulto) dum antaŭvidi rekompencon. Konsiderante la elegantan, sed kompleksan, dezajnon, kiu inkluzivis 18-sciojn reprezentantajn multajn kombinaĵojn de grando, probableco kaj / aŭ valenco, manko de statistika potenco malhelpis la aŭtorojn ekzameni cerban aktivadon rilatan al instigo. rezultoj. En la aktuala studo, ni uzis tri apartajn signojn, ĉiu el kiuj estis asociita kun 33%, 66% aŭ 100% rekompenco por ĝustaj provoj. La emfazo de ĉi tiu studo estis sur rekompenco rezulto prefere ol rekompenco antaŭvidi, por ekzameni sentivecon ĉe la neŭra nivelo al malobservoj en rekompencaj atendoj, anstataŭ antaŭvidi rekompencon antaŭ la rezulto. Ĉi tiu analizo estas kritika por kompreni antaŭvideblecon de rekompencoj pro la ŝanĝoj en dopamina pafo, kiuj okazas ĉe rekompenco rezulto kiam perfortoj de antaŭviditaj atendoj okazas (Fiorillo et al, 2003) .La apriora prognozoj pri la akuzitoj kaj la OFC-respondo al atendata kaj neatendita mona rekompenco baziĝis sur antaŭa bildiga laboro implikanta ĉi tiujn regionojn en rekompenco-prilaborado (Knutson et al, 2001; 2005; O'Doherty et al, 2001; Galvan et al, 2005). Ni uzis simplan spacan malfruan matĉon por ekzameni paradigmon similan al tiu uzata de Fiorillo et al (2003) en elektrofisiologiaj studoj pri dopaminaj neŭronoj en nehomaj primatoj. Ni hipotezis, ke agado en la ventrala striatumo, precipe la NAcc, pliiĝus kiam neatendita rekompenco estis liverita kaj malpliiĝus kiam atendita rekompenco ne estis liverita. Konduto atendis paraleligi ĉi tiujn ŝanĝojn kun pli rapidaj mezaj reagaj tempoj al antaŭdiroj rekompencas plej ofte, sed pli malrapidaj reagaj tempoj al la kvara antaŭdiro de rekompenco malpli ofte. Plue, ni hipotezis, ke la OFC estus sentema al rezulto de rekompenco (rekompenco aŭ ne), sed ke la akuzantoj plej sentos al ŝanĝoj en rekomendaj antaŭdiroj. Ĉi tiuj hipotezoj baziĝis en raportoj de antaŭaj bildaj studoj (Galvan et al 2005, en gazetaro) kaj ne-homa primata laboro montranta pli grandan struktrian implikiĝon en rekompencaj parametroj, relative al la rekompenco-ŝlosita agado de la OFC (Schultz, et al, 2000) kaj sur la fiksita prefere ol varia kvanto de rekompenco tra la probablecaj kondiĉoj.

metodoj

partoprenantoj

Dek du dekstraj sanaj plenkreskuloj (7-inoj), aĝaj 19-27 (averaĝa aĝo 24 jaroj), estis inkluditaj en la fMRI-eksperimento. Temoj ne havis historion de neŭrologia aŭ psikiatria malsano kaj ĉiuj subjektoj estis konsentitaj al la Institucia Revizia Estraro aprobita studo antaŭ partopreno.

Eksperimenta Tasko

Partoprenantoj estis provitaj uzante modifitan version de prokrastita respondo du-elektebla tasko priskribita antaŭe (Galvan et al, 2005) en studo pri fMRI pri okazaĵo (figuro 1). En ĉi tiu tasko, tri kvereloj ĉiu estis asociita kun aparta probablo (33%, 66% kaj 100%) akiri fiksan sumon de rekompenco. Subjektoj estis instrukciitaj premi aŭ sian indekson aŭ mezan fingron por indiki la flankon sur kiu aperinta okazo kiam oni petis lin, kaj respondi kiel eble plej rapide sen fari erarojn. Unu el tri pirataj bildstriaj bildoj estis prezentita hazarde en la maldekstra aŭ dekstra flanko de centrita fiksaĵo por 1000 msec (vidu figuro 1). Post 2000 msec malfruo, subjektoj estis prezentitaj kun respondo de du trezoraj kestoj ambaŭflanke de la fiksaĵo (2000 msec) kaj instrukciis premi butonon per sia dekstra indekso se la pirato estis maldekstre de la fiksaĵo aŭ ilia dekstra meza fingro se la pirato estis dekstre de la fiksaĵo. Post alia 2000 msec prokrasto, ĉu rekompenca rekompenco (bildstriaj moneroj) aŭ malplena trezora brusto estis prezentita en la centro de la ekrano (1000 msec) surbaze de rekompenca probablo de tiu provtipo. Estis 12 sek-intertempa intertempo (ITI) antaŭ la komenco de la sekva proceso.

figuro 1  

Tasko-Projekto

Ekzistis tri rekompencproblemoj: 33%, 66% kaj 100% rekompenco-probablo. En la 33% -kondiĉo, subjektoj estis rekompencitaj sur 33% de la provoj kaj neniu rekompenco (malplena trezorejo) okazis ĉe la aliaj 66% de la provoj en tiu kondiĉo. En la 66% -kondiĉo, subjektoj estis rekompencitaj sur 66% de provoj kaj neniu rekompenco okazis por la aliaj 33% de provoj. En la 100% -kondiĉo, subjektoj estis rekompencitaj pro ĉiuj ĝustaj provoj.

Subjektoj estis garantiitaj $ 50 por partopreno en la studo kaj oni diris, ke ili povus gajni ĝis $ 25 pli, depende de rendimento (kiel indeksita per reaga tempo kaj precizeco) en la tasko. Stimuli estis prezentita kun la integra funkcia bildiga sistemo (IFIS) (PST, Pittsburgh) uzanta LCD-vidbendan ekranon en la portado de la MR-skanilo kaj fibro-optika respondo-kolektadaparato.

La eksperimento konsistis el kvin kuroj de 18-provoj (6 ĉiu el 33%, 66% kaj 100% probableco de rekompenco-provaj specoj), kiuj daŭris 6 min kaj 8 s ĉiu. Ĉiu kuro havis 6-provojn de ĉiu rekompenca probableco prezentita en hazarda ordo. Ĉe la fino de ĉiu kuro, subjektoj estis ĝisdatigitaj pri kiom da mono ili gajnis dum tiu kuro. Antaŭ komenci la eksperimenton, subjektoj ricevis detalajn instrukciojn, kiuj inkluzivis familiariĝon kun la stimuloj uzataj kaj plenumis praktikadon por certigi taskon. Oni diris al ili, ke rilato ekzistas inter la monbiletoj kaj monaj rezultoj, sed la ekzakta naturo de tiu rilato ne estis rivelita.

Bildo Akiraĵo

Bildigo estis farita per 3T Ĝenerala Elektra MRI-skanilo per kvadratura kapo-bobeno. Funkciaj skanadoj estis akiritaj per spiralo en kaj eksteren sekvenco (Glover & Thomason, 2004). La parametroj inkluzivis TR = 2000, TE = 30, 64 X 64-matricon, 29 5-mm koronajn tranĉaĵojn, 3.125 X 3.125-mm en-ebena rezolucio, klakas 90 °) por 184 ripetoj, inkluzive de kvar forĵetitaj akiroj komence de ĉiu kuro. Anatomiaj T1-pezaj sur-ebenaj skanadoj estis kolektitaj (TR = 500, TE = min, 256 X 256, FOV = 200 mm, 5-mm tranĉa dikeco) en la samaj lokoj kiel la funkciaj bildoj krom 3-D-datuma aro de alta distingivo SPGR-bildoj (TR = 25, TE = 5, 1.5 mm tranĉa dikeco, 124 tranĉaĵoj).

Bilda Analizo

La Brainvoyager QX (Brain Innovations, Maastricht, Nederlando) programaro estis uzata por realigi hazardan efikon analizon de la bildigaj datumoj. Antaŭ analizo, la jenaj antaŭprocesaj procedoj estis faritaj sur la krudaj bildoj: 3D-movada korekto por detekti kaj korekti por malgrandaj kapaj movadoj per spaco-vicigo de ĉiuj volumoj al la unua volumo per rigida korpa transformo, tranĉa skana tempo-korekto (uzante sinc-interpolaĵon), lineara tendenco-forigo, alttempa tempodaŭra filtrado por forigi ne-linearajn drivojn de 3 aŭ malpli da cikloj per tempokurso, kaj spacajn datumojn glatigante uzantan Gaŭsan kernon kun 4mm FWHM. Laŭtaksa rotacio kaj tradukaj movadoj neniam superis 2mm por subjektoj inkluzivitaj en ĉi tiu analizo.

Funkciaj datumoj estis ko-registritaj al la anatomia volumo per vicigo de respondaj punktoj kaj manaj ĝustigoj por akiri optimuman taŭgecon per vida inspektado kaj tiam estis transformitaj al Talairach-spaco. Dum Talairach-transformado, funkciaj vokaloj estis interpolitaj ĝis rezolucio de 1 mm3 por vicigo celoj, sed la statistikaj sojloj baziĝis sur la originala akira voxel-grandeco. La kerno acumbens kaj orbita frontala kortekso estis difinitaj per tuta cerbo senvoĉa GLM kun rekompenco kiel la primara antaŭdiro (vidu sube) kaj tiam lokalizitaj de Talairach-koordinatoj ligitaj kun referenco al la cerbo Atvernoy de Duvernoy (Talairach & Tournoux, 1988; Duvernoy, 1991).

Statistikaj analizoj de la bildigaj datumoj estis faritaj sur la tuta cerbo per ĝenerala lineara modelo (GLM) konsistanta el 60 (5 prizorgas X 12-subjektojn) z-normaligitajn funkciajn kurojn. La primara prognozilo estis rekompenco (rekompenco kontraŭ nerekomendaj provoj) tra ĉiuj rekompencaj probabloj ĉe rekompenca rezulto. La prognozilo estis akirita per konvertiĝo de ideala skatolo-respondo (supozante valoron 1 por la volumo de taska prezento kaj volumo de 0 por ceteraj tempopunktoj) kun lineara modelo de la hemodinamika respondo (Boynton et al, 1996) kaj kutimis konstrui la dezajnan matricon de ĉiu tempa kurso en la eksperimento. Nur ĝustaj provoj estis inkluzivitaj kaj apartaj prognoziloj estis kreitaj por eraraj provoj. Post-kontrastaj analizoj pri la regionaj interesoj tiam estis faritaj surbaze de t-testoj sur la beta-pezoj de prognozistoj. Monte Carlo-simuladoj estis aranĝitaj per la programo AlphaSim ene de AFNI (Cox, 1996) determini taŭgajn sojlojn por atingi korektitan alfa-nivelon de p <0.05 surbaze de serĉaj volumoj de ĉirkaŭ 25,400 mm3 kaj 450 mm3 por la orbita fronta korto kaj kerno accumbens, respektive. Procentaj ŝanĝoj en la MR-signalo rilate al bazlinio (intervalo tuj antaŭ la 20-sekunda provo) en la kerno accumbens kaj orbita fronta korto estis kalkulitaj uzante event-rilatan averaĝon super signife aktivaj vokseloj akiritaj de la kontrastaj analizoj.

La tuta cerba GLM baziĝis sur 50-rekompencaj provoj per subjekto (n = 12) por entute 600-provoj kaj 30-nerekomendaj provoj per temo (n = 12) por entute 360-nerekomendaj provoj tra la tuta eksperimento. Postaj kontrastoj pri la rekompencproblemoj konsistis el diversaj nombroj da rekompenco kaj neniuj rekompencprocesoj. Por la 100% rekompenca probablo-kondiĉo estis 6 rekompencaj provoj per kuro (5) per temo (12) por entute 360-rekompencaj provoj kaj neniuj nerekomendaj provoj. Por la 66% rekompenca probablo-kondiĉo estis 4-rekompencaj provoj per kuro (5) per temo (12) por entute 240-rekompencaj provoj kaj 120-nerekomendaj provoj. Por la 33% rekompenca probablo-kondiĉo, estis 2-rekompencaj provoj per kuro (5) per temo (12) por entute 120-rekompencaj provoj kaj 240-nerekomendaj provoj.

rezultoj

Informoj pri konduto

La efikoj de rekompenca probableco kaj tempo sur tasko estis testitaj per 3 (33%, 66%, 100%) x 5 (kuras 1 – 5) ripetaj mezuroj de analizo de varianco (ANOVA) por la dependaj variabloj de averaĝa reaga tempo (RT) ) kaj signifas precizecon.

Ne estis ĉefaj efikoj aŭ interagoj de probablo de rekompenco (F [2,22] =. 12, p <.85) tempo en tasko (F [4,44] = 2.02, p <.14) aŭ rekompenco-probablo X-tempo pri tasko (F [8, 88] = 1.02, p <.41) por averaĝa precizeco. Ĉi tio estis atendenda, ĉar la precizeco de partoprenantoj atingis preskaŭ plafonajn nivelojn por ĉiuj probabloj de la eksperimento (33% -kondiĉo = 97.2%; 66% -kondiĉo = 97.5%; 100% -kondiĉo = 97.7%).

Estis signifa interago inter probablo de rekompenco kaj tempo en tasko (F [8,88] = 3.5, p <.01) sur averaĝa RT, sed neniuj ĉefaj efikoj de tempo en tasko (F [4,44] = .611 , p <0.59) aŭ probablo de rekompenco (F [2,22] = 2.84, p <0.08). Post-hoc t-testoj de la signifa interago montris, ke estas signifa diferenco inter la kondiĉoj de rekompenco de 33% kaj 100% dum malfruaj provoj de la eksperimento (kuro 5) (t (11) = 3.712, p <.003), kun pli rapida averaĝa RT por la 100% rekompenca probablo-kondiĉo (mezumo = 498.30, sd = 206.23) rilate al la 33% -kondiĉo (mezumo = 583.74, sd = 270.23).

La diferenco en mezuma tempo de reago inter la 100% kaj 33%-kondiĉoj pliiĝis duoble de fruaj ĝis malfruaj provoj (vidu Figuro 2a). Por plue montri lernadon, ni enkondukis inversigon, ŝanĝante la probablojn de rekompenco por la 33% kaj 100%-kondiĉoj ĉe la fino de la eksperimento. ANOVA 2 (probablo) X 2 (reverto kaj ne-inversigo) por malfruaj provoj montris signifan interagadon (F (1,11) = 18.97, p = 0.001), kun malpliigo de RT al la kondiĉo, kiu estis la 33%-probablo en la ne-inversa (mezumo = 583.74, sd = 270.24) kaj 100% en la revertado (meznombro = 519.89, sd = 180.46) (Figuro 2b).

figuro 2  

Kondutaj rezultoj (RT)

Rezultoj de bildoj

GLM por ĝentilaj provoj uzantaj rekompencan probablecon kiel la ĉefa prognozilo estis modeligita ĉe la punkto, ke la subjekto ricevis retrosciigon pri rekompenco aŭ ne (t.e. rezulto). Ĉi tiu analizo identigis la regionojn de la NAcc (x = 9, y = 6, z = −1 kaj x = −9, y = 9, z = −1) kaj OFC (x = 28, y = 39, z = - 6) (vidu Figuro 3a, b). Post-hoc t-testoj inter la beta-pezoj de la rekompencitaj kontraŭ ne rekompencitaj provoj montris pli grandan aktivigon en ambaŭ ĉi tiuj regionoj por rekompenci (NAcc: t (11) = 3.48, p <0.01; OFC x = 28, y = 39, z = −6, t (11) = 3.30, p <0.02)1.

figuro 3  

Pli granda aktivado al rekompencitaj kontraŭ nerekomenditaj rezultoj en la a) kerno akcensaj (x = 9, y = 6, z = −1; x = −9, y = 9, z = −1) kaj b) orbita frontala kortekso (x = 28, y = 39, z = −6).

Estis du eblaj rezultoj (rekompenco aŭ neniu rekompenco) por la du intermitaj rekompencaj horaroj (33% kaj 66% -verŝajneco) kaj nur unu rezulto por la kontinua rekompenca horaro (100% -rekompensa probablo), kiu estis uzata kiel kompara kondiĉo. Dum estis ĉefa efiko de rekompenco (rekompenco kontraŭ neniu rekompenco-provoj) en la OFC priskribita supre, OFC-agado ne variis kiel funkcio de rekompenca probablo en la nuna studo [F (2,10) = 0.84, p = 0.46) . Kontraŭe, la NAcc montris apartajn ŝanĝojn en agado al rezulto kiel funkcio de la rekompenca probabla manipulado [F (2,10) = 9.32, p <0.005]. Specife, NAcc-agado pliiĝis por rekompenci rezultojn, kiam la rekompenco estis neatendita (33% rekompenca probablo-kondiĉo) rilate al atendata (100% baza kondiĉo) [t (11) = 2.54, p <.03 vidu Figuro 4a]. Due, malpliigis NAcc-agadon ĝis neniu rekompenco, kiam rekompenco estis atendita kaj ne ricevita (66% rekompenca probablokondiĉo) rilate al rekompenco, kiu ne estis atendita aŭ ricevita (33% rekompenca probablokondiĉo; t (59) = 2.08, p <.04; vidu Figuro 4b). Notu ke ne estis signifaj diferencoj en la aktivado inter la 33% kaj 66% rekompencas probablajn kondiĉojn [t (11) =. 510, p = .62] aŭ inter la 66% kaj 100% rekompencitaj probablaj kondiĉoj [t (11) = 1.20, p = .26] en rekompencaj rezultoj. MR-signalo kiel funkcio de rekompenco-rezulto kaj probableco estas montritaj en figuro 4.

figuro 4  

Procentaj MR-signaloj ŝanĝiĝas kiel funkcio de rekompenca rezulto kaj probableco en la kerno alkalkulata al a) rekompencitaj kaj b) ne redenditaj rezultoj.

diskuto

Ĉi tiu studo ekzamenis la efikojn de malobservoj en atendataj rekompencaj rezultoj sur konduto kaj neŭra agado en la akciza kaj orbita frontala kortekso (OFC), montritaj antaŭe esti implikitaj en antaŭĝojo de rekompencaj rezultoj (McClure et al 2004; Knutson et al, 2005). Ni montris, ke ambaŭ la kerno accumbens kaj OFC estis varbitaj dum rekompencitaj provoj relative al nerekomenditaj provoj, sed nur la kerno accumbens montris sentemon al perfortoj en antaŭvidita rekompenca rezulto en ĉi tiu studo. Plej granda sentiveco de la akciuloj al rekompenca valoro (ekz. Grando) rilate al la OFC estis montrita en antaŭa laboro (Galvan et al 2005), kaj kune ĉi tiuj trovoj sugestas, ke ĉi tiu regiono eble implikas la kalkuladon de grando kaj probableco de rekompenco. La manko de sentiveco en la OFC al ĉi tiuj manipuladoj povas reflekti pli absolutan reprezenton de rekompenco aŭ ambigueco en rezulto (Hsu et al., 2005). Alternative, ĉar la MR-signalo estis pli ŝanĝiĝema en ĉi tiu regiono, ĉi tiuj efikoj eble estis malfortigitaj en la nuna studo.

En elektrofisiologiaj studoj ĉe bestoj, dopaminaj neŭronoj en la meza cerbo (kiuj projektas al la kerno akcentaj) estis montritaj havi malmultan aŭ neniun respondon al antaŭdiritaj rekompencaj rezultoj (probableco = 1.0), sed montras fazan pafon kiam rekompenco estas liverita per malpli ol 100 % probableco, eĉ post vasta trejnado (Fiorillo et al, 2003). En la nuna studo, ni montris pli grandajn akcizajn agadojn rekompenci kiam la rekompenco estis neatendita (33% -kondiĉo) rilate al kiam ĝi atendis (100% -kondiĉo) konforme al ĉi tiuj trovoj. Plue, elektrofisiologiaj studoj pri dopaminaj neŭronoj en bestoj (ekz. Fiorillo et al, 2003) montris, ke pro provoj, pri kiuj rekompenco estis antaŭdirita, sed ne okazis, neurona aktiveco malpliiĝis. La nuna studo montris similan padronon ĉe la akciuloj, kun malkresko en aktiveco en ĉi tiu regiono en la ne-rekompencitaj provoj por la 66% rekompenca probabla kondiĉo rilate al la 33% -kondiĉo.2

Dopamaj neŭronoj estis implicitaj en lernado de du manieroj. Unue, ili kodas kontingentojn inter stimuloj (aŭ respondo) kaj rezultoj per antaŭdiroj signaloj, kiuj detektas perfortojn laŭ atendoj (Schultz et al, 1997; Mirencowicz kaj Schultz, 1998; Fiorillo et al, 2003). Tiel la prognozila eraro ŝajnas liveri instruan signalon, kiu konformas al la lernadaj principoj komence priskribitaj de Rescorla kaj Wagner (1972). Due, ili servas por ŝanĝi kondutajn respondojn (Schultz et al, 1997; McClure et al, 2004) tia ke agoj estas torditaj al la plej prognozaj signoj. En la nuna studo ni montras, ke per malfruaj provoj de la eksperimento, la plej optimuma agado estas por la kondiĉo kun la plej alta probablo de rekompenco (100% rekompenca probablo) kaj la malpli bona por la plej malalta probablo-kondiĉo (33% rekompenca probablo). Ĉi tiu kondutisma trovo konformas al antaŭa probabla laboro montranta malplej optimuman agadon kun la plej malalta probablo de rekompenca rezulto, sugestante, ke rekompenco de rekompenco estis lernita tra la tempoDelgado et al, 2005). Por plue montri lernadon, ni enkondukis inversigon, ŝanĝante la probablojn de rekompenco por la 33% kaj 100%-kondiĉoj ĉe la fino de la eksperimento. Ĉi tiu manipulado rezultigis mildigon de la diferencoj inter ĉi tiuj kondiĉoj plue konfirmante lernajn efikojn.

Ĉefa celo de rekompenc-rilataj studoj estas determini kiel rekompenco influas kaj biasan konduton (ekz Robbins kaj Everitt, 1996; Schultz, 2004) aldone al karakterizado de la suba neurona prilaborado. Multnombraj faktoroj kontribuas al kiom rapide kaj fortike rekompencas influi konduton, inkluzive de horaroj de plifortigo (Skinner, NENIU), rekompenca valoro (Galvan et al, 2005), kaj rekompencas antaŭvideblecon (Fiorillo et al, 2003; Delgado et al, 2005). Atendita valoro, kiu estas la produkto de la grando kaj probablo de rekompenco (Pascal, ca 1600s), influas kondutajn elektojn (von Frisch, 1967; Montague et al, 1995; Montague kaj Berns, 2002). Uzante tre similan taskon, en kiu nur la rezulto (grando anstataŭ probableco) diferencis de la nuna studo, ni montris, ke la kerno accumbens estas sentema al diskretaj rekompencaj valoroj (Galvan et al, 2005). Prenita kune kun la provoj prezentitaj ĉi tie kaj aliloke (Tobler et al, 2005), ni sugestas, ke la ventra striatumo verŝajne kontribuas al la kalkulado de atendata rekompenca valoro donita sian sentivecon al rekompenca probablo kaj grando.

La rolo de la orbita frontala kortekso en rekompenca antaŭdiro konformas al funkciaj subdividoj de ĉi tiu regiono Kringelbach kaj Ruloj (2004). Ili sugestas, ke pli antaŭaj kaj mezaj porcioj de OFC estas sentemaj al abstraktaj rekompencaj manipuladoj. La OFC-aktivigo en ĉi tiu studo estis observita en ĉi tiu ĝenerala loko. Elektrofisiologiaj studoj implicas la OFC en kodado de subjektiva valoro de rekompenca stimulo (por revizio, O'Doherty, 2004). Ekzemple, OFC-neŭronoj ekbruliĝas al aparta gusto kiam besto malsatas, sed malpliigas sian pafon, kiam la besto estas satigita kaj la rekompenca valoro de la manĝaĵo malpliigis (Critchley and Rolls, 1996). Kiel tia, aliaj sugestis, ke la OFC estas plej sentema al relativaj rekompencoj (Tremblay kaj Schultz, 1999) kaj rekompencas preferon (Schultz et al, 2000). Neuroimagaj studoj montris analogan padronon ĉe homoj kun diversaj stimuloj, inkluzive guston (O'Doherty et al, 2001; Kringelbach et al, 2003), olfaktoAnderson et al, 2003; Rolls et al, 2003), kaj mono (Elliott et al, 2003; Galvan et al, 2005), kun ĉiu aktivigo varias en la loko de aktiveco de antaŭa al posta kaj de mezaj ĝis flankaj OFC. La OFC estis implicita en antaŭĝojo de rekompenco (O'Doherty et al 2002), sed nur en la mezuro, ke la prognoza valoro de la respondo estas ligita al la specifa valoro de la rilata rekompenco, anstataŭ en la probablo de tio, ke ĝi okazos rekompencon (O'Doherty, 2004 ). En la nuna studo, ni ne vidis sentemon al perfortoj en antaŭdiro de rekompenco en la OFC. Knutson kaj kolegoj (2005) raportis korelaciojn inter probablecaj taksoj kaj cerba aktivigo antaŭ atendo de rekompenco en la mezala antaŭfrontal-kortekso (Knutson et al 2005), sed ne specife en la orbita frontala kortekso. Kontraste, Ramnani et al (2004) ) raportis OFC-sentivecon al pozitiva prognoza eraro en mediana orbita frontala kortekso uzante pasivan spektantan taskon kaj Dreher et al. (2005) raportis OFC-erara prognozo en tasko, kiu manipulis kaj probablecon kaj grandon de prognozaj signoj, sed ĉi tiuj situacioj estis lernitaj antaŭ ol skanado. Estas do ankoraŭ tenable, ke OFC povas kalkuli antaŭviditajn rekompencojn, sed eble ĉi tiuj kalkuloj estas pli krudaj (t.e. sumigitaj super gamo da probabloj) aŭ pli malrapidaj formi relative al la precizaj kalkuloj, kiuj ŝajnas okazi en la NAcc. Alternative, ĉi tiu regiono eble estas pli sentema ĉe detektado de stimuloj de necerta kaj / aŭ ambigua valoro, kiel proponite de Hsu et al (2005), ol ĉe detekto de malobservoj en rekompenco-antaŭdiro. Hsu et al (2005) montras, ke la nivelo de ambigueco en elektoj (necertaj elektoj faritaj pro manka informo) rilatas pozitive kun aktivigo en la OFC. Fine, pli granda ŝanĝiĝemo en MR-signalo en ĉi tiu regiono eble malpliigis nian kapablon detekti ĉi tiujn efikojn ankaŭ.

La fundamenta demando de la nuna studo estis kiel la akciuloj kaj OFC malsame kodo antaŭdiris rekompencajn rezultojn rilate al neviditaj rezultoj (t.e. malobservoj en atendoj). Ni parametrize manipulis la probablon de rekompenco kaj ekzamenis la neŭraran respondon al rekompenco kaj nerekomendaj provoj por ĉiu probabla rekompenca kondiĉo. Niaj datumoj kongruas kun antaŭaj homaj bildigoj kaj nehomaj elektrofisiologiaj studoj (Fiorillo et al, 2003; Schultz, 2002) kaj sugestu, ke la akuzantoj kaj OFC estas sentemaj al rekompenca rezulto (rekompenco aŭ ne). Tamen, agado en ĉi tiuj regionoj, precipe la akciuloj, ŝajnas esti modulita per prognozoj pri la verŝajneco de rekompencaj rezultoj, kiuj formiĝas kun lernado kun la tempo. Ĉi tiu dinamika aktivado povus reprezenti modifojn en dopamina agado ene aŭ projekcii al ĉi tiuj regionoj, ĉar informoj pri antaŭvidita rekompenco estas lernitaj kaj ĝisdatigitaj.

Piednotoj

1La NAcc [t (11) = 3.2, p <0.04] kaj OFC [t (11) = 3.5, p <0.02] montris pliigitan agadon antaŭĝuante rekompencon por la intermita sed ne la kontinua rekompenco.

2Omisigo de rekompenco en la 33% -kondiĉo rezultigis etan kreskon de NAcc-agado prefere ol malpliigita, simila al tiu observita de Knutson et al., 2001. Unu ebla interpreto de ĉi tiu rezulto estas, ke subjektoj estis neintence motivitaj aŭ rekompencitaj, se ili antaŭvidis, ke neniu rekompenco venos por tiu proceso, kaj neniu faris. Alternative, ĉar rekompenco por ĉi tiuj provoj estis la plej malmultaj en la tuta eksperimento, la aktiveco eble reflektos daŭran lernadon por ĉi tiu kondiĉo.

Malgarantio de Eldonisto: Ĉi tio estas PDF-dosiero de unita manuskripto, kiu estis akceptita por publikigado. Kiel servo al niaj klientoj ni provizas ĉi tiun fruan version de la manuskripto. La manuskripto suferas kopion, kompostadon kaj revizion de la rezultanta pruvo antaŭ ol ĝi estas publikigita en ĝia fina maniero. Bonvolu noti, ke dum la procezo de produktado povas malkovri erarojn, kiuj povus influi la enhavon, kaj ĉiujn laŭleĝajn malvirtojn, kiuj aplikeblas al la ĵurnalo.

Referencoj

  • Anderson A, Christoff K, Stappen I, Panitz D, Ghahremani D, Glover G, Gabrieli JD, Sobel N. Disaj neŭralaj reprezentadoj de intenseco kaj valenco en homa olfakto. Naturo-Neurokienco. 2003;6: 196-202.
  • Berns GS, McClure SM, Pagnoni G, Montague PR. Antaŭvidebleco modulas homan cerban respondon al rekompenco. Ĵurnalo de Neŭrikeco. 2001;21: 2793-2798. [PubMed]
  • Boynton GM, Engel SA, Glover GH, Heeger DJ. Lineara sistemanalizo de funkcia magneta resonanca bildigo en homa V1. Ĵurnalo de Neŭrikeco. 1996;16: 4207-4221. [PubMed]
  • Cox RW. AFNI: Programaro por analizo kaj bildigo de neŭroimaj funkciaj magnetaj resonancoj. Komputadoj en Biomedika Esploro 1996;29: 162-173.
  • Cox SM, Andrade A, Johnsrude IS. Lerni ŝati: Rolo por homa orbitofronta kortekso en kondiĉita rekompenco. Ĵurnalo de Neŭrikeco. 2005;25: 2733-2740. [PubMed]
  • Craig AD, Chen K, Bandy D, Reiman EM. Termosensoria aktivigo de insula kortekso. Naturo-Neurokienco. 2000;3: 184-190.
  • Critchley HD, Rolls ET. Malsato kaj saĝeco modifas la respondojn de olfaktaj kaj vidaj neŭronoj en la primata orbitofrontala kortekso. Journal of Neurophysiology. 1996;75: 1673-1686. [PubMed]
  • De Araujo IET, Kringelbach ML, Rolls ET, McGlone F. Homaj kortikaj respondoj al akvo en la buŝo, kaj la efikoj de soifo. Journal of Neurophysiology. 2003;90: 1865-1876. [PubMed]
  • Delgado MR, Miller M, Inati S, Phelps EA. FMRI-studo de rekompenco-rilata probabla lernado. Neuroimage. 2005;24: 862-873. [PubMed]
  • Dreher JC, Kohn P, Berman KF. Neŭra kodado de apartaj statistikaj ecoj de rekompencaj informoj en homoj. Cerba Kortiko. 2005 Epub antaŭ presaĵo.
  • Elliott R, Newman JL, Longe OA, Deakin JFW. Malsamaj respondaj ŝablonoj en la striatum kaj orbitofrontala kortekso al financa rekompenco en homoj: parametrika funkcia magneta resona studo. Ĵurnalo de Neŭrikeco. 2003;23: 303-307. [PubMed]
  • Fiorillo CD, Tobler PN, Schultz W. Diskreta kodado de rekompenca probableco kaj necerteco de dopaminaj neŭronoj. Scienco. 2003;299: 1898-1902. [PubMed]
  • Galvan A, Leporo TA, Davidson M, Spicer J, Glover G, Casey BJ. La rolo de ventra frontostriatala cirkulado en rekompenc-lernado en homoj. La Ĵurnalo de Neŭrikeco. 2005;25: 8650-8656. [PubMed]
  • Galvan A, Hare TA, Parra C, Penn J, Voss H, Glover G, Casey BJ. Pli frua evoluo de la akciuloj rilate la orbitofrontan kortekson povas subesti riskajn kondutojn en adoleskantoj. La Ĵurnalo de Neŭrikeco. 2006;26: 6885-6892. [PubMed]
  • Gottfried JA, O'Doherty J, Dolan RJ. Kodigante prognozan rekompencan valoron en homa amigdala kaj orbitofrontala kortekso. Scienco. 2003;301: 1104-1107. [PubMed]
  • Haber SN. Primataj bazaj ganglioj: paralelaj kaj integraj retoj. Revuo por Kemia Neŭroanatomio. 2003;26: 317-330. [PubMed]
  • Neŭronoj Hollerman J, Schultz W. Dopamine raportas eraron pri la tempa prognozo de rekompenco dum lernado. Naturo-Neurokienco. 1998;1: 304-309.
  • Hsu M, Bhatt M, Adolphs R, Tranel D, Camerer CF. Neŭralaj sistemoj respondantaj al gradoj de necerteco en homa decido. Scienco. 2005;310: 1680-1683. [PubMed]
  • Knutson B, Adams CM, Fong GW, Hommer D. Anticipado pri kreskanta mona rekompenco selekte rekrutas kernon accumbens. Ĵurnalo de Neŭrikeco. 2001;21: 1-5.
  • Knutson B, Taylor J, Kaufman M, Peterson R, Glover G. Distruta neŭra reprezentado de atendita valoro. La Ĵurnalo de Neŭrikeco. 2005;25: 4806-4812. [PubMed]
  • Kringelbach ML, O'Doherty J, Rolls ET, Andrews C. Aktivigo de la homa orbitofronta korto al likva manĝa stimulo rilatas kun sia subjektiva agrableco. Cerba Kortiko. 2003;13: 1064-1071. [PubMed]
  • Kringelbach ML, Rolls ET. La funkcia neuroanatomio de la homa orbitofrontala kortekso: evidenteco de neŭrotramo kaj neŭropsikologio. Progreso en Neurobiologio. 2004;72: 341-372. [PubMed]
  • Leon MI, Shadlen MN. Efiko de atendata rekompenca grando sur la respondo de neŭronoj en la dorsolateral prefrontal-kortekso de la makako. Neŭrono. 1999;24: 415-425. [PubMed]
  • McClure SM, Berns GS, Montague PR. Tempaj prognozaj eraroj en pasiva lernada tasko aktivigas homan striatumon. Neŭrono. 2003;38: 339-346. [PubMed]
  • McClure SM, Laibson DI, Loewenstein G, JD Cohen. Apartaj nervaj sistemoj valorigas tujan kaj prokrastitan monan rekompencon. Scienco. 2004;306: 503-507. [PubMed]
  • Mirenowicz J, Schultz W. Graveco de neantaŭvidebleco por rekompencaj respondoj en primataj dopaminaj neŭronoj. Journal of Neurophysiology. 1994;72: 1024-1027. [PubMed]
  • Montague PR, Berns GS. Neŭra ekonomio kaj la biologiaj substratoj de taksado. Neŭrono. 2002;36: 265-284. [PubMed]
  • Montague PR, Hyman SE, Cohen JD. Komputadaj roloj por dopamino en kondutisma kontrolo. Naturo. 2004;431: 379-387.
  • O'Doherty JP. Rekompencaj reprezentoj kaj rekompencaj lernoj en la homa cerbo: komprenoj de neŭbildigo. Nuna Opinio en Neurobiologio. 2004;14: 769-776. [PubMed]
  • O'Doherty JP, Dayan P, Friston K, Critchley H, Dolan RJ. Modeloj pri tempaj diferencoj kaj rekompenca lernado en la homa cerbo. Neŭrono. 2003;38: 329-337. [PubMed]
  • O'Doherty JP, Deichmann R, Critchley HD, Dolan RJ. Neŭralaj respondoj dum antaŭĝojo de primara gusto-rekompenco. Neŭrono. 2002;33: 815-826. [PubMed]
  • O'Doherty J, Kringelbach M, Rolls ET, Hornak J, Andrews C. Abstraktaj kompensaj kaj punaj reprezentoj en la homa orbitofronta korto. Naturo-Neurokienco. 2001;4: 95-102.
  • O'Doherty J, Rolls ET, Francis S, Bowtell R, McGlone F, Kobal G, Renner B, Ahne G. Sensor-specifa sateco-rilata flara aktivigo de la homa orbitofronta korto. Neuroreporto. 2000;11: 893-897. [PubMed]
  • Olds J, Milner P. Pozitiva plifortigo produktita de elektra stimulado de septala areo kaj aliaj regionoj de rato-cerbo. Journal of Comparative Physiology and Journal. 1954;47: 419-427.
  • Ramnani N, Elliott R, Athwal B, Passingham R. Antaŭdiro-eraro por senpaga mona rekompenco en la homa antaŭfronta kortekso. NeuroImage. 2004;23: 777-786. [PubMed]
  • Rescorla R, Wagner A. En: Klasika Kondiĉado 2: Nuna Esploro kaj Teorio. Black A, Prokasy W, redaktistoj. Century-Crofts de Appleton; Nov-Jorko: 1972. pp 64 – 69.
  • Robbins TW, Everitt BJ. Neŭrotakvaj mekanismoj de rekompenco kaj instigo. Aktualaj Opinioj en Neurobiologio. 1996;6: 228-235.
  • Rolls E, Kringelbach M, DeAraujo I. Malsamaj reprezentoj de agrablaj kaj malagrablaj odoroj en la homa cerbo. Eŭropa Ĵurnalo de Neŭrikeco. 2003;18: 695-703. [PubMed]
  • Schultz W, Dayan P, Montague PR. Neŭra substrato de antaŭdiro kaj rekompenco. Scienco. 1997;275: 1593-1599. [PubMed]
  • Schultz W, Tremblay L, Hollerman JR. Rekompila procesorado en primato orbitofrontal korto kaj bazaj ganglioj. Kortekso Cereb 2000;10: 272-284. [PubMed]
  • Schultz W. Formuliĝi kun dopamino kaj rekompenco. Neŭrono. 2002;36: 241-263. [PubMed]
  • Schultz W. Neŭtrala kodado de bazaj rekompencaj terminoj de besta lernada teorio, ludoteorio, mikroekonomio kaj kondutisma ekologio. Nuna Opinio en Neurobiologio. 2004;14: 139-147. [PubMed]
  • Skinner BF. Diagramado de horaroj de plifortigo. Revuo por Eksperimenta Analizo de Konduto. 1958;1: 103-107.
  • Sutton RS, Barto AG. Plifortiga Lernado: Enkonduko. MIT Gazetaro; Kembriĝo, MA: 1998.
  • Schultz W, Tremblay L, Hollerman J. Rekompenca prilaborado en primata orbitofrontala kortekso kaj basaj ganglioj. Cerba Kortiko. 2000;10: 272-284. [PubMed]
  • Talairach J, Tournoux P. Kunplaneta stereotaksa atlaso de la homa cerbo. Thieme; Nov-Jorko: 1988.
  • Tobler PN, Fiorillo KD, Schultz W. Adapta kodado de rekompenca valoro de dopaminaj neŭronoj. Scienco. 2005;307: 1642-1645. [PubMed]
  • Tremblay L, Schultz W. Relativa rekompenco-prefero en primato orbitofrontala kortekso. Naturo. 1999;398: 704-708. [PubMed]
  • von Frisch K. La Danca Lingvo kaj Orientado de Abeloj. Harvard University Press; Kembriĝo, Masaĉuseco: 1967.